Series:
Series是一种一维标记数组,它可以存储任意数据类型(整数、浮点数、字符串等)。在Pandas中,Series通常用于表示单个列或行。
创建Series:
可以通过传递一个列表来创建一个Series。Pandas将自动创建一个默认整数索引。
import pandas as pd
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)
输出:
0 1
1 2
2 3
3 4
4 5
dtype: int64
这里我们创建了一个包含5个整数的Series,并打印了结果。由于没有指定索引,Pandas默认使用从0开始的整数作为索引。
如果需要指定索引,可以通过传递另一个数组或标签列表来实现。
import pandas as pd
data = [1, 2, 3, 4, 5]
index = ['a', 'b', 'c', 'd', 'e']
s = pd.Series(data, index=index)
print(s)
输出:
a 1
b 2
c 3
d 4
e 5
dtype: int64
在这里,我们为每个数据点指定了一个标签索引。
DataFrame:
DataFrame是Pandas中最常用的数据结构之一,它是一个二维表格,可以存储不同类型的数据(整数、浮点数、字符串等)。每个DataFrame都有一个行索引和一个列索引。
创建DataFrame:
可以通过传递一个字典来创建一个DataFrame。字典中的键将成为DataFrame的列名,而值将成为DataFrame的数据。如果某些行缺少值,则Pandas会自动填充NaN值。
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'country': ['USA', 'Canada', 'UK', 'USA']}
df = pd.DataFrame(data)
print(df)
输出:
name age country
0 Alice 25 USA
1 Bob 32 Canada
2 Charlie 18 UK
3 David 47 USA
在这里,我们创建了一个包含姓名、年龄和国家的DataFrame,并将其打印出来。
如果需要指定行索引,可以使用index参数。
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'country': ['USA', 'Canada', 'UK', 'USA']}
index = ['a', 'b', 'c', 'd']
df = pd.DataFrame(data, index=index)
print(df)
输出:
name age country
a Alice 25 USA
b Bob 32 Canada
c Charlie 18 UK
d David 47 USA
在这里,我们使用index参数将行索引设置为了a、b、c、d。
评论 (0)