Series和DataFrame
Series和DataFrame
叁零零肆零肆

Series和DataFrame

admin
2023-04-24 / 0 评论 / 20 阅读 / 正在检测是否收录...

Series:

Series是一种一维标记数组,它可以存储任意数据类型(整数、浮点数、字符串等)。在Pandas中,Series通常用于表示单个列或行。

创建Series:

可以通过传递一个列表来创建一个Series。Pandas将自动创建一个默认整数索引。

import pandas as pd

data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)
输出:

0    1
1    2
2    3
3    4
4    5
dtype: int64

这里我们创建了一个包含5个整数的Series,并打印了结果。由于没有指定索引,Pandas默认使用从0开始的整数作为索引。

如果需要指定索引,可以通过传递另一个数组或标签列表来实现。

import pandas as pd

data = [1, 2, 3, 4, 5]
index = ['a', 'b', 'c', 'd', 'e']
s = pd.Series(data, index=index)
print(s)
输出:

a    1
b    2
c    3
d    4
e    5
dtype: int64

在这里,我们为每个数据点指定了一个标签索引。

DataFrame:

DataFrame是Pandas中最常用的数据结构之一,它是一个二维表格,可以存储不同类型的数据(整数、浮点数、字符串等)。每个DataFrame都有一个行索引和一个列索引。

创建DataFrame:

可以通过传递一个字典来创建一个DataFrame。字典中的键将成为DataFrame的列名,而值将成为DataFrame的数据。如果某些行缺少值,则Pandas会自动填充NaN值。

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
       'age': [25, 32, 18, 47],
       'country': ['USA', 'Canada', 'UK', 'USA']}
df = pd.DataFrame(data)
print(df)
输出:

       name  age country
0     Alice   25     USA
1       Bob   32  Canada
2   Charlie   18      UK
3     David   47     USA

在这里,我们创建了一个包含姓名、年龄和国家的DataFrame,并将其打印出来。

如果需要指定行索引,可以使用index参数。

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
       'age': [25, 32, 18, 47],
       'country': ['USA', 'Canada', 'UK', 'USA']}
index = ['a', 'b', 'c', 'd']
df = pd.DataFrame(data, index=index)
print(df)
输出:

      name  age country
a    Alice   25     USA
b      Bob   32  Canada
c  Charlie   18      UK
d    David   47     USA

在这里,我们使用index参数将行索引设置为了a、b、c、d。

0

评论 (0)

取消