当我们使用 Python 进行数据分析时,经常需要使用 pandas 库来处理数据。其中最常用的数据结构是 DataFrame(数据帧),我们可以使用多种方式创建 DataFrame。
1. 直接创建
我们可以使用二维数组或字典来创建 DataFrame,如下所示:
import pandas as pd
# 创建二维数组
data = [[1,2,3],[4,5,6],[7,8,9]]
# 创建 DataFrame
df = pd.DataFrame(data, columns=['a','b','c'])
print(df)
输出结果为:
a b c
0 1 2 3
1 4 5 6
2 7 8 9
# 创建字典
data = {'name':['Alice','Bob','Charlie'],'age':[10,20,30],'gender':['F','M','M']}
# 创建 DataFrame
df = pd.DataFrame(data)
print(df)
输出结果为:
name age gender
0 Alice 10 F
1 Bob 20 M
2 Charlie 30 M
2. 从CSV文件中创建
我们可以使用 pandas 库中的 read_csv() 函数来从CSV文件中创建 DataFrame,如下所示:
import pandas as pd
# 从CSV文件中读取数据
df = pd.read_csv('data.csv')
print(df)
其中,data.csv 是一个包含数据的CSV文件,其内容类似于下面这样:
name,age,gender
Alice,10,F
Bob,20,M
Charlie,30,M
输出结果为:
name age gender
0 Alice 10 F
1 Bob 20 M
2 Charlie 30 M
这就是创建 pandas DataFrame 的两种方式,希望对你有所帮助。