pandas.DataFrame() 是 pandas 库中一个十分重要的函数,它用于创建数据帧对象,可以方便地对多维数组或其他数据结构中的数据进行索引、计算、筛选、合并等操作。本文将为大家详细讲解 pandas.DataFrame() 的作用与使用方法。
pandas.DataFrame() 可以将数据对象转变为数据帧对象。DataFrame 是二维标记的结构,可以有不同类型的列,如 pandas.Series 对象。
在数据分析工作中,使用 DataFrame 可以方便地进行许多需要用到表格数据的操作,如数据的统计分析、数据的清洗和处理、大数据的展示等。
pandas.DataFrame() 的语法如下:
DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
下面我们分别介绍它的参数:
data:数据结构,可以是 ndarray、Series、map、lists、dict、constant 和另一个 DataFrame。
index:行标签,可以是列表或数据帧,如果未指定则默认从 0 开始的序列。
columns:列标签,可以是列表或数据帧,如果未指定则默认从 0 开始的序列。
dtype:数据类型,可以是字符串、np.dtype 或 pandas 自定义数据类型。
copy:是否复制数据,默认为 False。
我们通过一个实例来了解如何使用 pandas.DataFrame():
import pandas as pd
data = {'name':['Tom', 'Jerry', 'Kate'],
'age':[21, 23, 22],
'score':[90, 87, 92]}
df = pd.DataFrame(data)
print(df)
输出结果为:
name age score
0 Tom 21 90
1 Jerry 23 87
2 Kate 22 92
我们可以看到,我们使用字典类型的数据将接收到 pandas.DataFrame() 函数中,返回的结果是一个具有两行三列的数据帧对象,它的每一列都是一个 pandas.Series 对象。在这个数据帧中,name、age 和 score 是列标签,0、1、2 是行标签。
除了使用字典类型的数据来创建数据帧之外,我们还可以使用 Numpy 数组类型的数据来创建数据帧,实例如下:
import pandas as pd
import numpy as np
data = np.array([[1,2,3],[4,5,6],[7,8,9]])
df = pd.DataFrame(data, columns=['A','B','C'])
print(df)
输出结果为:
A B C
0 1 2 3
1 4 5 6
2 7 8 9
我们可以看到,我们使用的是一个二维的 numpy 数组作为数据结构,返回的结果是一个具有三行三列的数据帧对象。在这个数据帧中,A、B 和 C 是列标签,0、1、2 是行标签。
在本文中,我们详细讲解了 pandas.DataFrame() 的作用与使用方法。DataFrame 函数是 pandas 库中比较重要的函数之一,它能够创建数据帧对象,可方便进行标签索引、计算和筛选等操作。我们通过两个实例,演示了如何使用字典类型数据和 Numpy 数组来创建数据帧,并成功的输出了结果。
本文链接:http://task.lmcjl.com/news/17672.html