关键词

详解pandas.DataFrame()(创建二维表格)函数使用方法

pandas.DataFrame() 是 pandas 库中一个十分重要的函数,它用于创建数据帧对象,可以方便地对多维数组或其他数据结构中的数据进行索引、计算、筛选、合并等操作。本文将为大家详细讲解 pandas.DataFrame() 的作用与使用方法。

作用

pandas.DataFrame() 可以将数据对象转变为数据帧对象。DataFrame 是二维标记的结构,可以有不同类型的列,如 pandas.Series 对象。

在数据分析工作中,使用 DataFrame 可以方便地进行许多需要用到表格数据的操作,如数据的统计分析、数据的清洗和处理、大数据的展示等。

使用方法

pandas.DataFrame() 的语法如下:

DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

下面我们分别介绍它的参数:

  1. data:数据结构,可以是 ndarray、Series、map、lists、dict、constant 和另一个 DataFrame。

  2. index:行标签,可以是列表或数据帧,如果未指定则默认从 0 开始的序列。

  3. columns:列标签,可以是列表或数据帧,如果未指定则默认从 0 开始的序列。

  4. dtype:数据类型,可以是字符串、np.dtype 或 pandas 自定义数据类型。

  5. copy:是否复制数据,默认为 False。

我们通过一个实例来了解如何使用 pandas.DataFrame():

import pandas as pd

data = {'name':['Tom', 'Jerry', 'Kate'], 
        'age':[21, 23, 22], 
        'score':[90, 87, 92]}

df = pd.DataFrame(data)
print(df)

输出结果为:

    name  age  score
0    Tom   21     90
1  Jerry   23     87
2   Kate   22     92

我们可以看到,我们使用字典类型的数据将接收到 pandas.DataFrame() 函数中,返回的结果是一个具有两行三列的数据帧对象,它的每一列都是一个 pandas.Series 对象。在这个数据帧中,name、age 和 score 是列标签,0、1、2 是行标签。

除了使用字典类型的数据来创建数据帧之外,我们还可以使用 Numpy 数组类型的数据来创建数据帧,实例如下:

import pandas as pd
import numpy as np

data = np.array([[1,2,3],[4,5,6],[7,8,9]])
df = pd.DataFrame(data, columns=['A','B','C'])
print(df)

输出结果为:

   A  B  C
0  1  2  3
1  4  5  6
2  7  8  9

我们可以看到,我们使用的是一个二维的 numpy 数组作为数据结构,返回的结果是一个具有三行三列的数据帧对象。在这个数据帧中,A、B 和 C 是列标签,0、1、2 是行标签。

总结

在本文中,我们详细讲解了 pandas.DataFrame() 的作用与使用方法。DataFrame 函数是 pandas 库中比较重要的函数之一,它能够创建数据帧对象,可方便进行标签索引、计算和筛选等操作。我们通过两个实例,演示了如何使用字典类型数据和 Numpy 数组来创建数据帧,并成功的输出了结果。

本文链接:http://task.lmcjl.com/news/17672.html

展开阅读全文