关键词

Python Pandas数据结构简单介绍

Python Pandas数据结构简单介绍

Pandas简介

Pandas是一个数据处理的工具,在数据分析领域非常常用,它提供了很多功能来处理和操作数据。使用Pandas,我们可以轻松地处理各种格式的数据集,例如: CSV、Excel、SQL或者JSON等,并对数据进行转换、排序、切片、重塑、合并等操作。

Pandas数据结构

Pandas提供了两种核心数据结构:Series和DataFrame。

Series

Series是一种类似于一维数组的对象,它由两个数组构成:索引和数值。其中,索引是Pandas自动生成的,当然也可以自行指定。例如:

import pandas as pd

# create a Series
s = pd.Series([1, 3, 5, np.nan, 6, 8])

print(s)

# output
# 0    1.0
# 1    3.0
# 2    5.0
# 3    NaN
# 4    6.0
# 5    8.0
# dtype: float64

DataFrame

DataFrame则是一种类似于二维数组或SQL中的表格的数据结构。它们的每一列可以是不同的数据类型(例如数字、字符串、布尔等等),可以非常灵活地进行操作。例如:

import numpy as np
import pandas as pd

# create a DataFrame
data = {'name': ['A', 'B', 'C', 'D'],
        'age': [20, 21, 22, 23],
        'gender': ['M', 'F', 'F', 'M']}

df = pd.DataFrame(data)

print(df)

# output
#   name  age gender
# 0    A   20      M
# 1    B   21      F
# 2    C   22      F
# 3    D   23      M

Pandas常用操作

读取和写入数据

Pandas可以非常容易地读取和写入各种格式的数据,例如CSV、Excel、SQL等。例如:

import pandas as pd

# read data from a CSV file
df = pd.read_csv('data.csv')

# write data to a CSV file
df.to_csv('data.csv', index=False)

数据清洗和准备

数据清洗和准备是数据分析中很重要的一步。Pandas提供了很多功能来帮助我们清洗和准备数据,例如:删除重复数据、缺失值处理、修改数据类型等。例如:

import pandas as pd

# drop duplicates
df.drop_duplicates(inplace=True)

# fill missing values with mean
df.fillna(df.mean(), inplace=True)

# change data type
df['age'] = df['age'].astype(int)

示例说明

示例一

可以使用Pandas读取CSV文件,并对数据进行分析和计算。例如:

import pandas as pd

# read data from a CSV file
df = pd.read_csv('data.csv')

# calculate the mean age
mean_age = df['age'].mean()

print('mean age:', mean_age)

示例二

可以将Pandas的DataFrame转换成NumPy数组,以便进行统计学分析和建模。例如:

import pandas as pd
import numpy as np

# create a DataFrame
data = {'x1': [1, 2, 3, 4, 5],
        'x2': [2, 4, 6, 8, 10],
        'y': [3, 6, 9, 12, 15]}

df = pd.DataFrame(data)

# convert DataFrame to NumPy array
X = df[['x1', 'x2']].values
y = df['y'].values

print('X:', X)
print('y:', y)

以上是对Pandas数据结构的简单介绍和常见操作的分享。希望您能从中获得一些有用的信息。

本文链接:http://task.lmcjl.com/news/14434.html

展开阅读全文