关键词

Python常见的pandas用法demo示例

下面是Python常见的pandas用法demo示例的攻略:

pandas的基本操作

导入pandas库

import pandas as pd

读取数据

df = pd.read_csv('data.csv')

观察数据

df.head() # 查看前五行
df.tail() # 查看后五行
df.shape # 查看行列数

数据清洗

df = df.dropna() # 删除有空值的行
df = df.drop_duplicates() # 删除重复行
df['date'] = pd.to_datetime(df['date']) # 把日期列转换为日期格式
df['age'] = df['age'].astype(int) # 把年龄列转换为整数型
df['income'] = df['income'].str.replace(',', '').astype(float) # 把收入列转换为浮点型

数据分析

df.describe() # 查看数据的基本统计信息
df.groupby('gender').mean() # 按性别分组,并计算平均值
df.corr() # 计算各列的相关系数矩阵

示例一——读取Excel文件

读取Excel文件

df = pd.read_excel('data.xlsx')

数据清洗

df = df.dropna() # 删除有空值的行
df = df.drop_duplicates() # 删除重复行
df['date'] = pd.to_datetime(df['date']) # 把日期列转换为日期格式
df['age'] = df['age'].astype(int) # 把年龄列转换为整数型
df['income'] = df['income'].str.replace(',', '').astype(float) # 把收入列转换为浮点型

数据分析

df.describe() # 查看数据的基本统计信息
df.groupby('gender').mean() # 按性别分组,并计算平均值
df.corr() # 计算各列的相关系数矩阵

示例二——数据可视化

导入Matplotlib库

import matplotlib.pyplot as plt

绘制柱状图

df.groupby('gender')['income'].mean().plot(kind='bar')
plt.title('Average Income by Gender')
plt.xlabel('Gender')
plt.ylabel('Income')

绘制折线图

df.groupby('date')['income'].sum().plot(kind='line')
plt.title('Total Income by Date')
plt.xlabel('Date')
plt.ylabel('Total Income')

希望这些示例能够帮助你更好地理解和运用pandas库。

本文链接:http://task.lmcjl.com/news/16876.html

展开阅读全文