下面是Python常见的pandas用法demo示例的攻略:
import pandas as pd
df = pd.read_csv('data.csv')
df.head() # 查看前五行
df.tail() # 查看后五行
df.shape # 查看行列数
df = df.dropna() # 删除有空值的行
df = df.drop_duplicates() # 删除重复行
df['date'] = pd.to_datetime(df['date']) # 把日期列转换为日期格式
df['age'] = df['age'].astype(int) # 把年龄列转换为整数型
df['income'] = df['income'].str.replace(',', '').astype(float) # 把收入列转换为浮点型
df.describe() # 查看数据的基本统计信息
df.groupby('gender').mean() # 按性别分组,并计算平均值
df.corr() # 计算各列的相关系数矩阵
df = pd.read_excel('data.xlsx')
df = df.dropna() # 删除有空值的行
df = df.drop_duplicates() # 删除重复行
df['date'] = pd.to_datetime(df['date']) # 把日期列转换为日期格式
df['age'] = df['age'].astype(int) # 把年龄列转换为整数型
df['income'] = df['income'].str.replace(',', '').astype(float) # 把收入列转换为浮点型
df.describe() # 查看数据的基本统计信息
df.groupby('gender').mean() # 按性别分组,并计算平均值
df.corr() # 计算各列的相关系数矩阵
import matplotlib.pyplot as plt
df.groupby('gender')['income'].mean().plot(kind='bar')
plt.title('Average Income by Gender')
plt.xlabel('Gender')
plt.ylabel('Income')
df.groupby('date')['income'].sum().plot(kind='line')
plt.title('Total Income by Date')
plt.xlabel('Date')
plt.ylabel('Total Income')
希望这些示例能够帮助你更好地理解和运用pandas库。
本文链接:http://task.lmcjl.com/news/16876.html