使用Pandas库的read_table()
方法,可以方便地读取CSV文件。该方法支持多种参数和选项以满足不同的数据读取需要。
以下是使用read_table()
方法读取CSV文件的详细攻略步骤:
如果你已经安装了Anaconda等Python开发环境,可以跳过该步骤。否则,在命令行中执行以下命令来安装Pandas库:
pip install pandas
在Python代码中导入Pandas库:
import pandas as pd
使用read_table()
方法读取CSV文件:
df = pd.read_table('filename.csv', delimiter=',')
其中,filename.csv
是待读取的CSV文件名,delimiter=','
表示CSV文件中列与列之间的分隔符是逗号。如果CSV文件的分隔符是其他字符,也可以相应地修改delimiter
参数的值。
当数据读取完成后,可以使用DataFrame
对象的方法打印数据或者进行后续的数据分析。例如:
print(df.head()) # 输出数据的前5行
当然,还可以根据需要使用各种DataFrame
对象的方法进行数据操作,例如:
df.describe() # 统计数据的基本信息
df.info() # 显示数据的摘要信息
df.groupby('column_name').mean() # 对数据进行分组并求每组的均值
考虑一个名为sales.csv
的文件,它包含了一间商店在每天里面售出的不同商品的数量情况。考虑把它读取到数据框中:
import pandas as pd
df = pd.read_table('sales.csv', delimiter=',')
print('数据框中有 %d 行和 %d 列' % (df.shape[0], df.shape[1]))
考虑一个名为grades.csv
的文件,它包含了一位老师给出的学生们的考试成绩。考虑把它读取到数据框中并计算出这些成绩的平均值:
import pandas as pd
df = pd.read_table('grades.csv', delimiter='|')
mean_grade = df['grade'].mean()
print('这些学生们的平均考试成绩是 %.2f 分' % mean_grade) # 保留两位小数输出
注意,这里使用了delimiter
参数指明CSV文件中各列间的分隔符为竖杠(|)符号。
本文链接:http://task.lmcjl.com/news/17451.html