Pandas的pivot函数是一个非常强大的函数,它可以将数据进行转换,从而实现对数据的重新排列和处理。
import pandas as pd # 创建一个DataFrame df = pd.DataFrame({'A': ['one', 'one', 'two', 'three'] * 3, 'B': ['A', 'B', 'C'] * 4, 'C': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'] * 2, 'D': np.random.randn(12), 'E': np.random.randn(12)}) # 使用pivot函数将数据转换 pd.pivot_table(df, values='D', index=['A', 'B'], columns=['C'])
上面的代码创建了一个DataFrame,使用pivot函数将其转换为一个新的DataFrame,其中index参数表示将A和B列作为行索引,columns参数表示将C列作为列索引,values参数表示将D列作为值,得到的结果如下:
C bar foo A B one A 0.234443 0.451725 B -1.290031 -0.739126 C 0.098604 0.817372 three A 0.743607 0.939377 B 0.552411 -0.444319 C 0.431697 -0.966892 two A -0.723791 -0.232090 B 0.824072 0.637666 C -1.569077 -0.847367
pivot函数还可以接受多个参数,比如aggfunc参数可以指定聚合函数,fill_value参数可以指定缺失值的填充值,margins参数可以指定是否计算汇总值,dropna参数可以指定是否删除缺失值,等等。
pivot函数是一个非常强大的函数,可以帮助我们快速的将数据进行转换,从而实现对数据的重新排列和处理。
本文链接:http://task.lmcjl.com/news/2668.html