Pandas Series对象是一维标签数组,主要用于存储不同数据类型的数据。
下面我们介绍 Series 的常用属性和方法。在下表列出了 Series 对象的常用属性。
名称 | 属性 |
---|---|
index | 返回一个Index对象,代表Series的索引。 |
values | 返回一个numpy数组,代表Series的值。 |
dtype | 返回Series中的数据类型。 |
name | 返回Series的名称。 |
size | 返回Series中的元素个数。 |
现在我们创建一个 Series 对象,并演示如何使用上述表格中的属性。代码如下所示:
import pandas as pd
# 创建Series
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
# Series属性
print("shape:", s.shape)
print("size:", s.size)
print("index:", s.index)
print("values:", s.values)
print("dtype:", s.dtype)
输出结果为:
shape: (5,)
size: 5
index: Index(['a', 'b', 'c', 'd', 'e'], dtype='object')
values: [1 2 3 4 5]
dtype: int64
Series常用方法有以下:
名称 | 方法 |
---|---|
head(n) | 返回Series的前n个元素,默认为前5个 |
tail(n) | 返回Series的后n个元素,默认为后5个 |
describe() | 返回Series的基本统计信息,包括元素数量、均值、标准差、最小值、25%分位数、50%分位数、75%分位数和最大值 |
sort_values() | 对Series按值进行排序 |
sort_index() | 对Series按索引进行排序 |
unique() | 返回Series中的唯一值 |
value_counts() | 返回Series中每个元素出现的次数 |
apply(func) | 对Series的每个元素应用函数func |
map(mapping) | 对Series的每个元素应用字典mapping,将元素映射为另一个值 |
replace(to_replace, value) | 将Series中的值to_replace替换为value |
下面是一些示例代码:
import pandas as pd
# 创建Series
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
# 方法
print("head:\n", s.head(2))
print("tail:\n", s.tail(2))
print("describe:\n", s.describe())
print("sort_values:\n", s.sort_values())
print("sort_index:\n", s.sort_index())
print("unique:\n", s.unique())
print("value_counts:\n", s.value_counts())
print("apply:\n", s.apply(lambda x: x**2))
print("map:\n", s.map({1: 'one', 2: 'two', 3: 'three', 4: 'four', 5: 'five'}))
print("replace:\n", s.replace(2, 20))
输出结果为:
head:
a 1
b 2
dtype: int64
tail:
d 4
e 5
dtype: int64
describe:
count 5.000000
mean 3.000000
std 1.581139
min 1.000000
25% 2.000000
50% 3.000000
75% 4.000000
max 5.000000
dtype: float64
sort_values:
1 1
2 2
3 3
4 4
5 5
dtype: int64
sort_index:
a 1
b 2
c
本文链接:http://task.lmcjl.com/news/4482.html