详解pandas.str.split()（字符串分割）函数使用方法

关键词

详解pandas.str.split()（字符串分割）函数使用方法

pandas.str.split()是pandas库中的一个字符串处理工具，其作用是将字符串按照指定的分隔符进行分割，并返回一个Series对象或DataFrame对象。

使用方法如下：

DataFrame/Series.str.split(
    pat=None, # 分隔符，默认为None，表示按照所有空字符（包括空格、制表符、换行符等）分割
    n=-1, # 分割次数，默认为-1，表示分割全部。如果为正整数，则只分割前n个
    expand=False, # 是否将分割后的结果转化为DataFrame，默认为False，返回Series，如果为True，则返回DataFrame
)

其中，参数pat指定分隔符，可以是任意字符串。参数n指定分割次数，-1表示全部分割，不限次数，正整数表示只分割前n个。参数expand指示是否在分割后将结果转化为DataFrame。

下面，给出两个实例：

例1：按照指定分隔符分割字符串，并将结果转化为DataFrame

import pandas as pd

data = {'name': ['Tom,Hanks', 'Jack,Black', 'Will,Smith'],
        'age': [60, 51, 52]}

df = pd.DataFrame(data)
print(df)

df[['firstname', 'lastname']] = df['name'].str.split(',', expand=True)

print(df)

输出结果：

         name  age
0   Tom,Hanks   60
1  Jack,Black   51
2  Will,Smith   52

         name  age firstname lastname
0   Tom,Hanks   60       Tom    Hanks
1  Jack,Black   51      Jack    Black
2  Will,Smith   52      Will    Smith

在上面的例子中，我们将姓名中的第一个单词和第二个单词分别取出，并将它们加入到DataFrame中。

例2：按照多个分隔符分割字符串

import pandas as pd

data = {'content': ['I am a boy', 'You are a girl', 'He is a teacher.']}

df = pd.DataFrame(data)
print(df)

df['words'] = df['content'].str.split('[ .]', expand=False)

print(df)

输出结果：

            content
0        I am a boy
1     You are a girl
2  He is a teacher.

            content                   words
0        I am a boy        [I, am, a, boy]
1     You are a girl     [You, are, a, girl]
2  He is a teacher.  [He, is, a, teacher, ]

在上面的例子中，我们将内容中的单词分别取出，可以发现，我们不仅指定了空格作为分隔符，还指定了句号作为分隔符。这样，我们就可以灵活地根据不同的需求进行字符串分割。

本文链接：http://task.lmcjl.com/news/17739.html

展开阅读全文

上一篇：详解pandas.qcut()（将数值分位数）函数使用方法下一篇：详解pandas.str.upper()（转换字符串为大写）函数使用方法

热门文章排行

推荐文章

关键词

详解pandas.str.split()（字符串分割）函数使用方法

例1：按照指定分隔符分割字符串，并将结果转化为DataFrame

例2：按照多个分隔符分割字符串