Python3字符串encode与decode的完整攻略

在Python3中，字符串的encode()和decode()是两个常用的方法，它们可以用来将字符串转换为不同的编码格式。在本文中，我们将介绍字符串的编码和解码，讲解这两个方法的用法，并提供两个示例来演示它们的具体应用。

字符编码

在计算机中，字符常常用二进制表示。但不同的国家或地区可能采用不同的二进制编码标准来表示字符。所以需要使用一种标准的方式来将字符转换为二进制形式。这种标准就叫做字符编码。

常见的字符编码包括ASCII、UTF-8、GBK等等，每一种编码都有特定的字符集和转换规则。

在Python3中，字符串对象有一个encode()方法，它可以将字符串转换为一个指定编码格式的字节序列。

encode()方法的语法如下：

str.encode(encoding='UTF-8',errors='strict')

其中，encoding参数表示要使用的编码格式，errors参数表示转换出现错误时的处理方式。

示例1：

s = '哈喽哈喽'
bs = s.encode('UTF-8')
print(bs)

输出结果为：

b'\xe5\x93\x88\xe5\x96\xbd\xe5\x93\x88\xe5\x96\xbd'

在这个示例中，我们定义了一个字符串s，并将其使用UTF-8编码转换成字节序列bs，打印bs时，我们发现它被表示为b开头的字节序列了。

示例2：

s = 'Hello World!'
bs = s.encode('GBK')
print(bs)

输出结果为：

b'Hello World!'

在这个示例中，我们将字符串s使用GBK编码转换成字节序列bs,由于GBK是支持英文字符的编码格式，所以bs和原始的字符串是相同的。

与encode()方法不同，decode()方法可以将字节序列解码成字符串。

decode()方法的语法如下：

str.decode(encoding='UTF-8',errors='strict')

其中，encoding参数表示要使用的编码格式，errors参数表示解码出现错误时的处理方式。

示例3：

bs = b'\xe5\x93\x88\xe5\x96\xbd\xe5\x93\x88\xe5\x96\xbd'
s = bs.decode('UTF-8')
print(s)

输出结果为：

哈喽哈喽

在这个示例中，我们使用UTF-8解码bs字节序列，得到了原始的字符串s。

示例4：

bs = b'\xc8\xcb\xcc\xec\xCA\xd6Ë®`'
s = bs.decode('GBK')
print(s)

输出结果为：

你好，世界！

在这个示例中，我们使用GBK解码bs字节序列，得到了原始的字符串s。

在Python3中，字符串的编码和解码是一个很重要的概念。使用字符串的encode()方法可以将字符串按照指定的编码格式转换为字节序列，而使用decode()方法可以将字节序列解码成原始字符串。在使用时，我们需要根据不同的需求选择合适的编码格式和处理方式。

展开阅读全文

上一篇：pandas string转dataframe的方法下一篇：介绍Python中的文档测试模块