1.1 KiB
1.1 KiB
Python string 与 bytes 之间的转换
总的来说,bytes 和 string 的关系是:
bytes ---decode--> string bytes <--encode--- string
常见的几种编码及格式:
- utf8:形如\xe4\xbb\x8a\xe5\xa4
- unicode:形如\u4eca\u5929\u5929\u6c14\u4e0d\u9519
如果 "" 变成了 "\" 说明原字符串是编码后的格式,变成 "\" 是因为转换成了bytes。
1.string 转 bytes
s = "abc" # string
s = "abc".encode() # bytes,encode 默认编码方式是 utf-8
s = b"abc" # bytes
# 或
s = "abc" # string
s = bytes(s, encoding = "utf8") # bytes
2.bytes 转 string
s = b"abc" # bytes
s = b"abc".decode() # string,encode 默认编码方式是 utf-8
s = str(b"") # string
# 或
s = b"abc" # bytes
s = str(s, encoding = "utf8") # string
3.bytes 类型的 unicode(中文)输出
s = '\\u4eca\\u5929\\u5929\\u6c14\\u4e0d\\u9519' # 中文是:今天天气真不错
new_s = s.encode().decode('unicode_escape') # 输出为:今天天气真不错