※ 引述《Aungk (菲依)》之铭言:
→ Aungk: 确定是s="b'abc\xe9\xa1\x9e'" 09/06 14:07
先把有的没有的拿掉
stripped = s[2:-1] # 'abc\xe9\xa1\x9e'
encoded = stripped.encode('latin1') # b'abc\xe9\xa1\x9e'
result = encoded.decode('utf-8') # 'abc类'
关键在于 latin-1 是 lossless 的 8-bit encoding, 所以在实务上可以把一个
只包含 single-byte characters 的 Unicode 内容直接 map 到同样 byte sequence
的 encoded data。这招很好用, 建议记起来。:P
相关讨论:
https://www.ptt.cc/bbs/Python/M.1449994700.A.43C.html