※ 引述《blc (Anemos)》之铭言:
: 请问一下,最近在试fbchat时,有个unicode变量一直print出乱码,
: 用repr印出来长这样:
: u'\xe7\x9c\x8b\xe6\x9c\x89\xe6\xb2\x92\xe6\x9c\x89\xe8\xa3\x9dlzma'
: 看起来像是把str的内容塞进unicode了(明明只有json.loads()),
: 请问该怎么把它的内容转成正常的unicode印出来呢?
我又来了……
这次的unicode变量长这样:
u'\u0107\x98\u017b\u013a\x95\x8a'
内容是utf-8的'是啊',但看起来就是某几个unicode字符变成utf-8字串了。
直接给 .encode('iso-8859-1','ignore') 的话\u部份的就被省掉了……
如果是纯字串的'是啊'会是下面的样子:
'\xe6\x98\xaf\xe5\x95\x8a'
纯unicode的话是:
u'\u662f\u554a'
请问这要怎么解?