Re: [问题] unicode里有str资料该怎么转？ blc PTT批踢踢实业坊

Re: [问题] unicode里有str资料该怎么转？

楼主: blc (Anemos) 2016-02-03 17:10:18

※ 引述《blc (Anemos)》之铭言：
: 请问一下，最近在试fbchat时，有个unicode变量一直print出乱码，
: 用repr印出来长这样：
: u'\xe7\x9c\x8b\xe6\x9c\x89\xe6\xb2\x92\xe6\x9c\x89\xe8\xa3\x9dlzma'
: 看起来像是把str的内容塞进unicode了(明明只有json.loads())，
: 请问该怎么把它的内容转成正常的unicode印出来呢？
我又来了……
这次的unicode变量长这样：
u'\u0107\x98\u017b\u013a\x95\x8a'
内容是utf-8的'是啊'，但看起来就是某几个unicode字符变成utf-8字串了。
直接给 .encode('iso-8859-1','ignore') 的话\u部份的就被省掉了……
如果是纯字串的'是啊'会是下面的样子：
'\xe6\x98\xaf\xe5\x95\x8a'
纯unicode的话是：
u'\u662f\u554a'
请问这要怎么解？

楼主: blc (Anemos) 2016-02-03 17:13:00

json.loads()问题实在有点多……

作者: alibuda174 (阿哩不达) 2016-02-03 17:46:00

c = u'\u0107\x98\u017b\u013a\x95\x8a'print(c.encode('iso-8859-2').decode('utf-8'))

楼主: blc (Anemos) 2016-02-03 20:17:00

哦哦感谢，我真该好好k手册了有找到 chardet module，但是只能侦测str的样子……然后侦测起来好像也不太准……

继续阅读

[问题] 从网页抓取CSV资料后存盘问题threeSecGun [问题] 为什么可以assign但不能print出来peace9527 [资讯] Django学习过程直播2stupidgod08 [问题] 推荐MAC OSX下GUI Lib/环境boGhosts [问题] unicode里有str资料该怎么转？blc Re: [问题] 询问list如行相加drjoey Re: [问题] 询问list如行相加mantour Re: [问题] 询问list如行相加ckc1ark [问题] 如何在atom里增加python的library?x75395175951 [问题] Beautifulsoup的get_text()问题peace9527