Re: [问题] utf8 encoding to decoding uranusjr PTT批踢踢实业坊

Re: [问题] utf8 encoding to decoding

楼主: uranusjr (â†é€™äººæ˜¯è¶…ç´šç¬¨è›‹) 2016-07-19 01:59:25

※ 引述《kyuudonut (CC)》之铭言：
: 各位先进好
: 小弟最近在抓网站资料 (用3.5)
: 结果抓下来的中文先被encoding，储存成编码的形式了@@ (EX. \uXXXX)
: 查了好久 2.7 好像可以使用decode
: 但到 3.5 因为统一使用unicode 所以用str就够了
: 但小弟试好久都没有办法转成中文 @@
: 因为对于电脑来说每个都还是一个文字吧!?
: 查到的例子中往往都是
: string = u'\uXXXX'
: print(string)
: 便可以直接转成对应字符
: 但小弟现在每一个字都是分开的阿阿阿
: 合在一起是一个字串阿!!!(泪) {'\', 'u', 'X', 'X', 'X', 'X'}
: 不知道有没有先进有过类似开发经验
: 能够给个提示或关键字
: 谢谢 QAQ
data = ['\\', 'u', '5', '9', '2', '7']
s = ''.join(data)
b = s.encode('ascii')
u = b.decode('unicode_escape')
print(u) # 校

作者: s860134 (s860134) 2016-07-19 02:12:00

明明就是 '大' XD 还有一个解 chr(int('5927',16))

楼主: uranusjr (â†é€™äººæ˜¯è¶…ç´šç¬¨è›‹) 2016-07-19 02:13:00

我改了码忘了改字 XD如果是一个字的话上面的方法比较好, 但这种的通常都是一串文字包含跳脱序列, 这时候 unicode_escape 就很方便

作者: s860134 (s860134) 2016-07-19 02:15:00

你说的有理

作者: kyuudonut (å–„è‰¯è€ç™¾å§“) 2016-07-19 09:57:00

转出来了!!! 谢谢两位!!! " target="_blank" rel="nofollow">

TAT

继续阅读

[问题] Python 照片上传问题h89256 [问题] utf8 encoding to decodingkyuudonut [问题] 新手问题:用python .py的方式的不开PANI [问题] 新手使用python做影像辨识开发请益z115988 Re: [问题] 新手试写函式却卡住了max80713 [问题] 新手试写函式却卡住了bottomless [问题] BBS应用-如何抢头香?enjoy9003 [问题]pandas memory errorasd3456722 [问题] Leetcode 88. Merge Sorted Arrayxxx30165 Re: [资讯] pyclub! Taipei.py 每月 sprint 活动keitheis