小弟想要把网络上截取的留言做资料清洗 只留下中文字 在网络上看到以下编码 #!/usr/bin/env python # -*- encoding: utf8 -*- import re sample = u'I am from 美国。We should be friends. 朋友。' for n in re.findall(ur'[\u4e00-\u9fff]+',sample): print n 1.想请问这unicode是只有简体字的范围吗 还是可以改成大五码吗 2.有其他推荐方法可以只留下中文字 去处全角标点符号跟表情符号吗 感谢!