[问题] 不知道是哪边出了问题求救 jackhzt PTT批踢踢实业坊

[问题] 不知道是哪边出了问题求救

楼主: jackhzt (巴克球) 2016-02-14 16:40:27

刚学python不到1个月
尝试用python抓点资料
print爬取出来都很正常
但是要储存资料时却出现了
UnicodeEncodeError: 'cp950' codec can't encode character '\u5367' in position
2763: illegal multibyte sequence
请问一下这是哪边出了问题?
有解决的方法吗?
以下是程式码:
import requests
from bs4 import BeautifulSoup
import lxml
u="https://zh.wikisource.org/wiki/%E9%87%91%E7%93%B6%E6%A2%85/%E7%AC%AC01%E5%9B%9E"
res2=requests.get(u)
soup=BeautifulSoup(res2.text,"lxml")
data=soup.select("#mw-content-text")[0].text
titles=(soup.select("td ")[2].text[4:-8].strip())
loca="D:\\bigdata\\testR\\word\\金瓶梅\\"+titles+".txt"
with open(loca,"w") as my_file:
my_file.write(data)

作者: alibuda174 (阿哩不达) 2016-02-14 16:43:00

你的open开档默认为cp950编码，无法储存某些字符from io import openopen(loca, 'w', encoding='utf8')

楼主: jackhzt (巴克球) 2016-02-14 16:52:00

成功了谢谢大大io这东西好猛等等看一下他在看嘛竟然这样就可以跑了~

继续阅读

[问题] matplotlib图片存盘如何保留座标轴cosmoSJ [资讯] <每周四>Django实况学习3stupidgod08 [问题] 关于override的继承问题octantis [问题] python的二维list用法...peace9527 [问题] 用repr读取Binaryjosefy Re: [问题] unicode里有str资料该怎么转？blc [问题] 良好的python编码习惯peace9527 Re: [问题] 英文实在看不懂，能不能请各位帮忙解释？stupidgod08 Re: [问题] 询问list如行相加ZolaEmile Re: [问题] 英文实在看不懂，能不能请各位帮忙解释？uranusjr

[问题] 不知道是哪边出了问题 求救

[问题] 不知道是哪边出了问题求救