小弟爬虫新手想请教各位前辈
目前有一个专题是要爬518人力银行的征才网页
小弟目前是用beautifulsoup爬列表页里面的Anchor
但是518连结内文档的Anchor href有空白像这样
https://www.518.com.tw/外商线上娱乐集团 征聘 JAVA Developer 2名 工作地点
菲律宾-其它亚洲-东南亚-job-1471387.html?kw=java&pi=1
导致使用
for link in soup.find_all('a'):
print(link.get('href'))
爬出来的href只到https://www.518.com.tw/外商线上娱乐集团
空格后面的变成纯字串造成爬出来的href连到错误的网页
所以想请问此情况要如何解决让空格后面的内容也可以放进去href?
感谢各位前辈帮忙~