PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] 使用 Python 爬虫但一直会抓到重复的文字
楼主:
perfectkevin
(No)
2025-04-20 16:39:59
请问各位
我使用以下的 code 想要爬一篇多页面的Review网站文字
结果是可以爬出来,但每一页的文字都会被重复爬取2~3次
造成最后爬出来的结果文字数量是超级爆炸多
想请问我的code 是哪边有问题?
谢谢各位
code分享连结:
https://ideone.com/493g7j
爬取页面:
https://reurl.cc/7K01b9
Note:
code里面的 URL 我是使用动态产生的网址变量 "initial_url"
作者:
shadowjohn
(转角遇到爱)
2025-04-20 18:38:00
你可能要限制只抓 div class='entry' 里的所有 p
继续阅读
[问题] 用Whisper AI帮我下载字幕(有酬)
iael
[问题] selenium 有办法做档案上传吗?
oskens
Fw: [讨论] 哈囉 请问有给python新手的课程吗
malnor
[问题] excel填入资料问题
qaz950270
Re: [问题] @property 真正的运用是啥
ddavid
[问题] class type 跟 class object
littrabble
[闲聊] python平行处理效能是否很差?
lovepork
[问题] @property 真正的运用是啥
littrabble
[闲聊] 有人要合购股票pythony数据库finlab吗?
tamacugi
[问题] 在IIS下使用呼叫EXE权限问题
akito117
Links
booklink
Contact Us: admin [ a t ] ucptt.com