[问题] 使用 Python 爬虫但一直会抓到重复的文字

楼主: perfectkevin (No)   2025-04-20 16:39:59
请问各位
我使用以下的 code 想要爬一篇多页面的Review网站文字
结果是可以爬出来,但每一页的文字都会被重复爬取2~3次
造成最后爬出来的结果文字数量是超级爆炸多
想请问我的code 是哪边有问题?
谢谢各位
code分享连结:
https://ideone.com/493g7j
爬取页面:
https://reurl.cc/7K01b9
Note:
code里面的 URL 我是使用动态产生的网址变量 "initial_url"
作者: shadowjohn (转角遇到爱)   2025-04-20 18:38:00
你可能要限制只抓 div class='entry' 里的所有 p

Links booklink

Contact Us: admin [ a t ] ucptt.com