Re: [闲聊] python大师请进

楼主: surimodo (好吃棉花糖)   2022-06-27 09:04:33
※ 引述 《surimodo (摇滚少女!! 活力棉花糖!!)》 之铭言:
: → lturtsamuel: 你不是用人家套件吗 去看文件阿== 06/27 08:59
不是欸 我是直接网页爬虫pttweb
抓教主的推文
但是ptttweb网页乱抓签名档我也没办法= =
刚刚想一下
好像不会跳过中间的推文
但是输出会连懒学那个签名档也输出
可能要写死输出时跳过那个签名档
有点麻烦 不知道能不能
= =
作者: PyTorch (屁眼火炬)   2022-06-27 09:05:00
你什么时候也抓推闻了= =
作者: an94mod0 (an94mod0)   2022-06-27 09:05:00
写信跟pttweb的作者讲阿
作者: lturtsamuel (港都都教授)   2022-06-27 09:06:00
那你干嘛不用ptt原生网页==
作者: ILoveElsa (S级18位 梓喵酱油瓶)   2022-06-27 09:07:00
你叫他写api给你戳
作者: int0x80 (请逐项修改)   2022-06-27 09:08:00
感觉爬pttweb用XPATH就可以筛出推文了 原生网页就得要自己parse 毕竟ptt原生网页应该没在分内文还是推文
作者: lturtsamuel (港都都教授)   2022-06-27 09:09:00
有 我爬过
作者: int0x80 (请逐项修改)   2022-06-27 09:11:00
真的有欸不过我去看懒学签名档 好像也被ptt网页当推文

Links booklink

Contact Us: admin [ a t ] ucptt.com