[问题] 新手请教爬虫 lovex PTT批踢踢实业坊

[问题] 新手请教爬虫

楼主: lovex (L O V E X) 2020-09-01 17:26:32

新手学习爬虫中~
请问如以下的学校公告栏
http://www.cshs.kh.edu.tw/post/book.asp
soup = BeautifulSoup(html, 'html.parser')
for link in soup.find_all(href=re.compile("view")):
print(link.get('href'))
这样可以抓到内文实际的连结，但不知如何抓细节
主要想抓整个table把新的资料写入sql db, 不知道怎么抓好呢?
(因为它的table都没有id 或 class之类的~)
(新增资料

作者: panex0845 (èƒ–å…‹æ€) 2020-09-01 19:44:00

整个表格也没几行把网页抓下来做字串分析就行了

作者: chickengod (鸡大侠) 2020-09-01 20:11:00

有 table 的话用 soup 抓出 table 喂给 pandas不过这网页有 RSS 的话直接用 feedparser就不需要自己处理网页

继续阅读

[问题] 如何打开 raw image filemorningjis [问题] Xlwings资料型态问题sillygrace [问题] Mac用程式改AV片名改到档案不见kiwistar [问题] class中method名称一样tsaiminghan [问题] 要如何透过python取得network log资讯laya1017 [问题] vscode 范例档案突然有问题jackjenny [问题] list与list[:]差异ericrobin [问题] mac 用Jupyter 无法使用graphvizSupershero Re: [心得] 上传照片或影片到 Google Photofunky1221 Re: [心得] 上传照片或影片到 Google Photofunky1221