新手学习爬虫中~
请问如以下的学校公告栏
http://www.cshs.kh.edu.tw/post/book.asp
soup = BeautifulSoup(html, 'html.parser')
for link in soup.find_all(href=re.compile("view")):
print(link.get('href'))
这样可以抓到内文实际的连结,但不知如何抓细节
主要想抓整个table把新的资料写入sql db, 不知道怎么抓好呢?
(因为它的table都没有id 或 class之类的~)
(新增资料