[问题] ptt 爬出作者跟文章怎么存进excel里?

楼主: rayray0410 (苏韦在哪里)   2019-03-05 17:21:01
练习爬虫的路上先从ptt 下手
最近遇到的困境是该怎么把爬到的内容存进excel里
原本是想说利用list 一个存标题、一个存内文,再用dataframe输出至excel
但一直存不进去,看着错误代码才想到 爬到的不是string
而是 item 或是 object的东西
以下是简略的程式码,标题存进title的list、内文存进article里
ptt_title = soup.select('span.article-meta-value')
// 标题
title[count] = ptt_title[2].text
content = soup.find(id="main-content").text
// 内文
article[count] = content
count++
但显然.text 是没办法直接存入的! 所以想请教版上的各位
还有什么办法可以存进excel呢??
感谢各位!!
作者: lemon651 (小明)   2019-03-06 11:47:00
估计是没转成text吧
作者: powerkshs (气质斯文读书人)   2019-03-06 00:47:00
df.to_excel
楼主: rayray0410 (苏韦在哪里)   2019-03-05 23:00:00
谢谢!关键好像是.text()?
作者: jiyu520 (不要鲫鱼我)   2019-03-05 22:21:00

Links booklink

Contact Us: admin [ a t ] ucptt.com