PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] 新手问ptt政黑版爬虫
楼主:
askdrlin
(ä¸å¤®æ°£è±¡å±€)
2018-12-09 12:11:45
大家好,小弟我目前已经把ptt政黑版爬虫给爬完了,目前的状况是标题,时间,发文id
,内容,推文,都可以爬下来
想要进阶到正则表达式把内文作者或是来源给抓出来,不知道这是否可行?因为政黑版的
发文格式相当混乱,
像是是
新闻来源:xx
新闻:xx
xxx 报导
xxxx ooo 综合报导
或是什么都没有
不晓得是否能够写出把这些单独抓出来的正则表达式,因为也怕写了会抓到其他的字就是
了....
作者:
jiyu520
(不要鲫鱼我)
2018-12-09 12:36:00
ㄜ...你自己回答自己了,可以啊
作者:
s860134
(s860134)
2018-12-09 16:55:00
没有干净的资料只有无尽的苦功...
作者:
CodingMan
(程式侠)
2018-12-10 14:59:00
推二楼 你只能case by case 了
继续阅读
[问题] print画面资料 写出一个档
newdas
print的结果 如何写出在一个档案
newdas
[问题]Selenium没办法爬 MOMO购物网
a6409tw
[问题] 解方程式
kottey
[问题] 重复执行py档并纪录结果
newdas
Re: [心得] PTT Library
jay20210
[问题] 有关于鼠标点击座标并写入档案
a00011111143
[问题] 请教有无比较好的写法
st40182
[问题] 如何让立体声音乐分离左右声道
winnie0117
[问题] anaconda 下的pip
silencemars
Links
booklink
Contact Us: admin [ a t ] ucptt.com