[心得] 新闻网站技术细节分析

楼主: tacovirus (小璋丸)   2018-11-08 01:11:19
最近尝试把新闻爬虫做得系统化,也发现各新闻网站的技术问题
大致上整理了两份表格,可以知道有哪些技术债还没还
如果想去这些新闻媒体 coding 可以推测要拆的雷
https://github.com/virus-warnning/twnews/blob/feature/search-news/docs/SOUP_NOTES.md
如果觉得这爬虫有用,也欢迎抓来玩玩
只要在 Python 3.5 以上这样装就可以了
pip3 install twnews
详细请见
https://pypi.org/project/twnews/
作者: neo5277 (I am an agent of chaos)   2018-11-08 02:00:00
推推推
作者: skitty (aki)   2018-11-08 09:42:00
请问有效率是指什么?
作者: yyc1217 (somo)   2018-11-08 10:29:00
应该大部分都有RSS可以订阅
作者: jerry1144 (′・ω・`)   2018-11-08 14:36:00
推! 新闻分解最完整的竟然是联合跟中时...惨
作者: alvinlin (林矜业)   2018-11-11 18:57:00
不错呦。收了。多谢。

Links booklink

Contact Us: admin [ a t ] ucptt.com