[讨论] 股票爬虫

楼主: why702 (Glory Glory ManU )   2017-12-05 22:32:54
小弟初学python,
有写一个某个股票网站的爬虫,
希望跟各位前辈交流一下,
但是碍于这个网站会挡爬虫,
所以我不敢把程式公开,
如果有人也有写类似的爬虫愿意交流的吗?
目前我的程式因为股票资讯太多,
如果要全部都爬会花超过13hr,
所以我阉割了一大部分,
保留我觉得比较重要的,
但是还是会花约3hr多
想看前辈是不是有比较好的方法愿意交流
感谢
作者: cocoaswifty (coco)   2017-12-05 23:40:00
股票程式交易不都有API可以用,为什么要爬
作者: TitanEric (泰坦)   2017-12-06 00:05:00
3小时好久… 觉得没效率应该有像楼上讲的API可以用没有错
楼主: why702 (Glory Glory ManU )   2017-12-06 00:53:00
有现成的,有办法把所需的数据给我自由运算的吗?
作者: neil987 (R5大小姐-EX人品崩坏)   2017-12-06 03:37:00
stocktw
作者: coeric ( )   2017-12-06 09:45:00
是楼上说的这网站吗?改天来挑战看看~~
作者: wennie0433   2017-12-06 21:19:00
github twstock
楼主: why702 (Glory Glory ManU )   2017-12-07 00:31:00
喔! 这个我看过,写得很好,但是少了一些资讯,所以我只好自己爬
作者: rexyeah (ccccccc)   2017-12-07 12:39:00
很好奇为何爬3hr..我爬了8个页面还加上运算后在googlesheet上纪录,还做了枢纽与画图也不用3分钟啊btw, 我只纪录了14个指标啦
楼主: why702 (Glory Glory ManU )   2017-12-07 18:51:00
因为那个网站把历史数据全部放上去,读取解析那海量数据花很多时间有兴趣我可以把git给您参考,看有没什么建议?
作者: koshi0413 (Koshi)   2017-12-07 20:19:00
可以学我把历史资料爬完后,下来用SQL分析,快不少
楼主: why702 (Glory Glory ManU )   2017-12-08 18:53:00
我就是这样做没错,但还是每天要更新

Links booklink

Contact Us: admin [ a t ] ucptt.com