楼主:
why702 (Glory Glory ManU )
2017-12-05 22:32:54小弟初学python,
有写一个某个股票网站的爬虫,
希望跟各位前辈交流一下,
但是碍于这个网站会挡爬虫,
所以我不敢把程式公开,
如果有人也有写类似的爬虫愿意交流的吗?
目前我的程式因为股票资讯太多,
如果要全部都爬会花超过13hr,
所以我阉割了一大部分,
保留我觉得比较重要的,
但是还是会花约3hr多
想看前辈是不是有比较好的方法愿意交流
感谢
3小时好久… 觉得没效率应该有像楼上讲的API可以用没有错
楼主:
why702 (Glory Glory ManU )
2017-12-06 00:53:00有现成的,有办法把所需的数据给我自由运算的吗?
作者:
neil987 (R5大小姐-EX人品崩坏)
2017-12-06 03:37:00stocktw
作者:
coeric ( )
2017-12-06 09:45:00是楼上说的这网站吗?改天来挑战看看~~
作者: wennie0433 2017-12-06 21:19:00
github twstock
楼主:
why702 (Glory Glory ManU )
2017-12-07 00:31:00喔! 这个我看过,写得很好,但是少了一些资讯,所以我只好自己爬
作者:
rexyeah (ccccccc)
2017-12-07 12:39:00很好奇为何爬3hr..我爬了8个页面还加上运算后在googlesheet上纪录,还做了枢纽与画图也不用3分钟啊btw, 我只纪录了14个指标啦
楼主:
why702 (Glory Glory ManU )
2017-12-07 18:51:00因为那个网站把历史数据全部放上去,读取解析那海量数据花很多时间有兴趣我可以把git给您参考,看有没什么建议?
可以学我把历史资料爬完后,下来用SQL分析,快不少
楼主:
why702 (Glory Glory ManU )
2017-12-08 18:53:00我就是这样做没错,但还是每天要更新