[低调]由证交所和柜买中心取得资料

楼主: abliou (愚者)   2009-07-01 10:28:21
因为这程式有点像砍站软件..用起来好像有点不道德..
所以还是低调点...
http://webhd.xuite.net/_oops/abliou/960
原理大概就是会从证交所和柜买中心的网页抓取历史资料和并且过滤存成tab档
tab档的各字段就跟原始网页一样..
可以参考
http://www.otc.org.tw/ch/stock/aftertrading/daily_trading_info/st43.php
分别为
日期 成交仟股 成交仟元 开盘 最高 最低 收盘 涨跌 笔数
上市上柜名单则是自动从正交所网页抓取...
http://brk.twse.com.tw:8000/isin/C_public.jsp?strMode=4
http://brk.twse.com.tw:8000/isin/C_public.jsp?strMode=2
因此拿到的程式最后只会请使用者输入两个参数..即起始年份和结束年份..
程式会自动以年份为单位下载..
因为只是从一整个process剪下.. 所以没有太多的判断机制简查使用者输入参数..
ps1.list为上市 ...trading为上柜
ps2.放一阵子就会拿下来..毕竟砍站软件还是低调点好..
作者: Alexboo (给你钱 快点做)   2009-07-01 10:32:00
可以存成xml档吗
作者: ForeverT (全家好神)   2009-07-01 10:35:00
不错喔!你也是用PERL写! 我用成可以抓个股写到EXCEL
作者: midnight9 (咪耐)   2009-07-01 10:42:00
感恩=V=
作者: liangkuo   2009-07-01 10:43:00
感恩,请问一下有开放原始码吗?
作者: ForeverT (全家好神)   2009-07-01 10:44:00
你可以用 , 来区隔资料从LINUX抓回WIN存成.CSV就变EXCEL
作者: ForeverT (全家好神)   2009-07-01 10:45:00
妳要不要改写成 可指定各股阿 全抓 好猛阿!!
作者: ForeverT (全家好神)   2009-07-01 10:48:00
你滤除HTML码是用模组 还是自己写的阿
作者: kroll (BigBang)   2009-07-01 10:56:00
楼主: abliou (愚者)   2009-07-01 11:00:00
对我而言tag反而是很好的anchor,所以没用html module
作者: ForeverT (全家好神)   2009-07-01 11:07:00
推 这应该对很多人有用处
作者: mystage (亭)   2009-07-01 11:33:00
帮低调
作者: hollybell   2009-07-01 12:22:00
推推 :)
作者: OR (操盘要在早餐后)   2009-07-01 12:49:00
晚了一步,下载抓无档案了
作者: ATTism ([没时间不是借口])   2009-07-01 12:52:00
还有啊
作者: wang51 (在五月我喜欢你)   2009-07-01 14:18:00
外行人问一下,tab档要用什么软件读呀?
楼主: abliou (愚者)   2009-07-01 14:35:00
tab用笔记本就能开了,不然用excel也能开
楼主: abliou (愚者)   2009-07-01 14:45:00
但用excel日期格式会有问题,所以建议用笔记本这类编辑软件
作者: u48652004 (寒流来了~)   2009-07-01 19:11:00
版主明天可以帮我抓下个月的资料吗?(误)

Links booklink

Contact Us: admin [ a t ] ucptt.com