Re: [请益] 把各家公司财报做成数据库搜寻??

楼主: LKJS (LKJS)   2017-04-09 16:39:20
我先假设你的“数据库”真的是指一般公司企业在用的“数据库”
(如果你指的“数据库”只是想放资料,算算指标。以台湾公司财报的量跟复杂度,用还算ok的电脑+excel就可以有不错的效能了。)
1. 网络爬虫:先了解网站怎么写的(HTML+CSS+Javascript) + 任一可以写爬虫的语言(现在最受欢迎网络教学最多的应该是python)
但其实网络上很多别人已经整理好的资料,直接下载excel档或csv档就好了...
2. 数据库:SQL
如果你只是问“程式”能力了话大guy就这样..
但真正麻烦的是数据库设计:你要有哪些表格?每个表格有哪些字段?
要不要做索引?要不要做正规化?要用哪一家数据库软件?
像是,你要一个公司一个表格,每个表格里面放该公司历年资料?
还是一年一个表格,里面放该年所有公司资料?
还是每一份财报就一个表格,非常有系统地按公司按季度分开放,但需要用到数个公司数年份的资料比对时,就要写非常复杂的SQL语法?
还有资料清理:拿到的资料有缺值怎么办?有些西元年有些民国年怎么办?该放数字的地方出现中文怎么办?
还有流程设计:从资料蒐集→资料清理→资料入数据库 的过程,要一口气三步一气呵成吗?还是先全部做完第一步,写成暂存盘,再全部一起做第二步、第三步?
所以很多网站才要收费RRR工程师很可怜derQQ
※ 引述《prmea (123)》之铭言:
: 有点像财报狗那样,
: 可是想要用他的VIP指标但需要付费,
: 所以,想要1.把所有财报资料做成搜寻库
: 2. 根据所想要的指标来选股
: e.g. 长短期金融借款
: 需要那些程式能力??
作者: genius721105 (genius721105)   2017-04-09 18:48:00
自己做数据库的成本 绝对高于买数据库时间成本

Links booklink

Contact Us: admin [ a t ] ucptt.com