[问题] 爬虫个股公开资讯

楼主: k5171 (Jess)   2017-08-27 17:05:19
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
至公开资讯观测站 > 营运概况 > 财务比率分析 > IFRS 后 > 财务分析资料,
爬虫公司名称, 以及财务分析资料的表格.
过去爬虫以 id 或 class 爬很方便,
这次碰到没有唯一 id 或 class 的项目,
用了最根部的 id:table01 完全爬不下来,
表格内的 class 又各有不同,
也尝试了 xpath 都爬不下来,
求解版上的各位,非常谢谢
[程式范例]:
url <- 'http://mops.twse.com.tw/mops/web/t05st22_q1'
co_id = 2330
res <- POST(url,
body = list(
step = 1,
firstin = 1,
co_id = co_id,
isnew = FALSE, # 历史资料
year = 106, # 年度
encode = 'form')
res_text <- content(res, as = 'text', encoding = 'UTF-8')
#

Links booklink

Contact Us: admin [ a t ] ucptt.com