PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
R_Language
[问题]用getURL抓台股代码 encoding问题
楼主:
sorder
(Reader)
2015-04-26 23:05:19
[问题类型]:
抓资料编码问题.
[软件熟悉度]:
请把以下不需要的部份删除
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
请简略描述你所要做的事情,或是这个程式的目的
利用R来抓台股股票代码
但是抓回来的资料是乱的.
两个网址都是乱的.Orz~
[程式范例]:
//==================================
rm(list=ls(all.names=TRUE))
library(RCurl)
library(XML)
library(bitops)
test =
getURL("http://isin.twse.com.tw/isin/C_public.jsp?strMode=2",encoding="UTF-8")
test2 = getURL("http://www.emega.com.tw/js/StockTable.htm",encoding="big5")
write.table(test,"test.txt")
write.table(test2,"test2.txt")
//==================================
[环境叙述]:
Win7 + RStudio
[关键字]:
选择性,也许未来有用
作者:
celestialgod
(天)
2015-04-27 12:47:00
爬之前的文章吧,ENCODING在windows很麻烦请爱惜生命跟时间,尽早服用UTF8的LINUX那个选项是用.encoding 第一个网址.encoding='big5'会是正确的档案第二个档案一样少个.,结果就会对
楼主: sorder (Reader)
2015-04-27 13:26:00
感谢 爬到了url=URLencode("
http://....."
)url=getURL(url,.encoding="big5") 即可正确了~~原来是少了个"." Orz
作者:
psinqoo
(零度空間)
2015-04-28 17:00:00
请爱惜生命跟时间,尽早服用UTF8的LINUX+1
作者:
gsuper
(Logit(odds))
2015-04-30 00:41:00
parser 还是自己写好些, strsplit() 万用
继续阅读
关于自订函数
lofu
[问题] 电脑跑不动问题...
sinclairJ
Re: [问题] 合并类别变量的count (table)
celestialgod
[问题] 合并类别变量的count (table)
sinclairJ
Re: [问题] 拆解time-dependent的资料
bmka
Re: [问题] 几个资料预处理问题
andrew43
Re: [问题] 几个资料预处理问题
celestialgod
[问题] 几个资料预处理问题
sinclairJ
Re: [问题] 拆解time-dependent的资料
celestialgod
[问题] 拆解time-dependent的资料
yummy7922
Links
booklink
Contact Us: admin [ a t ] ucptt.com