[问题] 读取csv档的小问题

楼主: ToastCheng (ToastCheng哥)   2015-01-16 14:42:29
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
新手(没写过程式,R 是我的第一次)
[问题叙述]:
我主要是想问read.csv(或read.table)在什么情况下会出问题,
在参数的设定上是不是只要sep有先注意是""还是","、quote有
时要设成""之外,其他都只是读取档案的偏好而不影响能不能读取成功~?
会有这个问题是因为在网络上看到交大的课程,好奇点了作业2
http://ghuang.stat.nctu.edu.tw/course/bigdata14/homework.asp
有一个csv档,我成功地用download.file(url,destfile,method="curl")
下载下来(在电脑也能直接开启)
但是用read.table或read.csv却一直出错,
但开启其他csv档却没问题(参数都用一样的)
[程式范例]:
> read.csv("/Users/Toast/Desktop/coursera R/FiveCities2.csv")
结果:
错误在make.names(col.names, unique = TRUE) :
无效的多字节字串于 '<b6>m<c2><ed><a5><ab><b0><cf>'
作者: ty854697   2015-01-16 15:05:00
我试的结果是因为encoding是big5才会有这样的错误,可以参考http://joe11051105.gitbooks.io/r_basic/content/data_import_and_export/import_data.html
作者: obarisk (OSWALT)   2015-01-16 15:13:00
"string,"string2",这种就会出问题
楼主: ToastCheng (ToastCheng哥)   2015-01-17 03:11:00
感谢ty大,我成功用readline+for loop将它换成utf8重开了,不过好复杂阿@@,以后遇到big5编码只能这样解决吗
作者: Wush978 (拒看低质媒体)   2015-01-17 03:58:00
可以先用命令列工具把档案转成utf8
作者: obarisk (OSWALT)   2015-01-17 07:37:00
read.csv(fileEncoding='big5'),不过有可能会掉字
楼主: ToastCheng (ToastCheng哥)   2015-01-17 15:17:00
感谢~晚点来试试原来是fileEncoding...一开始一直改encoding="big5"
作者: obarisk (OSWALT)   2015-01-18 07:15:00
在read.xxx的函式里,encoding是输出的编码
作者: autum134679 (Chiu Wen)   2015-01-19 02:14:00
感谢大家,我完成了~~~

Links booklink

Contact Us: admin [ a t ] ucptt.com