[问题] Read.table Not ALL Rows

楼主: tus (new life)   2018-01-28 13:15:48
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[问题叙述]:
用R读text档 但好像没有全部的rows都读进去 不知道原因是什么
用EXCEL打开资料 可以看到约有1000000 entries (rows) 原始资料应该更多
因为这是EXCEl的上限 1048576
但用R read.table or read.csv 读进去时 约只有700000笔资料 没有任何错误讯息
目前是用 read.table(filename, quote = "", comment.char = "", fill = TRUE)
如果不加quote = "" 会出现EOF within quoted string
fill = TRUE 是因为好像有几笔资料column length不同
几笔资料可以在EXCEL中看到的 R没读进去的 找不到任何异样
用count.fields 也是只有700000笔资料左右
sorry 没办法share资料 但还是想请问看看 有没有什么原因会造成这样的情况
感谢
作者: KKbiger (UUUU)   2018-01-28 13:39:00
改用套件data.table去读试试看
楼主: tus (new life)   2018-01-28 13:42:00
谢谢 但没办法 资料放在加密电脑 没有连上网络要安装package要经过层层关卡....
作者: Wush978 (拒看低质媒体)   2018-01-28 13:54:00
不然先用readLines读读看,然后手动转data.frame
楼主: tus (new life)   2018-01-28 14:05:00
readLines 也是得到700000 elements左右
作者: Wush978 (拒看低质媒体)   2018-01-28 14:14:00
那试着用readBin直接读raw vector近来查一下readLines的下一行出了什么问题是不是有00
楼主: tus (new life)   2018-01-28 14:29:00
最后一行资料中有个怪符号 -> 在应该是人名的字段中感谢Wush!

Links booklink

Contact Us: admin [ a t ] ucptt.com