问题一
我要读的是笔记本txt档
档案太大无法先用excel处理
我的分隔符号有多个 请问要怎么写??
我的code
read.table("d:\\xxx.txt" ,sep=";", fill=T, quote="")
我想要用 ; 和 空格 当作分隔符号 未来可能再增加
==========================================================
问题二
我的资料中 有些地方没有值 所以当初在存的时候就直接忽略 连空白都没留
像这样:
sam;16;boy; 2015:00:09:59
green;18;gril
paul;20; 2015:00:09:59
第一行是name
第二行是age
第三行是性别
但是paul没有记录到 所以直接记录到第四行的time
green的time也没记录到
想问有没有什么方法解决 我目前只想到比较笨的方法
给它特定范围去判断 像性别不是boy就是gril 出现其他就给他NA
还有
这样读资料也会因为每列资料col都不一样 有的时候会出现问题
是可以读成文字再去慢慢拆开 不过有点笨就是了
最后想问如果读资料量上百万笔
还是用read.table吗?
有没有比较好的函数专门处理large data?
谢谢