[软件熟悉度]:
新手(没写过程式,R 是我的第一次)
[问题叙述]:
input一个一开始行数不均的csv的data
[程式范例]:
我知道这问题有点蠢
但因为这个data它有1.5 GB
Excel打开到一半就挂了 还失去后面的一部分资讯
想说用R开并整理资料
没料到这笔资料是长这样的(在Excel看到前半部分资料)
例如:
xxx
xxx
xxx xxx ←这些xxx我都不要
xxx xxx
xxx xxx
Name ID A B C D ←从这行开始以下才是我要的资料
a b c d e f
g h i j k l
.
.
.
可是因为不是mxn 标准dataframe的格式 (假设我要的资料是m x n)
R loading进去之后就整个乱掉了 变成 k x 2
也就是我资料全部变成2个column全乱掉...
但我没办法开启excel把不要的部分删掉
请问这该怎么办QAQ
有什么好建议 或挽救的整理方式
作者:
Wush978 (拒看低质媒体)
2014-10-23 20:37:00你如果知道前面不需要的资料的行数,可以用skip掉请使用skip这个参数
作者:
andrew43 (讨厌有好心推文后删文者)
2014-10-23 20:39:00skip=列数
作者:
Edster (Edster)
2014-10-24 21:55:00你可以用 Notepad++ 或 Notepad2 打开大的csv, 修改档案.
作者:
gsuper (Logit(odds))
2014-10-25 00:26:00read.delim("",skip=10) 这样应该可以另一种方式是用 scan("",what="character") 但这需要会写程式才能做后续处理
read.table的时候 fill=TRUE看看