[问题] input data (非mxn)

楼主: yaowei2010 (yaowei)   2014-10-23 19:10:48
[软件熟悉度]:
新手(没写过程式,R 是我的第一次)
[问题叙述]:
input一个一开始行数不均的csv的data
[程式范例]:
我知道这问题有点蠢
但因为这个data它有1.5 GB
Excel打开到一半就挂了 还失去后面的一部分资讯
想说用R开并整理资料
没料到这笔资料是长这样的(在Excel看到前半部分资料)
例如:
xxx
xxx
xxx xxx ←这些xxx我都不要
xxx xxx
xxx xxx
Name ID A B C D ←从这行开始以下才是我要的资料
a b c d e f
g h i j k l
.
.
.
可是因为不是mxn 标准dataframe的格式 (假设我要的资料是m x n)
R loading进去之后就整个乱掉了 变成 k x 2
也就是我资料全部变成2个column全乱掉...
但我没办法开启excel把不要的部分删掉
请问这该怎么办QAQ
有什么好建议 或挽救的整理方式
作者: Wush978 (拒看低质媒体)   2014-10-23 20:37:00
你如果知道前面不需要的资料的行数,可以用skip掉请使用skip这个参数
作者: andrew43 (讨厌有好心推文后删文者)   2014-10-23 20:39:00
skip=列数
楼主: yaowei2010 (yaowei)   2014-10-23 21:03:00
感谢!!!!
作者: Edster (Edster)   2014-10-24 21:55:00
你可以用 Notepad++ 或 Notepad2 打开大的csv, 修改档案.
作者: gsuper (Logit(odds))   2014-10-25 00:26:00
read.delim("",skip=10) 这样应该可以另一种方式是用 scan("",what="character") 但这需要会写程式才能做后续处理
作者: kenshin528 (成立奥凶帝国!!)   2014-10-25 14:44:00
read.table的时候 fill=TRUE看看

Links booklink

Contact Us: admin [ a t ] ucptt.com