Re: [问题] 如何读入多个CSV档

楼主: wanson (望生)   2016-04-25 14:57:40
想要请问一下
我尝试使用在单一资料夹内有又不同资料夹
如wd 底下又有x, y, z
x底下有 x1 x2
y有y1 y2
z有z1
我尝试使用两个list.files去读取
setwd("C:/SASMACRO/data")
data.files1 = list.files()
data.files = list.files(path=data.files1,pattern="*.csv")
虽然data.files 可以得到所有个别的csv,分别为x1-z1
似乎都判断为在x底下资料夹的路径也就是
C:/SASMACRO/data/x/y1
这导致y1-z1无法在后续的merge的方式处理
要怎样让他可以判断出对应csv的路径为
C:/SASMACRO/data/x/x1
C:/SASMACRO/data/x/x2
C:/SASMACRO/data/y/y1
C:/SASMACRO/data/y/y2
C:/SASMACRO/data/z/z1
谢谢
另外以上file内档案并非非常有逻辑,所以使用eval可能不是非常适合
作者: andrew43 (讨厌有好心推文后删文者)   2016-04-25 15:44:00
try: dir(pattern=".csv$", full.names=T, recursive=T)pattern是放标准表示式,而你的重点应该是recursive=T
作者: celestialgod (天)   2016-04-25 16:01:00
.要escape,不然有机会出问题,改成"\\.csv$",不确定这里有没有fixed这个参数可以加我平常都直接list.file接grepl. XD
作者: andrew43 (讨厌有好心推文后删文者)   2016-04-25 16:03:00
嗯对,多谢,不然就对应到乱七八糟的东西了。
楼主: wanson (望生)   2016-04-25 16:41:00
请问escape要写在哪? 查了dir function 没有看到的说
作者: celestialgod (天)   2016-04-25 16:50:00
直接把a大的那个pattern改成我那个就好在字串里面加escape的意思是regexp里面有一些字符有意义,必须用\去避免使用该意义,R里面的字串,要表示\必须先escape他,所以要打\\这应该是R没有原生regexp interpreter,直接传到c做的缘故
作者: andrew43 (讨厌有好心推文后删文者)   2016-04-25 17:12:00
在标准表示式里,"."是除了换行的任何一个字符,是有特别作用的,所以要跳脱。如果没有跳脱,那"Dcsv"或" csv"都会符合,就不是你要的结果了。
楼主: wanson (望生)   2016-04-25 17:42:00
恩恩 谢谢

Links booklink

Contact Us: admin [ a t ] ucptt.com