[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
问题很多不好意思麻烦大家了,自己有稍微google过,但总理不出头绪
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
我想要import/read csv or xlsx file,但我不清楚R的概念。
1. 如我的资料在 D:\destop\datatest.csv,我的R Script也需要放在 D:/destop/ 嘛?
2. 有什么方式可以让我只要设定一次路径,将资料摆在同个资料夹方便import?
3. 为什么常常看到 library(readxl),如果我要使用 read_excel 的 code
如
library(readxl)
C1_data <- read_excel("D:\\destop\\datatest.xlsx")
4. 什么状况下 路径的slide要 \\ 或 / ?
5. 假设我要import/read的资料档案大小非常大,如下方 1.48 GB 的CSV (最主要的问题)
https://aqsdr1.epa.gov/aqsweb/aqstmp/airdata/hourly_44201_2016.zip 如连结
https://aqsdr1.epa.gov/aqsweb/aqstmp/airdata/annual_all_2016.zip <- 档案较小供作测试
有没有什么方法可以让我只抓它特定的row and column (包含数字与字串)
如 我想要 import 所有的 data,但在county.name的column里面只要有"cook","DuPage",
"Kane","Kenosha","Lake","McHenry","Porter","Will"的rows就好。
6. header的字串原本有空白间距,import之后空白变成 .
我之后在处理的时候要 打 . 还是 空白?
[程式范例]:
#