[问题] 不同资料集字段比对,再输出比对结果

楼主: joson4921 (特务)   2016-12-25 17:46:05
- 问题: 当你想要问问题时,请使用这个类别。
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
手边有两个资料集,分别是 data1 (预计发车时间), data2 (实际发车时间)
我想做的事情是根据起站发车班表 data1 ,写个判断式进行时间比对
先上两个资料集的格式与内容示意
data1 data2 预期结果
Bus_No. DepartureTime DepartureTime Bus_No.
1 5:50 2015-12-25 06:51:20 4
2 6:10 2015-12-26 06:53:30 4
3 6:30 2015-12-27 06:29:58 3
4 6:50 2015-12-28 05:52:32 1
5 7:10 2015-12-29 07:09:24 5
判断式的判断条件:
data1是预计发车时间,data2是实际发车时间,
比对方式:找实际发车时间与预计发车时间差距最小者(发车前后5分钟都认定为该Bus_No.)
Bus_No.的判定结果目前是打算用dpylr加在data2的Departure字段后面,
最后结果输出为data3(内含 DepartureTime 和 Bus_No. 两个字段)
碰到的问题:
1.卡在不同资料集的字段资料比对
2.data1的Departure字段 和 data2的Departure字段 时间格式不一样,不知怎么写判断式
以上问题还要再麻烦各位大大解惑了@@
[程式范例]:
data3 <- data2[.(这边应该是写时间判断的东西,但我想不出怎么写), ] %>%
.[.(DepartureTime, Bus_No.)]
[环境叙述]:
请提供 sessionInfo() 的输出结果,
里面含有所有你使用的作业系统、R 的版本和套件版本资讯,
让版友更容易找出错误
[关键字]:
dplyr

Links booklink

Contact Us: admin [ a t ] ucptt.com