[问题] 重复配对

楼主: yaowei2010 (yaowei)   2014-08-28 15:03:06
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
新手(没写过程式,R 是我的第一次)
[问题叙述]:
由于match只会回传第一个配对到的位子,多重配对我估狗过后似乎没有特定
如match的function,不知道该怎么办,请问有这样的function吗(如例子
[程式范例]:
[data 1]
name location
A 1
B 1
C 2
D 3
[data 2]
name2 location
a1 1
a2 1
a3 1
a4 2
a5 2
a6 2
a7 2
a8 3
依照location做match后(不是用match())
name match
A a1
A a2
A a3
B a1
B a2
B a3
C a4
C a5
C a6
C a7
D a8
为了节省大大们的麻烦
(不需用给我完整的code,可以给我hint或有独特的function即可)
感恩
楼主: yaowei2010 (yaowei)   2014-08-28 15:04:00
因为我实际data很大,merge不知为何内存爆炸
作者: obarisk (OSWALT)   2014-08-28 15:35:00
依location做卡氏积
楼主: yaowei2010 (yaowei)   2014-08-28 15:44:00
卡式积@_@?
作者: cywhale (cywhale)   2014-08-28 21:08:00
用grep可以传multip match
作者: pinpin (百密一疏)   2014-08-28 23:59:00
可试试data.table 不然可能要用像ff这种处理big data的pkg
作者: summitstudio (第凡斯米德费尔德)   2014-08-29 00:52:00
library(dplyr); left_join(data1,data2,by='loc')
作者: Wush978 (拒看低质媒体)   2014-08-29 23:35:00
推楼上,一直想po被抢先了. 另外附注一下, dplyr效能很好我实际测过两个百万table的left_join只需要半分钟左右
楼主: yaowei2010 (yaowei)   2014-09-02 16:13:00
感恩 没想到package强大很多 我写老半天效能超差><

Links booklink

Contact Us: admin [ a t ] ucptt.com