[问题] 如何exclude 两个vectors重复的数

楼主: oliversu (oliver)   2016-01-24 14:30:21
[软件熟悉度]:
入门
[问题叙述]:
我有两个vectors
分别叫做 sampledata与controldata
controldat是从sampledata随机取样3750个
现在我想做一个treatmentdata是把 上述两个vector重复的数字删掉
然而,
因为sampledata里面本身就有重复的数字
如果使用 setdiff这个函数就会发生重复数字被删除两次
例如
sampledata{2,3,2,7,5,8,9,8}
controldata{2,8}
预期得到结果 sampledata{3,2,7,5,9,8}
我也试过%in% 的方式,但发现都无法如预期
由于资料颇大,我无法确认%in%的问题出在哪
希望大家帮帮我
我才刚开始摸索R
感谢大家
作者: andrew43 (讨厌有好心推文后删文者)   2016-01-25 02:22:00
可以的话不要这样想。应该先有一个包括所有资料的表格。其中这个表格必须有ID栏。你现在没有ID,所以怎么切都会不知道哪里出问题。又因为你有ID栏,要切资料、取交集联集都会容易很多。如果
楼主: oliversu (oliver)   2016-01-25 14:09:00
谢谢,换个切入点思考就解决了

Links booklink

Contact Us: admin [ a t ] ucptt.com