Re: [问题] 去除重复值

楼主: celestialgod (天)   2016-03-18 01:59:54
※ 引述《tHEiPHoNe ( )》之铭言:
: 请问有一组资料
: 纪录user点击item纪录
: 同一个user想踢除相邻的重复值
: 如下
: id click
: 1 a
: 1 a ->重复
: 1 b
: 1 a
: 1 c
: 1 c ->重复
: 1 a
: 1 a ->重复
: 1 b
: 1 b ->重复
: 1 b ->重复
: 1 a
: 2 a
: 2 a ->重复
: 2 b
: 2 c
: 2 a
: 2 b
: 2 c
: 请问该如何处理呢?
: 谢谢
好读版:http://pastebin.com/tC7U6MqT
library(data.table)
library(magrittr)
DT <- fread('
id click
1 a
1 a
1 b
1 a
1 c
1 c
1 a
1 a
1 b
1 b
1 b
1 a
2 a
2 a
2 b
2 c
2 a
2 b
2 c')
indx <- DT %$% paste0(id, click) %>% rle %$%
cumsum(c(1, lengths)) %>% .[1:(length(.)-1)]
DT[indx, ]
# id click
# 1: 1 a
# 2: 1 b
# 3: 1 a
# 4: 1 c
# 5: 1 a
# 6: 1 b
# 7: 1 a
# 8: 2 a
# 9: 2 b
# 10: 2 c
# 11: 2 a
# 12: 2 b
# 13: 2 c
作者: tHEiPHoNe ( )   2016-03-18 02:09:00
Useful, thanks
作者: Godkin (山里的人)   2016-03-18 11:04:00
实用!
作者: bongee (yunn)   2016-03-28 00:27:00

Links booklink

Contact Us: admin [ a t ] ucptt.com