产生太多无用资讯,造成不必要的浪费
最简单的做法就是直接for就好
nrow <- 10L
numValueChange <- 6L
ncol <- 5e5L
st <- proc.time()
M <- matrix(sample(1:100, nrow*ncol, TRUE), nrow, ncol)
for (i in seq_len(ncol))
M[sample.int(nrow, numValueChange)] <- 0
proc.time() - st
# user system elapsed
# 1.89 0.03 1.96
# check
colSums(M == 0)
st <- proc.time()
M2 <- matrix(sample(1:100, nrow*ncol, TRUE), nrow, ncol)
ind <- replicate(ncol, sample(c(rep(TRUE, numValueChange),
rep(FALSE, nrow - numValueChange))))
M2[ind] <- 0
proc.time() - st
# user system elapsed
# 4.70 0.09 4.80
# check
colSums(M2 == 0)
※ 引述《andrew43 (讨厌有好心推文后删文者)》之铭言:
: # 决定谁要变成0的矩阵
: ind <- replicate(100, sample(c(rep(T, 6), rep(F, 4))))
: # 按ind改M
: M <- matrix(1:1000, 10, 100)
: M[ind] <- 0
: M
: # check
: apply(ind, 2, sum)
: apply(M, 2, function(x) {
: length(which(x == 0))
: })
: M
: ※ 引述《pp61022 (fight)》之铭言:
: : [问题类型]:
: : 程式咨询(我想用R 做某件事情,但是我不知道要怎么用R写出来)
: : [软件熟悉度]:
: : 使用者(已经有用R 做过不少作品)
: : [问题叙述]:
: : 请简略描述你所要做的事情,或是这个程式的目的
: : 我有一个矩阵 10*100 (n=10, p=100)
: : 我想要把这100行,每行都依比例随机选出几个值,改成指定值
: : 例如:
: : 原始资料范例
: : V1 V2 V3 .... V100
: : 1 10 5 4 .... 42
: : 2 7 15 18 .... 58
: : 3 12 10 77 .... 41
: : 4 9 18 65 .... 74
: : 5 47 57 10 .... 81
: : 6 1 46 18 .... 72
: : 7 37 9 49 .... 30
: : 8 17 8 75 .... 37
: : 9 36 14 10 .... 6
: : 10 71 36 87 .... 48
: : 每行各随机选取6个值改成我的指定值
: : 转换后资料范例
: : V1 V2 V3 .... V100
: : 1 10 5 0 .... 0
: : 2 7 0 18 .... 0
: : 3 0 10 0 .... 41
: : 4 9 0 65 .... 0
: : 5 0 0 0 .... 81
: : 6 1 46 0 .... 0
: : 7 0 0 49 .... 30
: : 8 0 8 0 .... 37
: : 9 0 0 10 .... 0
: : 10 0 0 0 .... 0
: : 我一开始是整笔资料直接*0.6 随机填成指定值,但后来回去看资料,
: : 因为n太少,很容易整行都变成指定值,但我不想要整行都被改成指定值,
: : 才想询问有没有版友知道可以怎么设定每行随机抽样的比例,谢谢大家。