PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
R_Language
[问题] 有关于bootstrapping的谜思
楼主:
lenofire
(lenofire)
2016-10-26 19:13:44
我看完了一些文献,想要做bootstrapping 的resample(随机抽样)以达成减少多数类别
问题(一 使用bootstrapping后该如何看随机抽样结果?
问题(二 使用bootstrapping是需要把三类别一起放进去才能运作?
问题(三 我是该输人哪句指令?用这句但没反应
http://i.imgur.com/ggcnikf.jpg
作者:
andrew43
(讨厌有好心推文后删文者)
2016-10-26 21:04:00
看不懂你做bootstrap的目的然后…你的三个问题虽是中文但我没有一句看得懂的...
楼主:
lenofire
(lenofire)
2016-10-26 21:49:00
我boostrap 目的是为了做随机抽选,但我不会做这动作
作者:
clansoda
(小笨)
2016-10-26 22:24:00
随机抽样会用到bootstrap吗? 这不是用来减少variance吗
作者:
abc2090614
(casperxdd)
2016-10-26 22:33:00
感觉你搞错bootstrap的意思
作者:
andrew43
(讨厌有好心推文后删文者)
2016-10-26 23:35:00
嗯。还是不知道你在说什么。可否再说白一点?
作者:
cywhale
(cywhale)
2016-10-26 23:45:00
看不懂问题+1 不过你执行完打a enter 就会有反应了 真的
楼主:
lenofire
(lenofire)
2016-10-26 23:55:00
我简单来说就是要用拔靴法做resample 但不懂看结果Bootstrap 本来就会做随机抽选 而且可以用于undersample问题
作者:
andrew43
(讨厌有好心推文后删文者)
2016-10-27 00:37:00
那段原码跑不出来正常,因为它少了一个括号。它的意思是从x中抽出且放回10个取平均,这样100次。“以达成减少多数类别”到底是?
作者:
celestialgod
(天)
2016-10-27 00:52:00
统计应该都称bootstrapping 没有再用bootstrap吧
作者:
cywhale
(cywhale)
2016-10-27 09:48:00
随机抽选没错,但你问题中多数类别、三类别指的是什么?~~
楼主:
lenofire
(lenofire)
2016-10-27 11:20:00
我是不懂是只用把A类放进去随机抽选就好了吗
http://i.i
mgur.com/2MpNdoy.jpg
http://i.imgur.com/tz4nQX5.jpg
作者:
clansoda
(小笨)
2016-10-27 11:37:00
imbalance data?你可以试试看ROSE package 里面也是用你说的bootstrapin来作为oversample undersample 与 人造资料的用途这个是参考网站
https://goo.gl/iBM5JV
楼主:
lenofire
(lenofire)
2016-10-27 11:56:00
我先看 谢谢了可是这个不能用在多分类上
作者:
andrew43
(讨厌有好心推文后删文者)
2016-10-28 00:47:00
原po要不要再把实际需求明确地描述一次?或是举一个简单的例子但明确地说明你想做什么事
楼主:
lenofire
(lenofire)
2016-10-28 09:15:00
更新了
作者:
andrew43
(讨厌有好心推文后删文者)
2016-10-28 13:20:00
老实说我并没有看懂。例如,你每一次bootstraping后要做或收集什么统计量?如果你不说明白,老实说,bootstraping本身不必管类别就只是单纯抽出且放回而已。例如你有三组,那就三组都做抽100个取统计量共10000次。这样不就是“平衡”了?
楼主:
lenofire
(lenofire)
2016-10-28 14:03:00
http://i.imgur.com/Jlit7jI.jpg
作者:
clansoda
(小笨)
2016-10-28 14:12:00
我想你需要把你的资料型态解释一下,这样很难猜测classification problem的binary classification就会有常见的imbalance data,所以target variable要是两个是很正常的,像是EMAIL是不是垃圾信这种,就会有这个问题,但是我现在看不太懂你的资料型态,所以只能猜
楼主:
lenofire
(lenofire)
2016-10-28 15:07:00
没错,但有时候会遇上多分类情况 ,的确binary classification 是常见的情况
作者:
andrew43
(讨厌有好心推文后删文者)
2016-10-28 15:19:00
既然您不明说,我也帮不了你了。
继续阅读
[问题] 跑同个程式储存影像档的大小却不同
PhysicsBoy
[问题] 排序 ( 按照 设定 的顺序 )
f496328mm
[问题] 请问 dr packages 中 维度缩减的方法
f496328mm
[问题] 求jackknife variance estimator的套件?
phil5566
[问题] lineprof 可否决定层数?
Edster
[问题] Rmarkdown evaluation
clansoda
Re: [问题] 计算重复次数
celestialgod
[问题] optim函数代不同初始值解出的解都不同?
phil5566
[问题] 计算重复次数
jasonfun44
Re: [问题] for loop 循环命名变量
celestialgod
Links
booklink
Contact Us: admin [ a t ] ucptt.com