Re: [闲聊] 机率与统计

楼主: assss49 (帅为)   2022-08-01 15:12:15
※ 引述《iampig951753 (李白)》之铭言:
: 其实他说的完全没错
: 公正硬币来说
: 是有可能出现十次正或是十次反的
: 机率差不多千分之一
: 机率这种东西样本越大
: 越接近原本估算的百分比
: 所以才会有所谓的信赖区间
: 你做一千次去计算实际机率
: 可能不会是千分之一
: 但是丢一亿次
: 实际机率肯定会非常非常贴近千分之一
: 只要假设机率是对的
: 意思就是说 当你实验的次数越多
: 机率只会往准确的时候部分修正
: 因为事件总会发生
: 不可能永远都没发生
: 所以样本每增加一个
: 碰到事件的可能也会增加
: 夜路走多了会碰到鬼这句话
: 就是在讲述机率的真理
: 机率不是靠赛 是科学
: 不要以为1%就只是1%
: 当你打算做一万次
: 对你来说发生一次的可能性早就不是1%了
: 之前我就有提过了 独立事件的误区
: 就是忘记把机率加起来算
: 如果有个实验只有1%会死
: 你做300次还活着就给你一亿
: 跟另一个实验50%会死但是做一次没死就给一亿
: 你选哪一个?
: 独立机率的谬论支持者的逻辑来说
: 他应该选1%的
: 因为1%小于50% 每次都是独立的 懂?
: 这次1%下次当然也是1%
: 那鬼才选死亡率大50倍的
: 笑死 幼稚园白读
你的叙述让人听起来就像是:
“有一个神秘的科学神明,当有人连续踯硬币10次都出现正面,他就会改变硬币的结构、
重力场等等,让硬币出现的反面的机率上升,直到硬币正反面出现的机率会归到1/2。”
我希望你是叙述能力欠佳所以表达有点偏误,
所谓的大数法则、做无穷次的试验机率会回归,
这背后的原因也是因为你做得试验越多,
根据统计结果“预估的机率p”
接近“真实机率P”的机率也会越高,
(而事实上大部分的问题我们并不知道真实机率P是多少)
而所谓的95%信赖区间,
意思是这个测验中“真实机率P”有95%的机率会落在这个区间内,
当样本数提高 变异数 s^2 = p*q/n 则会降低,
(架设抽样至常态母体的话)
其中p=预估的机率 、 q=1-p
所以信赖区间会越来越窄,
而lim(n-> infinity)s ^2 =0 ,
所以当lim(n-> infinity)信赖区间的上界等于下界,
才会有你所谓的“回归”的现象发生,
(大数法则不严谨的解释)
而不是什么超自然的科学神明,
高中的数学就可以解答了。
但必须说实务上很多事件其实是相依事件,甚至很多时候预估就有bias…
(即便是电脑抽卡也是,内存之间会互相影响,时间种子等等因素也会影响机率)
不过为了处理上方便还是假设为独立事件,而且大部分的系统宏观上来看也可以以独
立事件来分析,但微观或是小样本的时候会有很大的偏误。这其中可以牵涉到数理统计、
测度、甚至泛函,我也是懵懵懂懂。
干一直打错字,编辑好多次。
作者: k960608 (雾羽‧浪沙)   2022-08-01 15:13:00
神无论如何都会把世界修正成1%的样子
作者: storyo11413 (小便)   2022-08-01 15:17:00
当你不是天选之人,你抽到的样本最终会回归大众不管你是首抽中奖还是开局百抽百败的例子
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:24:00
其实你认真看原原 Po 的叙述,我是觉得他已经拿很直观的比喻来解释统计机率跟古典机率的差异了。无奈的是要拿一个大众能听懂的陈述“统计机率的性质”这件事,其实我觉得没这么容易XD
作者: arrenwu (键盘的战鬼)   2022-08-01 15:27:00
楼上不妨用数学语言发篇文章? 希洽这里理工背景的很多啊就算没有很多 也不至于没一个人看得懂吧
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:28:00
无奈的是我统计机率没有强到自认能不做功课发文== 只敢推文发表看法XD
作者: smart0eddie (smart0eddie)   2022-08-01 15:28:00
这人就钓鱼的 不用认真理他
作者: shifa (西法)   2022-08-01 15:30:00
1%跟50%的实验那个不算是纯然的机率问题,而是有期望值考量的选择问题。
作者: arrenwu (键盘的战鬼)   2022-08-01 15:30:00
如果你没办法用数学语言描述 那你怎么确信你知道他在讲什么?
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:33:00
但我认知中原原 Po 的文意是想讲那三百次“实验”的 1%的表定理想机率,在后面次数的“实验”并不能保证能跟第一次的“实验”一样公正,可能更高也可能更低,假使有“类似累计误差的偏误”的机制存在,在 worse case 的情况下,在最后几次实验失败的统计机率,反而比只能做一次 50% 的实验还高。
作者: arrenwu (键盘的战鬼)   2022-08-01 15:35:00
如果实验不公正,那又怎么知道下一次实验结果的机率?
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:35:00
@arrenwu 我是从原原 Po 强调“走多夜路碰到鬼”以及很强调“实验”的句子认文意的啦,不然要写符号还要检查到不被嘘真的很累...QQ
作者: uranus013 (Mara)   2022-08-01 15:38:00
夏虫不可语冰 并不是能力不足 而是他的世界真的长这样我是觉得到此为止就好
作者: lazarus1121 (...)   2022-08-01 15:39:00
用数学的语言就是引入极限的概念吧
作者: shifa (西法)   2022-08-01 15:40:00
其实这篇就讲出来点来了。但是人对于机率的直觉往往会导致误判。恐怖的是对机率的误判往往会有一套看似完整的逻辑。
作者: LLuthor (LLuthor)   2022-08-01 15:40:00
回到芽依的问题,她10次反面,之后会有比较多的正面。这
作者: lazarus1121 (...)   2022-08-01 15:41:00
只要扯到极限,高中以前学的东西都要丢掉了
作者: LLuthor (LLuthor)   2022-08-01 15:42:00
其实机率有个很基本但重要的定律,叫做贝式定理。一般人常常就是条件机率跟一般的机率搞混。
作者: smart0eddie (smart0eddie)   2022-08-01 15:43:00
芽衣纯粹智障
作者: guogu   2022-08-01 15:43:00
攻杀小 机率不公正我们就什么屁都不用讨论了
作者: smart0eddie (smart0eddie)   2022-08-01 15:44:00
而且就算她搞懂硬币机率她FX照样会输到下海
作者: lazarus1121 (...)   2022-08-01 15:47:00
有限的例子讨论无限的理论,可以直接略过了
作者: Gjerry   2022-08-01 15:50:00
看你是 Frequentism 还是 Bayesian statistics 的角度看事情。前者会说出现这样的情形是因为试验做得不够多,后者会说硬币不是公平硬币。
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 15:53:00
推楼上
作者: guogu   2022-08-01 15:55:00
那个i莎咪挖沟的文章一开头就说是公正硬币了==而且你当硬币不公正 更应该去压正面而不是反面
作者: cybermeow (我有一只猫)   2022-08-01 16:00:00
硬币不公正当然是算posterior做posterior sampling啊
作者: XFarter (劈哩啪啦碰碰碰)   2022-08-01 16:02:00
有 我刚刚认真再看一遍硬币公正的那段论述 为什么机率会变成千分之一== 补嘘ㄌ
作者: Gjerry   2022-08-01 16:03:00
另外连续的掷硬币 frequentism 会用 geometric distribution (几何分布) 来描述整个试验,geometric distribution是 memoryless (无记忆性) 的也就是某事件发生与等待时间无关。
作者: xxxg00w0 (寒夜)   2022-08-01 16:05:00
ㄟ干 不是 现在不是暑假吗?还好我硕士毕业多年了XD一瞬间发现自己疑似走错版
作者: Gjerry   2022-08-01 16:06:00
如果相信是要用贝氏机率解释,不断地观测到某一个事件发生,会对下一次发生该事件的信心提升,确实应该压正面而不是反面。

Links booklink

Contact Us: admin [ a t ] ucptt.com