原原po假设台女有95%这个方法不是不行,但就不该用频率学派(Frequentist)的方法去看,
而是应该用贝氏(Bayesian)的方法去看了
https://i.imgur.com/oLjcwtg.jpg
因为原原po没有收集大量的统计,只是单纯做出假设,这个95%就相当于先验机率(Prior pr
obability),也就是P(台女)
这个机率在做统计模型时的确可以随着你的认知去定,但我们最终要找的当然需要资料验证
,也就是P(台女|实际资料)
所以正确的做法是,原原po要先去做随机抽样,因为是贝氏方法所以也不用太多,20个差不
多
然后看看里面多少个是台女,来说是一半一半50%好了(只是方便想像,实际我也不知道)
我们就要去先算出用95%的先验概率,到底多有可能得出50%这个机率,得出P(实际资料|台
女)这个概似(Likelihood)
然后概似乘上先验机率,我们才能获得实际的机率分布
这个方法的好处是P(台女|实际资料)会随着统计资料不断更新,也不需要大量统计资料,更
不会太依赖原原po的主观想法
这个方法可以再改良成连续的机率(或频密的离散机率),比方说你有多少%的台女ness,而
不是单纯是否台女二分法,我们有机会下一课再说