※ 引述《tom982239 (yao)》之铭言:
: 只学过一些基础的机率统计,但我感觉这个题目就怪怪的:
: 首先,问卷第一题若选A就不可能选B
: ,第二题若选C就不可能选B,这两两是互斥的
: 并且,A和C互相不独立,两者是存在相关性的
: 最后,在第一题跟第二题中的B也应该是不同的,因为它depends on A, C。
: 整个思考一遍后,似乎大家把A, B, C当随机变量,但是这没办法清楚的定义问题。请问各位
: 统计大神怎么样定义问题会比较好?
: 我个人目前想法:
: 设母体是全台湾选民,母体对于柯侯配是否支持是一个随机变量X,母体对于侯柯配是否支持
: 是另一个随机变量Y
: 支持组合就+1,反过来支持对手就-1,两边都不支持就是0,因此:
: X = +1, -1, 0,sample space是A, B, 弃票
: Y = +1, -1, 0,sample space是C, B, 弃票
: 这样定义的话,第一题真实投柯侯比例为P(X = +1),真实投赖萧比例为P(X = -1)
: X期望值为E(X) = +1 P(1) -1 P(-1) = P(1) - P(-1),是选民对柯侯配支持度的期望值,等
: 于1就是支持,等于-1表示不但反对还投给对手,等于0表示打平
: 同理,把X代换成Y可得到第二个问题
: 那E(X-Y) 应为柯侯配与侯柯配支持度差距的期望值
: 最后要检验是否存在显著差异,但我对检定没有很熟,以下是我想得到的适用检定:
: 因为是从同一个母体抽样得到的单一sample set,再对单一sample set做不同性质的观察,
: 使用paired t-test来检验两种组合的支持度差距是否存在显著差异。
: 若没有显著差距就表示误差范围内,依照合约侯柯配赢,若存在显著差异就是胜者赢。
: 以上,希望有统计大神可以对定义提出建议和指正,或是可以提出更清楚定义这个问题的方
: 法,帮忙厘清一下真相
用简化的模型算
假定所有民调都是1068份,抽样误差是3%
A&B完全负相关 C&B也完全负相关 无废票存在
则A-B的抽样误差是2*3%=6% 同理C-B也是
再比较(A-B)与(C-B)之差
假设两者不相关(独立事件)
则抽样误差是sqrt2*6%=8.484%
如果两者完全正相关(投A必会投C)
抽样误差可以为0
因为这个范围太大了
所以有人取6%有人取3%
就是取两者完全相关或不相关间的任一可能值
甚至如果你取完全负相关(投A绝不会投C)
你可以得到12%的抽样误差
但实务上A&C不可能负相关
目前的理解是这样
但我不是统计专业
以上是用找到的公式套起来的结果