推 laoabo: 市话加权前侯赢5%,加权后落后3%? 223.137.84.233 09/13 08:50
推 laoabo: 然后我们一般不是都说要做到最少1000多份 223.137.84.233 09/13 08:56
→ laoabo: ,可是市话700份拿手机300份来凑,这样不 223.137.84.233 09/13 08:56
→ laoabo: 是等同市话手机都分别不达标,然后加权模 223.137.84.233 09/13 08:56
→ laoabo: 式也怪怪,怎么会加权前+5加权后-3,是不 223.137.84.233 09/13 08:56
→ laoabo: 是在母体上没有照人口分布直接用加权和手 223.137.84.233 09/13 08:56
→ laoabo: 机去平衡?好想知道这是谁设计还是外包给 223.137.84.233 09/13 08:56
→ laoabo: 谁做的?不知道有没有民调熟手帮忙解释 223.137.84.233 09/13 08:56
做民调简单一个概念,就是希望要尽可能满足“随机性”,
也就是说任何合格选民都有可能被抽样到,
在这样的前提下,做1068份的成功样本,
依照统计原理,可以说它在95%的信心区间内,
可以与母体真正的结果相距正负3%内。
用白话说就是抽100次,会有95次至少落在这个正负3%区间内。
因此既然关键是满足随机性,
无论是用市话做、用手机做、用网络做,
只要有办法做到这一点,那用什么做都没差,
这就是为什么它可以直接把市话700加上手机300来凑,
而不是分别都做到1068份以上。
大家通常会有问题的是,那为什么要做这样的混合?
主要也是大家都清楚的,市话比例越来越低,
几乎是人手一支手机,所以有可能只有市话来调查,
会找不到那种只用手机的族群。
可是只用手机会不会有问题,自然也是有它的硬伤,
除了成本比较高之外,
一来手机号码无法判别受访者所在区域,
所以一开始在抽取样本阶段时,在“户籍地”这块偏差就比较大;
二来因为要满足“随机性”,但大家用手机的习惯不同,
有可能愿意接陌生人手机,和不愿意接的人,
投票行为会有显著差异,这样就等于只会问到前者的意见,
同样也会有所偏差。
用市话最大的问题当然是涵括性较差,
但除非我们很明确知道说,家里有装市话、与家里没装市话的族群,
这两者的投票行为可能也有很大差异的话,
那么市话还是有一定参考价值。
例如市话只能找到40%的人群,
可是如果这40%的人群,和整体100%的人群特质无甚差异的话,
就还是有一定的推论价值。
而在做市话的时候,会尽量做类似“户中抽样”的举动,
也就是不单只是问接到电话的那个人,
避免说家中常接电话的人的意向,与其他家人会有明显差别,
所以会用电话号码尾数来决定要访问家中哪个合格选民。
只是市话也确实找到年轻人的比例明显偏低,
所以最后还需要做加权矫正,这个动作是无论用哪种调查方法,
都是会做这样的加权,以让样本的结构,符合母体的结构。
以这次调查来说,没意外也是先把市话及手机的成功样本先统合,
(整体样本做统合,精细一点就是也另外拆分去看,
但拆分完后,个别的样本数又变太少,误差区间过大,
我是觉得意义没那么大)
先检定性别、年龄、户籍地、教育程度有没有符合母体结构,
通常很难一开始就会符合,所以都会加权处理。
多重加权的目的,在于加权一次之后,
可能年龄符合母体比例了,但是户籍地或教育程度不符合,
那就继续加权,直到年龄、性别、户籍地、教育程度在统计检定上,
都与母体无显著差异为止,这算是正常操作,
倒不是有意说要特别偏坦谁。
也因为有了所谓的加权,所以当样本一开始结构和母体差很多时,
例如年轻人应该占母体30%,可是样本只有15%时,
那加权完后,样本里的年轻人意见就会变成两倍重要,
(先不管多重加权后,真正的权值应该不是两倍这件事)
所以类似柯文哲这种年轻人支持率较高的参选人,
就容易出现加权前落后,加权后反超的现象。
至于是不是要做市话混手机,当然学界都各有看法,
主流看法是混一下比较好,比例也大概是抓70-30,
但这也没有严格的学理依据说是要这样混。
而在手机没办法克服辨识户籍地之前,
除了总统大选这类全国性选举外,在地方选举几乎不可用,
这也是手机民调的侷限之一。