※ 引述《corm1233 (亚可力伕)》之铭言:
: 美丽岛电子报每过几天就会发布民调数据
: 但有些数据过于诡异
: 直接附图
: https://i.imgur.com/N2S0kDR.jpg
: https://i.imgur.com/49ncjkt.jpg
: 比较有争议点的是两位候选人的支持度在那两周内都有不小幅度的变化
: 1. 20-29岁赖清德的支持度两周跌了快10%
: 2. 30-39岁赖清德的支持度从20%涨到37%
: 3. 20-29岁柯文哲的支持度更是在10/24-10/25涨了21%,隔没几天又跌回去之前的%数,
: 感觉很像是吴子嘉对柯P别有所求,所以特别提高民调来表达意图?
: 4. 30-39岁柯文哲的支持度也是在没有什么重大事件下,两周内跌了快一半
: 以上几点都能看出美丽岛电子报的民调很诡异
: 涨幅的大小像极了在坐云霄飞车
这个不奇怪,需要结合现在的市话执行实务,以及统计原理来看。
现状下,市话原始找到20-29岁、30-39岁的样本常常都只在5%上下而已,
所以用您的表来看,主要是想比三天一波的1200份样本的波动,
(表中有些是两天的样本,不知是否是误植,美丽岛应无公布两天的样本)
那么加权前数据,就会是20-29岁及30-39岁的样本数各为60份左右。
60份的统计误差是多少呢?答案是约正负12.7%
以您举的最极端的柯文哲为例,
假如他在那段期间20-29岁的真实支持率是33%,
那么调查出来他的民调支持率区间在20.3%-45.7%都是合理的。
因此市话调查的细项,通常无法直接参阅,
如果想要参阅的话,建议要把样本努力的整并起来,
我自己会习惯整并超过4000份以上的美丽岛样本后才会看细项,
不然偏误会很大,也会出现上述的云霄飞车情况导致误读。
至于加权,那是在总体数据上,
去让基本特性去符合母体分布(年龄、性别、地域、教育程度)
但不太会改变原本加权前的个别比例(变动很小)。
也就是说,能让20-29岁占的总体比重,
从原始数据的5%上升到符合母体的接近15%,
但是这年龄层的支持意向的比例不太会因加权产生变化。
这也导致滚动式民调在近年来波动会比过去大,
只要某一天的年轻样本抽样偏差较大,
加权后就会让偏差被进一步放大,从而导致波动变大。
所以市话民调如果有加权前的数字可参阅的话,
会建议一并参阅综合判断,才能得到更客观的结果。