新头壳newtalk
洪圣斐 编译报导
大数据专家:无法解决系统误差 美今年大选民调会比4年前更失真
随着美国大选日逼近,每天都有新的民调浮现。各国观察家们发现,这次大选民调与4年前
的走势非常相近。4年前开票结果推翻绝大多数民调预测的震惊结局,也让人对当前的民调
半信半疑。分析大数据新闻的美国媒体《Datanami》总编伍迪(Alex Woodie)稍早撰文指
出,系统误差(Systemic Errors)没有解决,可能使民意调查的预测力比2016年还要差。
伍迪指出,所有民意调查均会出现统计错误或随机错误。设计者可以借由增加样本数来减少
统计误差,但永远不能完全消除这些误差。好的调查单位会公开他们的误差范围(通常在3
%到6%),并在公布调查结果时揭露这项资讯。
但是在2016年,民意调查人员无法解释统计误差以外的其他误差来源,也无法说明所使用的
数据和统计方法中的系统误差。追踪各种政治民调的数据分析公司赛仕电脑软件(SAS Insti
tute Inc.)全球业务负责人本内特(Steve Bennett)表示,这些系统误差使2020年大选难
以预测。
他说:“这些系统误差所面临的挑战是,您通常无法完全估计它们的严重程度。” “您真
的不知道,这会带来挑战。”
当前投票以及2016年进行的投票导致系统误差的一个原因是无法准确掌握谁将在选举日实际
出席投票。拜武汉肺炎疫情所赐,这次更难掌握谁会邮寄选票或在投票站投下选票。
民调使用的统计模型主要基于先前选举的人口统计结果。 2016年他们高估了非裔选民出门
投票的意愿,原因可能是前两次大选非裔在选票上有欧巴马时倾巢而出。民调也未能准确掌
握没有受大学教育的白人选民之投票意向。同样是共和党总统候选人,他们在2008年对罗姆
尼以及2012年对罗姆尼的支持都不高,但在2016年却已相当大的比例支持川普。
本内特说,民意测验者用来确定可能的选民的统计模型在2016年没有成功,在2020年很可能
将再次无法准确预测的实际选民。他说,2016年的民意测验的缺点如今仍然存在。
本内特说,以前可以依靠过去的3到4次选举来预测当前选举中的投票率和选民模型。但这个
方法在2016年失败,在2020年也很可能会再次失败。
系统误差的另一个来源是川普的选民中有一群不表态的,或者在接受民调时会说谎的。本内
特研究发现,这些选民会让调查的结果失准2%至6%。
https://newtalk.tw/news/view/2020-10-08/476750
备注: