不靠谱的“民调”——美国总统大选太和前方连线之二

2016年09月21日

导语:

距离美国总统选举投票日还有不到两个月时间,希拉里和特朗普谁会赢看上去越来越像是一场扔硬币的赌博。两党阵营各有数字专家不断分析选情,对普通人而言,民调是了解选情的最好风向标。可是,如果风向标出了故障呢?事实上,选举民调越来越不靠谱,并不是一种错觉。请看太和智库北美研究中心的分析。
 

 

民调的数学误差

 

美国主流民调有十来种,包括:CNN/ORC、NBC NEWS/SM、Reuters/IPOS、USA Today/Suffolk、ABC/Washington Post、LA Times/VSC Tracking、Economist/YouGov、IBD/TIPP等,当然还有最著名的Pew(皮尤研究中心)。

 

对于民调结果,大部分人只会关心谁领先,哪怕一个百分点,但媒体老手会注意另一个数字——误差率。某些情况下,误差率会使得一个点的领先变得毫无意义。一般而言,美国总统选举民调的可信度为95%、误差正负3个百分点。这是什么意思呢?通俗的说就是,做100次类似的民意调查,其中95次的结果,与现结果相比,数值差距为上下3个百分点。比如,共和党候选人支持率为48%,误差3个百分点,那就意味着他的支持率为45%到51%之间。

 

 

3个百分点只是对一名候选人支持率的误差值,如果调查是比较两人支持率,误差值会自动加倍,也就是正负6个点,那么就会出现两种情况:一是A比B的支持率高6个点以下,比如5个点,这就意味着真实情况下,A既可能以11个点的优势获胜,也可能输给B,1个点;二是A比B的支持率高6个点以上,比如8个点,那么大体上A的优势不会被质疑。也就是说,在两人支持率对比的民调中,若差距在6个点以下,鹿死谁手犹未可知。

 

这还只是两人对比,如果加上第三个候选人,误差就会更大。因此,尽管美国总统选举中两党之外的第三者历来只是陪衬,但他的加入会让民调结果和准确度产生非常大的变化。至于各家经常公布的主体民调结果下面的次级调查结果,比如年轻人、女性或者拉美裔对候选人的支持率,乍看上去调查似乎更为细致,让人觉得更可信,其实误差更大。

 

民调的立场操弄

 

这些还只是民调不准确的单纯数学原因,从理论上讲是可以修正的。此前一般的判断是,即使一个民调有偏差,但如果10个民调结果大体一样,至少可以展示出一种趋势。问题是,现在经常出现民调一起走眼的情况,比如2014年美国中期选举,没人预料到共和党大获全胜;2014年以色列大选,集体低估了内塔尼亚胡的强势;2014年英国选举,事先同样没发现保守党能轻松取胜;还有最近的英国脱欧公投。当媒体不断感叹黑天鹅的时候,也许真正原因是,他们戴着有色眼镜,而这一届天鹅本来就全是黑的。

 

 

诛心之论不多说,作为民调的发布平台,媒体各有立场。西方媒体,大部分由所谓左派或者叫自由派控制,历史经验显示,为了情怀,歪曲或者隐藏点事实是常有之事。事实上,媒体发布民调,的确可以作为武器影响选举结果,最简单一种,美国不少州投票时间有限,早8点到晚8点,赶上工作日,有些人一看差距太大,加上请假不便,就不去投票站了。从道理上说,选民还可以邮寄投票,实际上,大家都知道,除非票数非常接近,否则那些邮寄的选票不会被清点。

 

更极端的情况下,假如一方心中有数,投票的时候,支持自己的选票会比民调时多,那么自然可以更明目张胆地使用民调武器,反正结果会证明民调优势的准确性。可是,选票怎么会突然多起来呢?正常情况下,组织力强,人心所向,所有支持者都出现在投票站。不正常的情况,自然是假选票,不一定是选票造假,还有可能让没投票资格的人顶替有资格却不去投票的合法选民。在美国,许多州不许在投票站查验投票人身份证件,称此举属于歧视,影响少数族裔投票积极性,共和党反对这样做,要求严审,但最近法院刚又裁定,三个州查ID的政策违法。这下可以理解为什么有些候选人那么宠爱非法移民了吧。

 

民调的操作困境

 

抛开故意造假,从技术角度说,如今民调结果越来越离谱的原因在于,相对准确的民调越来越难以操作,不得不更多依赖数学模型设计中的权重因素来调节。

 

造成这种情况的根源是手机的广泛使用(2014年美国手机用户占人口60%)。以前民调主要用电话,随机打到固定电话上,回答完提问给机主一点钱作为报酬。但现在美国人都用手机了,而愿意用手机完成调查的美国人比例不高。根据PEW的调查回应率数据, 上世纪70年代为80%,1997年降为36%,2014年只有8%,现在大概打20000个电话,能有1000个完成答卷就不错。也就是说,可能只有社会中特定的一小部分人有兴趣参加民调,这种民调准确性显然大打折扣。更讨厌的是,回应率奇低进一步造成民调成本成倍增加,2008年到2014年已经加倍。调查机构没那么多钱,调查员就会去找那些容易找到的人做民调,也就是说,可能只有社会中特定的一部分人会接触到民调,这样就是折上折。调查机构没办法,只好让数学家设计,某一类人群和某一类人群计算权重不一样,于是这事最后就有点像奥运会体操比赛打的表演分了,同时也像体操比赛一样有了很多人为插手的机会,还不好说它不科学,数学问题一定程度上变成了“艺术”问题。

 

 

研究机构的选举预测模型也有同样尴尬,数据不行,怎么调整看着都不靠谱。弗吉尼亚大学政治研究中心有个知名的预测体系"水晶球",8月发布预测结果说特朗普获胜几率51.4%,希拉里48.6%。但公布之后,不知道是不是看跟别家结果反着不好意思,自己又推翻了此前的结论,理由是特朗普和历史上所有候选人都不一样,不喜欢他的民众比例过高,所以旧模型不完全适用,根据最近民调,还是希拉里获胜机会大。问题是,其他多家民调结果显示,不喜欢希拉里的人群比例似乎与特朗普不相上下。

       

民调是薛定谔的猫

 

这些问题民调专家都知道,怎么解决?貌似目前没有良方。事实上,他们尝试过新的方案,却搞得更复杂,好似补丁摞补丁。鉴于选民很可能不去投票,为了准确,很多机构的调查问卷中常出现"有投票意向的选民",可这个概念又怎么界定呢?路透的问卷可能包括12个相关问题来判定,而别家可能是15个,各自问卷每道题的计算分数又不一样。所以,其实没有一个统一的标准来确定哪些选民会去投票。于是,有些机构又回过头强调"有过投票经历的选民",但是这样的选民只能从此前的投票注册名单上找,还是会把那些重新焕发出投票热情的选民排除在外,势必导致结果不准确。还有些机构尝试互联网调查,可是2014年数据,占选民比例22%的美国65岁以上老年人中,4成不用互联网,调查的准确性还是无法保证。

 

 

民调仍有价值

 

其一,各家对比后显露的趋势性可供参考。

 

其二,看媒体发布的民调稿的语气。闪光灯总是喜欢照着胜利者,一旦真的发现某人胜算极大,无论原先立场如何,媒体一定会跟在屁股后边唱赞歌,拐弯抹角地称颂候选人魅力无边,竞选团队算无遗策。

 

最后,看里边的小门道。比如ABC/Washington Post9月5日-8日的民调,误差正负4.5,结果是希拉里支持率46%,特朗普41%,另外两个独立候选人2%和1%,还有其它什么的。了解了误差率的知识,这结果看看就好了。有意思的可能是另外一组,特朗普的支持者中对候选人非常有信心的占46%,非常紧密关注选战的占60%,肯定会去投票的占93%,相比之下,希拉里这三项分别是33%、45%和80%。11月结果出来后,咱们再来看,真正的玄机可能就在这里头。

 

 

太和智库原创文章,转载请注明出处。
—————————————————
国以人兴,政以才治。太和智库,关注时代需要。
微信公众号:taihezhiku