不靠谱的“民调”——美国总统大选太和前方连线之二

2016年09月21日

导语：

距离美国总统选举投票日还有不到两个月时间，希拉里和特朗普谁会赢看上去越来越像是一场扔硬币的赌博。两党阵营各有数字专家不断分析选情，对普通人而言，民调是了解选情的最好风向标。可是，如果风向标出了故障呢？事实上，选举民调越来越不靠谱，并不是一种错觉。请看太和智库北美研究中心的分析。

民调的数学误差

美国主流民调有十来种，包括：CNN／ORC、NBC NEWS／SM、Reuters/IPOS、USA Today／Suffolk、ABC／Washington Post、LA Times／VSC Tracking、Economist／YouGov、IBD／TIPP等，当然还有最著名的Pew（皮尤研究中心）。

对于民调结果，大部分人只会关心谁领先，哪怕一个百分点，但媒体老手会注意另一个数字——误差率。某些情况下，误差率会使得一个点的领先变得毫无意义。一般而言，美国总统选举民调的可信度为95％、误差正负3个百分点。这是什么意思呢？通俗的说就是，做100次类似的民意调查，其中95次的结果，与现结果相比，数值差距为上下3个百分点。比如，共和党候选人支持率为48％，误差3个百分点，那就意味着他的支持率为45％到51％之间。

3个百分点只是对一名候选人支持率的误差值，如果调查是比较两人支持率，误差值会自动加倍，也就是正负6个点，那么就会出现两种情况：一是A比B的支持率高6个点以下，比如5个点，这就意味着真实情况下，A既可能以11个点的优势获胜，也可能输给B，1个点；二是A比B的支持率高6个点以上，比如8个点，那么大体上A的优势不会被质疑。也就是说，在两人支持率对比的民调中，若差距在6个点以下，鹿死谁手犹未可知。

这还只是两人对比，如果加上第三个候选人，误差就会更大。因此，尽管美国总统选举中两党之外的第三者历来只是陪衬，但他的加入会让民调结果和准确度产生非常大的变化。至于各家经常公布的主体民调结果下面的次级调查结果，比如年轻人、女性或者拉美裔对候选人的支持率，乍看上去调查似乎更为细致，让人觉得更可信，其实误差更大。

民调的立场操弄

这些还只是民调不准确的单纯数学原因，从理论上讲是可以修正的。此前一般的判断是，即使一个民调有偏差，但如果10个民调结果大体一样，至少可以展示出一种趋势。问题是，现在经常出现民调一起走眼的情况，比如2014年美国中期选举，没人预料到共和党大获全胜；2014年以色列大选，集体低估了内塔尼亚胡的强势；2014年英国选举，事先同样没发现保守党能轻松取胜；还有最近的英国脱欧公投。当媒体不断感叹黑天鹅的时候，也许真正原因是，他们戴着有色眼镜，而这一届天鹅本来就全是黑的。

诛心之论不多说，作为民调的发布平台，媒体各有立场。西方媒体，大部分由所谓左派或者叫自由派控制，历史经验显示，为了情怀，歪曲或者隐藏点事实是常有之事。事实上，媒体发布民调，的确可以作为武器影响选举结果，最简单一种，美国不少州投票时间有限，早8点到晚8点，赶上工作日，有些人一看差距太大，加上请假不便，就不去投票站了。从道理上说，选民还可以邮寄投票，实际上，大家都知道，除非票数非常接近，否则那些邮寄的选票不会被清点。

更极端的情况下，假如一方心中有数，投票的时候，支持自己的选票会比民调时多，那么自然可以更明目张胆地使用民调武器，反正结果会证明民调优势的准确性。可是，选票怎么会突然多起来呢？正常情况下，组织力强，人心所向，所有支持者都出现在投票站。不正常的情况，自然是假选票，不一定是选票造假，还有可能让没投票资格的人顶替有资格却不去投票的合法选民。在美国，许多州不许在投票站查验投票人身份证件，称此举属于歧视，影响少数族裔投票积极性，共和党反对这样做，要求严审，但最近法院刚又裁定，三个州查ID的政策违法。这下可以理解为什么有些候选人那么宠爱非法移民了吧。

民调的操作困境

抛开故意造假，从技术角度说，如今民调结果越来越离谱的原因在于，相对准确的民调越来越难以操作，不得不更多依赖数学模型设计中的权重因素来调节。

造成这种情况的根源是手机的广泛使用（2014年美国手机用户占人口60％）。以前民调主要用电话，随机打到固定电话上，回答完提问给机主一点钱作为报酬。但现在美国人都用手机了，而愿意用手机完成调查的美国人比例不高。根据PEW的调查回应率数据，上世纪70年代为80％，1997年降为36％，2014年只有8％，现在大概打20000个电话，能有1000个完成答卷就不错。也就是说，可能只有社会中特定的一小部分人有兴趣参加民调，这种民调准确性显然大打折扣。更讨厌的是，回应率奇低进一步造成民调成本成倍增加，2008年到2014年已经加倍。调查机构没那么多钱，调查员就会去找那些容易找到的人做民调，也就是说，可能只有社会中特定的一部分人会接触到民调，这样就是折上折。调查机构没办法，只好让数学家设计，某一类人群和某一类人群计算权重不一样，于是这事最后就有点像奥运会体操比赛打的表演分了，同时也像体操比赛一样有了很多人为插手的机会，还不好说它不科学，数学问题一定程度上变成了“艺术”问题。

研究机构的选举预测模型也有同样尴尬，数据不行，怎么调整看着都不靠谱。弗吉尼亚大学政治研究中心有个知名的预测体系"水晶球"，8月发布预测结果说特朗普获胜几率51.4％，希拉里48.6%。但公布之后，不知道是不是看跟别家结果反着不好意思，自己又推翻了此前的结论，理由是特朗普和历史上所有候选人都不一样，不喜欢他的民众比例过高，所以旧模型不完全适用，根据最近民调，还是希拉里获胜机会大。问题是，其他多家民调结果显示，不喜欢希拉里的人群比例似乎与特朗普不相上下。

民调是薛定谔的猫

这些问题民调专家都知道，怎么解决？貌似目前没有良方。事实上，他们尝试过新的方案，却搞得更复杂，好似补丁摞补丁。鉴于选民很可能不去投票，为了准确，很多机构的调查问卷中常出现"有投票意向的选民"，可这个概念又怎么界定呢？路透的问卷可能包括12个相关问题来判定，而别家可能是15个，各自问卷每道题的计算分数又不一样。所以，其实没有一个统一的标准来确定哪些选民会去投票。于是，有些机构又回过头强调"有过投票经历的选民"，但是这样的选民只能从此前的投票注册名单上找，还是会把那些重新焕发出投票热情的选民排除在外，势必导致结果不准确。还有些机构尝试互联网调查，可是2014年数据，占选民比例22%的美国65岁以上老年人中，4成不用互联网，调查的准确性还是无法保证。

民调仍有价值

其一，各家对比后显露的趋势性可供参考。

其二，看媒体发布的民调稿的语气。闪光灯总是喜欢照着胜利者，一旦真的发现某人胜算极大，无论原先立场如何，媒体一定会跟在屁股后边唱赞歌，拐弯抹角地称颂候选人魅力无边，竞选团队算无遗策。

最后，看里边的小门道。比如ABC／Washington Post9月5日－8日的民调，误差正负4.5，结果是希拉里支持率46％，特朗普41％，另外两个独立候选人2％和1％，还有其它什么的。了解了误差率的知识，这结果看看就好了。有意思的可能是另外一组，特朗普的支持者中对候选人非常有信心的占46％，非常紧密关注选战的占60％，肯定会去投票的占93％，相比之下，希拉里这三项分别是33％、45％和80％。11月结果出来后，咱们再来看，真正的玄机可能就在这里头。

太和智库原创文章，转载请注明出处。
—————————————————
国以人兴，政以才治。太和智库，关注时代需要。
微信公众号：taihezhiku