怎樣的民調是可信的?(吳統雄)

民調已成為一種商品，有市場價格、也有惡性競爭，基於生存的必需，只能削減品質，不會削減利潤。（photo by pixabay)

吳統雄（世新大學、臺灣大學教師）

最近許多選舉民調發表，來自不同政黨做出來的，數字各自不同，到底怎樣的民調是可信的?
台灣政黨都將民調列入選舉提名依據，但歷次選舉，多數民調機構的報告和結果常有一段距離。錯誤的民調造成錯誤的提名，影響了人民的選擇，也發生對國家發展的誤導。
調查預測產生誤差，有長期存在的老問題與環境演變的新挑戰。

一、沒有實體清冊必須建立虛擬清冊

民意調查包括4階段作業：抽樣、測量、訪問、分析，最少有200項檢核點，每一點都有發生誤差的可能。
抽樣作業最容易出錯的是：隨機性、樣本數。
隨機性學理上意義是：每個樣本都具備相同被抽中的機會。
實務上的意義是：1.必須掌握完整母群清冊。2.被抽出的樣本不得替代。
如果採用電話簿作母群清冊，由於當前「不登記」者比率過半，已經「不完整」，必須改建立虛擬清冊如「隨機撥號法」，亦即只採用電話簿抽樣便不可信。

二、加抽替代樣本只是增加誤差

30年前，打一輪電話可以找到70％以上的樣本，現在可能找不到15％。調查機構因成本考量，都是馬上替代樣本，當前模擬連續替代至少11輪，造成最後的誤差樣本，遠多於可推論的隨機樣本。

三、有效樣本愈高可懷疑性愈高

許多民調出現「有效樣本」這個詞。統計定義的「有效」是針對個別問題而言，如果任一題沒有回答、或回答不合理，就是「無效」。
如果問卷很長，內含敏感性題目很多，還有很高的「有效樣本」比例，不但不是代表性高，反而是統計知識不足，甚至有作假的可能。

四、1067樣版敘述反映大眾統計知識薄弱

臺灣民調常見有類「本調查訪問 1067 個樣本數，正負誤差約為百分之3」的「樣版敘述」。
在學理上，這是二項分配的一個特殊情形。
在實務上的意義是：必須滿足隨機性、只有2位候選人、只問一題、每一位受訪者都回答、且「樣本獲票」兩候選人剛好各為50％時，才會符合此結論。但一般民調，幾乎全部不符其前提。

以上重大老問題，數十年未見改善。
環境演變的新挑戰很多，重要的幾項如下。

五、民調商業化資訊系統綁死化

民調已成為一種商品，有市場價格、也有惡性競爭，基於生存的必需，只能削減品質，不會削減利潤。
同時，委託人需要民調的目的不一定是「求真」，可能是儀式、作秀、宣傳、自我安慰、甚至是要戰術性「求假」。
為何許多民調機構都「錯得一樣」？
現在調查都已資訊系統化，但市場相對狹小，所有民調機構幾乎都使用同一家的系統，以上所有錯誤，都已經「綁死」在該系統之中，大家很容易一起錯得一樣。

六、行動電話興起的挑戰與回應

2000年後行動電話興起，市內電話調查效益大幅降低，可能的解決方案有：
當前的網路大數據分析補強法。
展望未來的：「行動調查法」：使用「Google 地球」，有可能形成史上最有效益的清冊。
數位電視機上盒法：在方法論的基礎上革新，根本取消「訪問程序」，而發展「數位行為調查法」。
有些調查機構改採用：函訪、網訪，由於實務限制，可推論價值低。

七、不處理家庭分裂投票容易發生偏誤

一個電話號碼代表的是一個家庭，但現在一般民調一個號碼只訪問一個人，等於認定一家會投同一候選人的假設。
吳統雄團隊發現，家庭分裂投票已超過3成，民調如果沒有處理「家庭異質性」的問題，顯然會發生重大誤差。

八、人類取用長期可潛移默化短期不會乒碰叫

人類的取用行為(Adoption)會因長期的潛移默化而漸變，但短期不易因任何事件突變。過去30餘年的選舉，除了唯一319事件的例外，造成近2.4％原不投票者前往投票外，其他選舉在選前8周結果已底定。
一般的民調曲線，常見每日上下「乒碰叫」（閩南語），多是理論與方法誤差所造成。

[作者吳統雄的「取用行為國際研究團隊 Adoption Modeling」（世新大學、臺灣大學、清華大學、美國喬治亞理工）是於1983年起，在臺灣第一個進行選舉預測者，超過30年沒有任何一次誤差超過2％。]

台灣醒報

最新熱門

熱門新聞

熱門副刊文章