吳統雄(世新大學、臺灣大學教師)
最近許多選舉民調發表,來自不同政黨做出來的,數字各自不同,到底怎樣的民調是可信的?
台灣政黨都將民調列入選舉提名依據,但歷次選舉,多數民調機構的報告和結果常有一段距離。錯誤的民調造成錯誤的提名,影響了人民的選擇,也發生對國家發展的誤導。
調查預測產生誤差,有長期存在的老問題與環境演變的新挑戰。
一、沒有實體清冊 必須建立虛擬清冊
民意調查包括4階段作業:抽樣、測量、訪問、分析,最少有200項檢核點,每一點都有發生誤差的可能。
抽樣作業最容易出錯的是:隨機性、樣本數。
隨機性學理上意義是:每個樣本都具備相同被抽中的機會。
實務上的意義是:1.必須掌握完整母群清冊。2.被抽出的樣本不得替代。
如果採用電話簿作母群清冊,由於當前「不登記」者比率過半,已經「不完整」,必須改建立虛擬清冊如「隨機撥號法」,亦即只採用電話簿抽樣便不可信。
二、加抽替代樣本 只是增加誤差
30年前,打一輪電話可以找到70%以上的樣本,現在可能找不到15%。調查機構因成本考量,都是馬上替代樣本,當前模擬連續替代至少11輪,造成最後的誤差樣本,遠多於可推論的隨機樣本。
三、有效樣本愈高 可懷疑性愈高
許多民調出現「有效樣本」這個詞。統計定義的「有效」是針對個別問題而言,如果任一題沒有回答、或回答不合理,就是「無效」。
如果問卷很長,內含敏感性題目很多,還有很高的「有效樣本」比例,不但不是代表性高,反而是統計知識不足,甚至有作假的可能。
四、1067樣版敘述 反映大眾統計知識薄弱
臺灣民調常見有類「本調查訪問 1067 個樣本數,正負誤差約為百分之3」 的「樣版敘述」。
在學理上,這是二項分配的一個特殊情形。
在實務上的意義是:必須滿足隨機性、只有2位候選人、只問一題、每一位受訪者都回答、且「樣本獲票」兩候選人剛好各為50%時,才會符合此結論。但一般民調,幾乎全部不符其前提。
以上重大老問題,數十年未見改善。
環境演變的新挑戰很多,重要的幾項如下。
五、民調商業化 資訊系統綁死化
民調已成為一種商品,有市場價格、也有惡性競爭,基於生存的必需,只能削減品質,不會削減利潤。
同時,委託人需要民調的目的不一定是「求真」,可能是儀式、作秀、宣傳、自我安慰、甚至是要戰術性「求假」。
為何許多民調機構都「錯得一樣」?
現在調查都已資訊系統化,但市場相對狹小,所有民調機構幾乎都使用同一家的系統,以上所有錯誤,都已經「綁死」在該系統之中,大家很容易一起錯得一樣。
六、行動電話興起的挑戰與回應
2000年後行動電話興起,市內電話調查效益大幅降低,可能的解決方案有:
當前的網路大數據分析補強法。
展望未來的:「行動調查法」:使用「Google 地球」,有可能形成史上最有效益的清冊。
數位電視機上盒法:在方法論的基礎上革新,根本取消「訪問程序」,而發展「數位行為調查法」。
有些調查機構改採用:函訪、網訪,由於實務限制,可推論價值低。
七、不處理家庭分裂投票 容易發生偏誤
一個電話號碼代表的是一個家庭,但現在一般民調一個號碼只訪問一個人,等於認定一家會投同一候選人的假設。
吳統雄團隊發現,家庭分裂投票已超過3成,民調如果沒有處理「家庭異質性」的問題,顯然會發生重大誤差。
八、人類取用長期可潛移默化 短期不會乒碰叫
人類的取用行為(Adoption)會因長期的潛移默化而漸變,但短期不易因任何事件突變。過去30餘年的選舉,除了唯一319事件的例外,造成近2.4%原不投票者前往投票外,其他選舉在選前8周結果已底定。
一般的民調曲線,常見每日上下「乒碰叫」(閩南語),多是理論與方法誤差所造成。
[作者吳統雄的「取用行為國際研究團隊 Adoption Modeling」(世新大學、臺灣大學、清華大學、美國喬治亞理工)是於1983年起,在臺灣第一個進行選舉預測者,超過30年沒有任何一次誤差超過2%。]