怎樣的民調是可信的?(吳統雄)

醒報編輯部 2018/05/23 07:48 點閱 9439 次
民調已成為一種商品,有市場價格、也有惡性競爭,基於生存的必需,只能削減品質,不會削減利潤。(photo by pixabay)
民調已成為一種商品,有市場價格、也有惡性競爭,基於生存的必需,只能削減品質,不會削減利潤。(photo by pixabay)

吳統雄(世新大學、臺灣大學教師)

最近許多選舉民調發表,來自不同政黨做出來的,數字各自不同,到底怎樣的民調是可信的?
台灣政黨都將民調列入選舉提名依據,但歷次選舉,多數民調機構的報告和結果常有一段距離。錯誤的民調造成錯誤的提名,影響了人民的選擇,也發生對國家發展的誤導。
調查預測產生誤差,有長期存在的老問題與環境演變的新挑戰。

一、沒有實體清冊 必須建立虛擬清冊

民意調查包括4階段作業:抽樣、測量、訪問、分析,最少有200項檢核點,每一點都有發生誤差的可能。
抽樣作業最容易出錯的是:隨機性、樣本數。
隨機性學理上意義是:每個樣本都具備相同被抽中的機會。
實務上的意義是:1.必須掌握完整母群清冊。2.被抽出的樣本不得替代。
如果採用電話簿作母群清冊,由於當前「不登記」者比率過半,已經「不完整」,必須改建立虛擬清冊如「隨機撥號法」,亦即只採用電話簿抽樣便不可信。

二、加抽替代樣本 只是增加誤差

30年前,打一輪電話可以找到70%以上的樣本,現在可能找不到15%。調查機構因成本考量,都是馬上替代樣本,當前模擬連續替代至少11輪,造成最後的誤差樣本,遠多於可推論的隨機樣本。

三、有效樣本愈高 可懷疑性愈高

許多民調出現「有效樣本」這個詞。統計定義的「有效」是針對個別問題而言,如果任一題沒有回答、或回答不合理,就是「無效」。
如果問卷很長,內含敏感性題目很多,還有很高的「有效樣本」比例,不但不是代表性高,反而是統計知識不足,甚至有作假的可能。

四、1067樣版敘述 反映大眾統計知識薄弱

臺灣民調常見有類「本調查訪問 1067 個樣本數,正負誤差約為百分之3」 的「樣版敘述」。
在學理上,這是二項分配的一個特殊情形。
在實務上的意義是:必須滿足隨機性、只有2位候選人、只問一題、每一位受訪者都回答、且「樣本獲票」兩候選人剛好各為50%時,才會符合此結論。但一般民調,幾乎全部不符其前提。

以上重大老問題,數十年未見改善。
環境演變的新挑戰很多,重要的幾項如下。

五、民調商業化 資訊系統綁死化

民調已成為一種商品,有市場價格、也有惡性競爭,基於生存的必需,只能削減品質,不會削減利潤。
同時,委託人需要民調的目的不一定是「求真」,可能是儀式、作秀、宣傳、自我安慰、甚至是要戰術性「求假」。
為何許多民調機構都「錯得一樣」?
現在調查都已資訊系統化,但市場相對狹小,所有民調機構幾乎都使用同一家的系統,以上所有錯誤,都已經「綁死」在該系統之中,大家很容易一起錯得一樣。

六、行動電話興起的挑戰與回應

2000年後行動電話興起,市內電話調查效益大幅降低,可能的解決方案有:
當前的網路大數據分析補強法。
展望未來的:「行動調查法」:使用「Google 地球」,有可能形成史上最有效益的清冊。
數位電視機上盒法:在方法論的基礎上革新,根本取消「訪問程序」,而發展「數位行為調查法」。
有些調查機構改採用:函訪、網訪,由於實務限制,可推論價值低。

七、不處理家庭分裂投票 容易發生偏誤

一個電話號碼代表的是一個家庭,但現在一般民調一個號碼只訪問一個人,等於認定一家會投同一候選人的假設。
吳統雄團隊發現,家庭分裂投票已超過3成,民調如果沒有處理「家庭異質性」的問題,顯然會發生重大誤差。

八、人類取用長期可潛移默化 短期不會乒碰叫

人類的取用行為(Adoption)會因長期的潛移默化而漸變,但短期不易因任何事件突變。過去30餘年的選舉,除了唯一319事件的例外,造成近2.4%原不投票者前往投票外,其他選舉在選前8周結果已底定。
一般的民調曲線,常見每日上下「乒碰叫」(閩南語),多是理論與方法誤差所造成。

[作者吳統雄的「取用行為國際研究團隊 Adoption Modeling」(世新大學、臺灣大學、清華大學、美國喬治亞理工)是於1983年起,在臺灣第一個進行選舉預測者,超過30年沒有任何一次誤差超過2%。]