民調帶風向 選民要擦亮眼 (吳統雄)

吳統雄 / 世新大學資訊管理系前主任 2023/06/01 17:35 點閱 5005 次
選舉民調滿天飛,可從抽樣、機構效應等角度觀察民調是否可信。(美麗島電子報)
選舉民調滿天飛,可從抽樣、機構效應等角度觀察民調是否可信。(美麗島電子報)

選舉民調滿天飛,各個候選人排名不同,甚至相反。普通人民如何判斷哪些民調可提供參考趨勢?哪些民調又只是在帶風向呢?
以下是幾項簡單又重要的建議。

一、單一民調均不宜推論

坊間電話民調都宣稱:「在日至日(通常不超過3日),以年滿20歲設籍在台北市的民眾為母體,採用電腦輔助電話訪問方式進行調查,成功完訪**人,在信賴水準95%下,抽樣誤差最大值為±3.0%。」此敘述一定是不正確的,可稱為「資訊系統綁架困境」。

預設為「二項分配」

因為國內幾乎所有民意調查公司都是使用玉瑪系統(WIN-CAMI電腦輔助電話調查系統),玉瑪系統是預設兩人競選的狀況,在專業上稱為預設為「二項分配」。 即只有在兩人競選下,「『若』完訪1067人,在信賴水準95%下,抽樣誤差最大值為±3.0%。」

不過本次總統是三人競選,且該系統不能更改預設的人數,亦即無法使用正確的機率分配推算,所以「抽樣誤差『一定不是』±3.0%。」 更詳細的說,調查都還有一個「未決定」的選項,就統計上類同於「4人競選」,與預設條件誤差更大!

以上「完訪人數、信賴水準、抽樣誤差」之間的關係,必須在符合「隨機樣本」的前提下才能實現。「隨機性」一詞常被誤為「隨便」,其實為「等機率性」,有極嚴謹的條件,完全「不能隨便」!

若要符合「隨機性/等機率性」,則被抽出之樣本後,不可改變其機率,亦即抽出樣本後,必須「若且唯若」訪問到全部樣本、沒有更換,相關推論才能成立。
如何獲得「隨機/等機率性」樣本?就是必須要有「完整母群(或稱母體)清冊」,即所有受訪者都在同一個清冊上出現1次,這樣抽出的每個樣本的才有「等機率性」。

各民調所稱「以年滿20歲設籍在台北市的民眾為母體」,而這種母體的實體清冊根本不存在。許多坊間民調公司,以電話簿充當母群清冊,但大家都知道,當前電話簿不登記率太高,並不具隨機性/等機率性。

沒有實體母群清冊

在符合科學條件的調查實務上必須以RDD (Random Digit. Dialing)等方法,實現虛擬母群清冊,以追求解決沒有實體母群清冊的問題。這個問題,多數坊間民調有注意到。

但採用RDD,更不容易找到受訪者,當前實務上2~3天絕對訪問不到抽出的樣本,所以坊間各民調公司在開始時,就抽出11~20倍的樣本予以更換,實際隨機樣本只有5%~9%,故以上推算數字一定不正確。

如果有人被更換,被換者等於出現2次、其被抽中機率變成「原定等機率」的200%;如果是第20次才更換到,其被抽出機率變成2千%。

所有採用玉瑪系統者,其報告之「抽樣誤差」不僅是錯的,對採用替代樣本,而形成的非隨機/非等機率樣本而言,根本是無意義的。

誤差被誇大

另外 RDD法等,只能獲得「隨機樣本『戶』」,在戶中如何找到「適當受訪『者』」還有許多技術。同時,當前都會區,「家庭投票異質化」已超過3成,所以坊間民調,當前1家只訪問1人,一定也擴大誤差。

採用RDD、又不斷更換樣本,會造成樣本的人口資料,和母群(或稱母體)產生很大差距。
所以,這些民調公司再採用《性別、戶籍、年齡》加權,不論是否存在選舉預測目的,只有美化數字的效果,不能增加推論性,反而有擴大誤差之虞。
《加權法》必須是加權項目,為應變項的因果/關聯自變項。譬如,要預測燒開水所需時間,若我們各式水壺與瓦斯桶樣本不足,但根據已有樣本的「水壺容量」、「耗瓦斯量」加權,則可經加權,正確預測各種燒開水時間。

但如果我們以「水壺廠牌」、「瓦斯桶顏色」加權,則毫無作用,只是美化數字,可能反而擴大誤差。

要比正確與可信

以2018選舉為例,投票前10天有43個封關民調發布,結果全部超過其宣稱之誤差範圍,「預測0正確」,更有37個民調,即86%的誤差在10%以上。該年選舉由於勝負相差太大,按照美國最大公共調查,CBS-Times 調查主任的說法是「隨便哪個豬頭」都可以知道誰勝,要比正確與可信,不是「比勝負」,而是「比預測與實際得票差異」。
過去40年,在有文獻可證,在選前預測選舉結果的研究,只有吳統雄教授1人始終維持誤差在2% 之內。因為他為了達成隨機性,必須以6~8周才能達成。其他只做1~3天,永遠不可能達成隨機性、可推論性。

二、統合分析 meta-analysis 可觀察趨勢

一般坊間調查用來單獨閱讀,意義均有限,但只要不是故意做假調查、或「戰術調查」,累積長期的「非隨機/非等機率」調查資料,加以「統合分析 meta-analysis」的觀念與技術,比較相似主題、執行期間相近的調查結果,再加上更多方位的知識與歷史經驗整合,仍然有可能觀察出一些真實趨勢。

所以,觀察各家民調,剔除作假調查、或「戰術調查」後,綜合各家資料,還是具備相當意義。

假調查與戰術調查

作假調查是根本沒做、或以少報多、捏造數字。而「戰術調查」則是企圖扭曲,即俗稱的「帶風向」。
在調查4大程序;「抽樣、測量、訪問、分析」與行政作業中,都可以實現扭曲、「帶風向」的企圖。
而民眾較能夠發現與警覺的是「測量」、即問卷設計的命題。

「測量工具」可造成的效果甚多,而讀者最容易感受的是「直接詢問測量法」,是否具備誘導性問法。
尤其觀察調查者是否遵守:「避用假設性條件句,慎用真實條件句」。

「機構因素」與「媒體因素」

「戰術調查」、甚至假調查的存在,也極可能出於「機構因素」。

民進黨早自去年起,就已公開「打侯」的主軸為以「落跑市長」為中心概念的各種議題,包括本案向媒體突顯的問題。
而具備「機構因素」,也就是并非中立的委託與執行民調機構,也已多次配合此「打侯主軸」,甚至把民進黨的文宣照抄,成為民調問題,是為非常明顯的「戰術調查」,如可列入「待觀察名單」的台灣民意基金會等。

各民調委託與執行機構,是否具備「機構因素」?讀者也可各自進行瞭解。

譬如「正常國家文化基金會」為民進黨籍、主導選舉提名的總統府秘書長林佳龍所出資成立,董事包括曾被貪腐犯罪定讞的民進黨前立委高志鵬,宣示「進口瘦肉精(即萊豬)的總統下臺」、及有特定立場的民進黨立委陳亭妃…等。
而「大地民調公司」成立不滿2年(2022年01月),卻成為民進黨指定的3家民調公司之一,也曾被同黨基隆市議員張之豪質疑,是為民進黨內特定派系服務的公司。
《Yahoo!新聞》曾有報導:「據綠營人士解讀,這3家民調公司屬性鮮明,有的甚至翻開公司董監事名單或地址一看,就知道背後老闆是誰,不外乎是挺副總統賴清德或前交通部長林佳龍。」
這些資訊,均可提供讀者認識,是否會發生「機構因素」的傾向。

「機構因素」主要是指委託與執行民調機構,不過,媒體如果有很強的立場,或高層與某當事人有特殊交集,民調特定內容也會被選擇性突出或隱藏,「媒體因素」的效果也不小。

三、數據造假疑點與違法之嫌

民進黨熱衷於批「落跑市長」,目的在打下曾一時領風騷的韓國瑜。
韓國瑜的起伏實基於「53237選民結構」,選民中有完全基於顏色、意識型態投票的群體,也存在「可變群」「搖擺群」,會因為「人與形象」而投票。韓國瑜並非國民黨的典型形象,加上勤跑與快語,獲得後2群的青睞而當選。

唯韓國瑜並不關注科學與分析,不知道自己的當選是「結構因素」、是「時勢造英雄」,而誤以為自己是天縱英才、是「英雄造時勢」,所以被捧他上天、相同的人又把他打回凡間。

侯友宜與韓國瑜的境況完全不同。侯友宜已經做完一任了,臺灣政壇上做完一任後轉換跑道的所在多有,記錄上受到大型反制的並不多見。

難掩做假可能

本研究者的資料庫中,並沒有針對這個主題的特定資料,但以相關資料推估,只論意識型態、不論任何理由都「反侯」的約有25%,而可能會受誘導資訊影響的「可變群」「搖擺群」,最多約20%;所以,可能會被「打侯主軸」影響的選民參數為 25%~45% 之間。

在統計實務史上發現:出現過高不合理的數字,就無法排除作假的可能!

即使是「非隨機/非等機率」調查,有可能問到「反侯」高達、且正好過半的 51% 嗎?這個數字的來源,有必要公開與被查證。
依據實證參數,謊言連續散布 8 個月以上,就有可能產生「曾參殺人」的效果,而連續散布2 年以上,就必然發生效果。即使效果的數字很小,但在極接近的競爭中,就會造成「極少數誤導絕大多數」的結局。

應訂法規監管

「戰術調查」尚可容忍,作假調查則已違反相關民法與選舉法規,唯始終無法定司法查證程序。公部門的調查,依法必須透明化,雖然主動公布者不多,但依法還是可以查證。私部門的調查,如果是要向大眾公布者,應也立法訂定透明法規才是。