(藍白配/全民調) 侯、柯將面對所羅門的審判

吳統雄 / 世新大學資訊管理系前主任 2023/11/13 15:53 點閱 3137 次
坊間單一民調均不宜推論。可推論的基礎是必須為隨機/等機率樣本,亦即必須擁有完整母群清冊,樣本抽出後不得更換。(網路截圖)
坊間單一民調均不宜推論。可推論的基礎是必須為隨機/等機率樣本,亦即必須擁有完整母群清冊,樣本抽出後不得更換。(網路截圖)

臺灣必須要靠新生男嬰才能重生,藍白2位媽媽卻都搶認是母親。(典故:聖經列王記上三章16-28節所羅內王斷案)現在面臨綠色大刀即將男嬰劈成2半,真媽媽在最後時刻會放棄爭執嗎?還是都在撐「膽小鬼遊戲」?寧可看見男嬰被劈開?

即使採用全民調,今年也可能與事實不同,只是避免有人「不賭就認輸」,屬於決策學上的「較佳模式」。即當能力上無法達成最佳模式時,為避免在十字路口停滯不前,理智上知道「擲骰子」並非「神諭」,但接受「運氣」而可向前走。

接受「運氣」向前走

而與其將「運氣」托付給不可知、甚至明知偏差的樣本去決定,還有一個可參用的香港在野聯盟競合模式,即「盟友登記、公告、網路投票」。將「運氣」交付給願意站出來公開力挺聯盟的人民。
這次如果可實現「盟友投票」,更可作為將來「公辦政黨/聯盟初選」的實驗。而黨員登記,可作為未來更符實分配政黨不分區席次的依據。

柯文哲公布3家民調:求真、趨勢、世新,均為柯第一,侯友宜為第二的有1家、為第三的有2家。
但同時,Ettody、美麗島民調:均為侯友宜為第二、柯文哲為第三。聯合報、TVBS:則均為柯侯在宣稱的誤差內不分軒輊。
馬英九再推全民調後,又有人在爭「市話」+「手機」比例。
以上不同與所爭細節如何解讀?除了全民調外,有無其他「競合」方案?

應有「競合」方案

本報曾刊《民調帶風向 選民要擦亮眼》一文曾指出坊間單一民調均不宜推論。可推論的基礎是必須為隨機/等機率樣本,亦即必須擁有完整母群清冊,樣本抽出後不得更換。
要達成隨機/等機率樣本,須要8周以上,現在完全來不及。

而集合多家坊間調查,只要沒有故意做假、樣本具備分散性,在候選人之間真實差距很大、且大於作業誤差時,參用「統合分析」仍然有可能觀察出一些真實趨勢。

以上7家除了求真是由趨勢分出來的新公司、但也是老幹部,都是有歷史的公司,故意作假的可能性較小。
這7家并未出現一致的趨勢,就「統合分析」言,即使集合各家資料,也可能作業誤差大於真實差距。

沒人真正做RDD

由於侯柯2人在「市話」和「手機」調查數據的不同,又出現「市話」+「手機」比例的爭議。
統計知識上,「市話」和「手機」是來源不同、又不完整的重疊式母群。這2種母群的相加,只會增大共同誤差。
同時,總樣本數不變,「市話」和「手機」分別的樣本數變少,對各別母群的誤差也增大。
「手機」當前依法不公開實體母群清冊,理論上可用RDD法建立虛擬母群清冊,但在實務上仍無解決事例。

少數民調公司曾公布過宣稱執行「手機RDD」的資訊,比較真正做過的實驗,他們可能並不知道RDD 的完整實務,只是按照從前民調文獻抄寫剪貼。

我所知道的坊間民調公司,沒人真正做RDD;而是將從前收集的「市話」和「手機」號碼資料庫中,抽出號碼,再做隨機尾數而已。

如果民調公司沒有持續增加新樣本、與定時檢查過濾既有樣本,甚或開始建立的來源樣本就有系統性偏差,如來自某個團體的會員樣本,則此資料庫就存在「樣本分散性」低的事實,即使不作假,也會自然產生偏差。

只要不是隨機/等機率樣本,爭執細節只是改變、轉向、擴大不同的誤差而已。

若願賭服輸,可行

坊間全民調只是「擲骰子」,但有些人誤以為是「神諭」,而誤得輸贏。
更糟的是,為爭產生「神諭」的細節,而眼睜睜看著男嬰被劈開。

全民調,若在心理上瞭解就是「願賭服輸」,可行。
但即使是今天決定作,除了以上爭議,預料還有互比對比的爭執,還要選共同接受的5家,可能已接近來不及了。

倒是如果今天決定作「盟友登記、公告、網路投票」,按照香港經驗,還來得及。至於非盟友混入投票,理論上,網路處理程序可以做到檢舉程序,但時程會嚴重拖長。
換個角度觀察,非盟友混入投票,較可能投給敵意較小的對象,對未來的改革,是否阻力可能較小?

所羅門的審判,可以讓我們發現誰是真正的母親,也可能讓我們看著臺灣的新生機會再一次被斬斷。

作者為吳統雄(臺灣選舉民調創辦人)