Sunday, March 16, 2014

畫出腸民調之一池渾水


網上圖片

煩厭,數字煩厭,民意調查的數字更煩厭,有關民意調查的數字的爭論更煩厭。如果你有這樣的感覺,請小心,小心正中下懷。

世上有一種政治把戲,把白變灰,把灰變更灰,把清水搞濁,弄得人糊塗、煩厭,這叫魚目混珠,這叫disinformation

最近,權貴們對港大民意研究的批判,是很好的例子。

首先問大家一個問題,由0-10分之間,哪一個分叫做「合格」、哪些分數叫「不合格」?

直覺說:5分叫合格吧。

好的,那麼:答0,1,2,3,4,可叫作不合格或負面評分;答5,6,7,8,9,10,可叫合格或正面評分。

有什麼不妥?

鍾庭耀說:把尺不對等。

有五個選項被歸類為不合格(0,1,2,3,4),但有六個選項被歸類為合格(5,6,7,8,9,10),「合格」的選項比「不合格」的選項多,不妥。(其實,這算是社會科學調查問卷設計方法學的ABC)

學術上,較合理的做法,應這樣看
0,1,2,3,4 [不合格/負面] (5個選項)
5       [中間/一半半]
6,7,8,9,10 [合格/正面] (5個選項)

正因如此,鍾庭耀說,港大民意研究計劃叫市民為特首評分的民意調查,問題不問「合格不合格」,而是這樣問的:

「而家想請你用0 100 分評價你對特首梁振英支持程度,0 分代表絕對唔支持,100 分代表絕對支持,50 分代表一半半,你會畀幾多分特首梁振英呢?」

「港人港地」網站及愛國報章近日批評:


「依據港大最新的民調,以100分為滿分,特首僅獲47.5平均分,當然就被評為不合格了。然而,只要打開原始資料,就會發現998個評分者中,原來有多達615人、即逾6成人均給予特首50或以上的合格分數,其中更有29人給予100分;僅有383人給予50以下的評分。那麼,為何特首的評分又會不合格呢?最大的問題在於有91人個受訪者給予0分,就是這些極端評分,令特首的平均分大幅度拉低。」


是日,鍾庭耀在獨立評論人協會研討會上,整理了一些數據反駁。其實,那所謂615人給「合格」分數(50-100),當中超過四成半,共286人給50分,50分,在調查裡,講明代表「一半半」,50是中間分數,不應被視為「合格」或「不合格」。

再看答案分布:

0-49   38.2% 
50     28.6%  [中間分數]
51-100 33.1%

由此看來,以數學平均(mean)來計,47.5分,也頗能反映現實;與中位數50分,也相距不遠。

(註:鍾庭耀無評論,批評者謂「91人個受訪者給予0分,就是這些極端評分,令特首的平均分大幅度拉低」的說法。鍾庭耀公布的數據,也有33人給予「極端高分」100分,民調數據似乎反映了民意兩極化的趨勢。其實梁粉們應該問問,為何那麼多人給0分?要繼續爭論下去的話,鍾庭耀大可公布以往幾任港督特首的0分與100分比例,分析梁振英治下的民意兩極化及「零分化」的趨勢。但本人以為,在今次爭論以後,被訪者都明白原來可以給0分或100分,以後民調結果將更極端,民調研究者難免要將mean平均分,median中位數,甚至mode眾數,一同公布。)

研討會上,鍾庭耀說:「有人謾罵,不跟基礎,不跟理據,社會不斷轉載,講一百次,大家就信以為真。」

這些細節,沒有統計學根柢的朋友,需要些少心力才能了解,加上扮作「不偏不倚」的媒體隨歌起舞,圖文並茂,很多人就糊裡糊塗,覺得有問題了。(延伸閱讀:較早前的爭論,請看《畫出腸談民意調查》)

至於梁粉們批評,鍾庭耀的原始數據「要用特殊軟件」開啟云云,真係好好笑。

研討會同場的政治學者馬嶽說:鍾庭耀最近把全部data set放上網,係「做壞規矩」、「做多咗」。

學過調查方法ABC的朋友都知,SPSS是很普通的統計數據運算程式,這些才叫真正原始數據data set,用excel等程式,難以進行複雜運算,用圖表表達,則更加是消化過,又會畀人罵。

以本人所觀察,這些問卷調查的data set,是研究機構的資產,因為有經驗的研究者,集合多年數據,再加被訪者的性別年齡社經背景資料,不同data set的配合,分分鐘可以寫很多篇學術論文,來滿足大學「出版學術論文」的天字第一號神聖任務。港大民研現時連data set都放上網,實在違反慣例,太慷慨了。

鍾庭耀說:「學者追求真理,不是向中央政府問責,是向未來的一代問責,是為自己對真理的訴求,向自己負責。」

為什麼很多建制中人、傳媒老闆,對鍾庭耀恨得牙癢癢?他從2000年起,做whistle blower,不經意揭破了董特首家臣與大學校長的嘴臉,令人窺探了權力運作與操控的方式 (港大民調風波中,公開聆訊是歷史紀錄),到一直以來民調裡那些不方便的真相,都令很多人渾身不對勁。香港的權貴,討厭說真話的人,更痛恨國王的新衣裡,指出謊言、不識時務的孩子。

鍾庭耀最後說︰「探求真理,是我一生執着。對中國社會來說,這種探求難道不是我們出路?」

「努力一點,堅守自己的崗位,守護我們相信的真理,這點,我們大家都相信的話,我們就有前途。」

講呢啲……他就是鍾庭耀。

相關文章:香港十喻
往日,聽說香港是會生金蛋的鵝、香港是一個避難所、香港是中國通往世界的橋樑;今天,聽說香港是一個萬能插、香港是高鐵的小車輪、香港是寵壞了的孩子。唉。


4 comments:

  1. 少見香港社會對統計學和調查法如此大感興趣。其實50分是否「合格」是浪費時間的言論。對某人,95分才合格,而對其他人,40分已經算合格。如果把合格定爲「不反對CY」的話,「港人講地」沒錯;但如果「合格」代表「支持CY」那鍾庭耀及右派輿論便對。

    至於一些評論家提及到關於是否應該用平均值,中位值,眾值或0到5分是否比0到100分更合適等問題,在完全沒有考慮到背後總體分佈(population distribution)是否有限方差(finite variance)*的情況底下,根本沒有有意義的話可說。更加莫論究竟Excel是否比SPSS好**。

    在輿論中,左右派經常超越自己知識範圍說沒有根據的偏頗論點。當討論到統計學的時候,這一點變得更加明顯。但這次言論已經帶來最好的結果,就是鍾庭耀把數據公開***,讓數據任君濫用。

    * 統計學上,張志剛要求的正態分佈過分苛刻;估計他不懂Central Limit Theorem(s)
    ** Excel確實比較普及,而在有電腦和數學基礎的用家手上,Excel或會比SPSS更爲powerful。至於是否符合「國際標準」-- 據我理解,未有ISO認可的調查數據格式
    *** 區家麟竟然把公開數據形容爲「慷慨」;如果CY說公開中央政策組的數據是「慷慨」的話,大家會怎說?

    ReplyDelete
    Replies
    1. 中央政策組的數據是用公帑得來的, 屬於公眾的, 應份公開. 鍾庭耀做的關於特首評分的民意調查並不耗用公帑.

      Delete
    2. 其實除左民意評份外,仲有個淨支持率,如果認為果個評分反映唔到支持反對人數嘅話,睇返個淨支持率就知吧...

      Delete
    3. "中央政策組的數據是用公帑得來的, 屬於公眾的, 應份公開. 鍾庭耀做的關於特首評分的民意調查並不耗用公帑." -- 港大員工怎麼不耗公帑???

      Delete