論民調

0 views
Skip to first unread message

sun1977

unread,
Nov 26, 2006, 9:25:46 PM11/26/06
to Yes-Taiwan
倘若現在有一報告,"根據xxx民調顯示,羅文嘉的支持度為37.6%,在95%的信賴水準下,抽樣誤差為正負2個百分點,有效樣本2403
人"這句話是什麼意思呢?這個民調結果是可信的嗎?什麼是信賴水準?誤差如何決定?抽樣人數會影響結果嗎?


如果我們想要知道台北縣民之民意為何,最正確的方法是進行"普查",即調查母體中的每一個個體,例如我們想知道年底年大選台北縣縣長誰會當選,這問題的母體是所有年底有資格投票的台北縣選民,只要訪問每一個選民,即可獲得正確的答案.但是這樣的普查需用大量的成本,所以實務上只會調查母體中的部份,以節省成本,稱為抽樣.至於該如何抽樣,才能在樣本中表現出完整母體的特性或特徵,以及如何設計問題,這是另外一個主題,也是有心人士用來操控民調結果的地方.


抽樣調查之樣本:譬如我們想知道羅文嘉是否為當選,現在台北縣選民中抽樣訪問100人,其中36位支持羅文嘉,這樣的結果我們不能說羅文嘉的支持度是36%,因為那是樣本的結果,只能說在那100人中有36%支持羅文嘉.那要如何利用樣本的結果來推論母體結果呢?一般民調所用的方法是區間估計(interval
estimation),是根據樣本資料所得的樣本結果配合抽樣分配與機率理論(略),所發展出來的一種方式,用來提供母體未知參數一個可能所在範圍的方法,稱之區間估計(註一).其計算方式為:


母體比例區間估計= p±Z(α/2)×Sqrt[p(1-p)/n]
,Sqrt表示對[]中之值開平方


p:表樣本比例(如上例36%)


1-α:表信賴係數(confidence
coefficient)或信賴水準(confidence
level),即等於隨機區間包含參數的機率.


Z(α/2):表在α/2下的常態分配z值


n:表樣本數


其中信賴水準(1-α)表這個母體估計值的可靠度或命中度(命中真正支持率)的程度有多少,如在上例所提95%的信賴水準表示讓民調結果有95%的可靠度或命中度.而公式中Z(α/2)×Sqrt[p(1-p)/n]
即為抽樣誤差,區間估計值的範圍,所以上例中"羅文嘉支持度為37.6%,在95%的信賴水準下,抽樣誤差為正負3個百分點"完整的解釋是"羅文嘉的支持度有95%機會是在34.6%~40.6%之間".

再來談抽樣所須樣本數問題,理想上,我們當然希望信賴水準(1-α)愈大愈好,代表估計愈準確,而抽樣誤差愈小愈好(區間太大估計是準確的但沒有意義,例如我估計阿茵姊的身高在0~400公分間,絶對夠準確但一點參考價值都沒有).由公式可知道抽樣誤差受Z(α/2)及n的影響,而Z(α/2)值受信賴係數1-α的影響,且一般1-α是常數.而樣本數愈大,可控制抽樣誤差變小.因此,如果想要讓估計準確率高且範圍小具有參考價值,唯一的辦法就是增加樣本數n.至於n要多大才夠,那要看你要高的準確率以及可容忍多大的誤差範圍.

(註一)區間估計之意義:區間估計之概念,是想利用母體中所抽出之隨機樣本求出兩個端點.構成一個隨機區間(random
interval),
端視此隨機區間所涵蓋之未知參數P之機率為何.

下面兩個不同單位的民調報告:


山水民調中心(過去的資料http://www.fsr.com.tw/031015.html)


‧調查單位:山水民意研究公司


‧訪問地區:全國


‧訪問對象:設籍台閩地區,二十歲以上成年人


‧抽樣方法:以台灣地區住宅電話簿為抽樣架構;以系統加末尾隨機方式兩段抽樣


‧訪問日期:92年10月15日


‧有效樣本:1006人,拒訪:349人


‧抽樣誤差:在95%的信心水準下,約 ±3.09個百分點


‧訪問系統:玉瑪科技 Win Cati 調查系統調查


TVBS民調http://www.tvbs.com.tw/FILE_DB/DL_DB/chunruh/200504/chunruh-20050421100408.pdf


訪問主題:台北縣長選舉民調


訪問時間:94年4月18及19日晚間18:30~22:15


調查方法:電話後四碼電腦隨機抽樣,人員電話訪問


有效樣本:935位20歲以上台北縣民


抽樣誤差:95%的信心水準下,抽樣誤差無正負3.2個百分點


經費來源:TVBS


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


首先跟各位大大解說,樣本數的由來:


在公式:


母體比例區間估計= p±Z(α/2)×Sqrt[p(1-p)/n] ,
其中Sqrt對[]中之值開平方


其中Z(α/2)×Sqrt[p(1-p)/n]
為抽樣誤差,且一般要求95%的信心水準(α=0.05)之Z(0.025)=1.96,
在0中使p(1-p)之最大的p為1/2(可採用之或用以前的經驗值代入),一般容忍抽樣誤差為正負3個百分點,即<補充>

Z(α/2)×Sqrt[p(1-p)/n]=1.96×Sqrt[0.5×0.5/n]=0.03


上式可得,n=1067.1111≒1068


因此,我們常看到這樣敘述


"有效樣本1068位,在95%的信心水準下,抽樣誤差為正負3個百分點"


再就上面兩個民調單位之敘述,我們可發現在山水民調中,有個拒訪率,但是tvbs沒有,這是個嚴重的錯誤,也是本人非常不屑tvbs民調的原因(簡直是到令我唾棄的程度.仔細看整個報告內容,才發現只是簡單帶過距訪率).假設今天被抽中的選民中有很大的比例選民認為tvbs是匪台或對政治民調有戒心,其中有468位聽到tvbs就掛上電話,那麼這樣的935位選民所得的調查結果有多大的能力來推估整個母體的特性呢??這種不確定性太高了,很簡單的若距訪中以泛綠支持者多,那麼泛綠候選人支持度之估計值會往上提升,故民調結果便會產生差異.


民意調查中抽樣是非常重要的課題,沒有好的抽樣方法難以推估母體特性,但抽樣是一門大學問,本人在此做個簡單介紹.

一.抽樣調查有幾個優點:

1.經濟性:抽樣調查比普查少花費許多時間,人力和財力而能獲得相當可靠的資訊.

2.時效性:普查單位既多範圍又廣,常需龐大人力和時間進行調查,而普查資料的整理編報工作也較繁重,往往資訊是有時效性的,
用普查所得的結果往往超過時效變成沒有用的資訊,¬而抽樣調查的執行及作業整理到發表結果的時間縮短很多,能適時提供決策之用.

3.正確性:因普查包括很多人員,
易因草率造成很多錯誤,雖普查沒有抽樣誤差卻有很大的人為誤差.而抽樣調查的規模比較小,
可精選素質較高的人員給予嚴密的訓練,增進調查的技巧,進行調查時便可減少很多人為誤差,故所得的資訊往往比普查正確.

二.抽樣調查的程序

抽樣調查是一種科學性的研究,因此抽樣過程必須是有系統性的

包含下面幾個步驟

1.界定母體:確定研究者想推論的是哪些對象,這些對象的集合就是母體.對母體的特徵或性質應明確說明,個體的限制要明確.如前例台:北縣20歲以上有投票權之選民.

2.指明抽樣架構::Yates(1953)曾提出評估抽樣架構的標準

□完整性:抽樣架構應包含所有母體中的元素.
□不重複:抽樣架構元素不應重複出現.
□正確性:抽樣架構中所列舉的元素應該力求正確.
□便利性:抽樣架構應易於取得使用並且可適當調整

###要取得完美的抽樣架構式非常困難的,如電話簿常被人用來作抽樣架構,但是有些母體的人其電話沒有列在電話簿中,或在電話簿上有二、三支電話.又有時一個母體名冊或許不齊全或根本沒有,這時研究者就必須創造出一個有名冊的母體.

比如說北縣縣長民調,假設:您的名字在電話簿中而大大您老婆大人的的名字並沒有在電話簿中,您與您老婆大人一個支持羅文嘉一位支持周錫瑋,現某XX民調單位¬在晚間18:30~22:15進行抽樣訪問,您老婆大人這個時間剛好都在洗碗作家事,大大您多半在下班後在客廳抽菸喝茶看報紙並且固定在此時看八點檔和政論節目,那麼您老婆大人只有極少的機會被選中.研究者可以台北縣有選舉權之選民的身份証號碼當作名冊以進行抽樣.但因取得所有選民之身份証號碼不易,故現有民意調查多以電話簿上之電話號碼進行抽樣.

3.選擇抽樣方法:這時要視抽樣架構而定,如果我們有ㄧ完整母體名冊,那麼就可用簡單的抽樣方法.
抽樣方法的類型包含機率抽樣(probability
sampling)和非機率機率抽樣(nonprobability
sampling),各自又有不同形式的抽樣方法,每種方法又有其優缺點及適用情形(■若時間許可,希望能向各位大大簡略做個介紹).
不管決定的是隨機抽樣或是非隨機抽樣都必須在針對有關母體資訊及資源限制下來決定某ㄧ抽樣方法

4.決定樣本大小:這要依抽樣誤差和信賴度(信心水準)及經費來決定的(一般是如此,前已敘述),但有時可不先決定樣本大小(和抽樣方法有關).

5.選取樣本元素:研究者要在抽樣架構用所決定的抽樣方法去取得樣本的元素.

6.收集樣本資料:研究者依造所決定收集資料的方法如人員訪問,電話訪問,
或郵寄問卷訪問等去實行.
這步驟也易生錯,也很難掌握.


三.抽樣調查的誤差


調查研究的品質要建立在調查過程的每ㄧ個步驟上.在過程中的每ㄧ個步驟都可能產生誤差.這裡討論在設計調查時,從事實際調查工作,從事資料處理及分析,這三個步驟上所造成的一些誤差.這些誤差的來源分為抽樣誤差,反應誤差和無反應誤差三類.


1.抽樣誤差:任何抽樣除普查外都不可能包括母體中的每個單位,因此抽樣結果可能有誤差.抽樣誤差通常隨樣本數的增加而降低(由公示可看出,已敘述),但如果抽樣方法不好,樣本數越大可能偏離母體越遠,造成更大的誤差.只要選擇適當的抽樣方法則不但可降低抽樣處差且可加以估計.


2.反應誤差:簡單說是真正值和觀察值得差距,
是一種測量的誤差.造成反應誤差可分為三方面:


□受訪者:本身不是故意造成誤差,是由於不經心的回答,記憶的誤差,問卷題目不當,對題目的誤解造成的;另一方面是受訪者故意造成的,其原因可能是題目涉及個人隱私或對調查單位之厭惡.


□訪問員:訪問員的年齡,性別,教育水準及經驗對受訪者都有影響.訪問員因經驗不足或太累造成誤差.訪問員為避免訪問麻煩偽造答案或根據自己的經驗來填寫答案.訪問者在詢問時往往加上自己的意見,因此影響受訪者的答案.


□資料處理者:資料編輯員,登錄員及方析師在處理資料時都可能造成誤差.
如資料編碼時編錯碼;登錄員在登錄資料上電腦時輸入錯誤的資料:分析師用錯統計方法等.


3.無反應誤差


無反應誤差指的是樣本中的某些受訪者不願意接受調查訪問.


因為無反應者與反應者在某些重要特徵上,可能彼此不同.如將這些無反應者排除在樣本外,則樣本結果自然有產生誤差的可能.無反應的原因大約可分為下列幾種:


□不齊全:不完全是因為抽樣架構的不完備;有時是因交通困難,天候不佳以致難以接觸某些受訪者所致.在利用電話簿做電話訪問時,不齊全的問題更顯著.

□不在家:受訪者可能在受訪期間出國或其它原因在拜訪時不在家.

□不能回答:受訪者可能是文盲或瞎子,無法郵寄問卷;耳聾無法接受電話訪問,太老或生病不願回答.

□拒絕回答:可能是訪問期間對受訪者不方便訪問員態度冒犯受訪者,受訪者對受訪主題沒興趣或某些題目太敏感而造成受訪者拒答.

這些誤差一方面要盡量設法減少產生誤差的原因;另一方面要發展方法計算誤差,並能修飾所得之結果.

既然民調是一種科學的資料蒐集方法,所以每個進行步驟,自然要符合科學的作業原則.統計是一個專業的領域,對於一個專門從事民意調查的單位,要如何評估其所調查的結果和內容是否中肯,個人認為,應該看其內部從事調查相關工作的人數,至少超過一半要是專業的統計人員,然後對其調查結果和內容進一步的評估,否則及應對其調查結果抱持懷疑的態度.

對於問題的設計,抽樣方法,信心水準,拒答率等可供參考的影響因素都應公佈.

媒體為何對民調有興趣,因為媒體喜歡將民調結果當頭條,如TVBS,媒體可以藉此製造新聞.媒體看民調與學術界看民調不同:媒體多半不了解什麼是抽樣誤差,譬如百分之29比29,以誤差的角度來看,並不代表平手,差距可能6到7個百分點,這樣的差距是無意義的.在非抽樣誤差部分,如拒訪,未表態,訪問員語言使用等,或民眾對民調機構的不信任或對民調的不信任,這些都無法用公式計算出來,媒體在這部份通常是一語帶過,會讓人以為這不重要,重要的是數字,接著告訴你這些數字的變化,但是以專業角度來說這才是最重要的.


四.從科學的觀點看,一個良好的測量工具應具有足夠的信度與效度.什麼是信度(reliability)?什麼是效度(validity)呢?"所謂信度即是一個測量工具在測量其所測屬性時所得結果的穩定性和一致性.如,若一把捲尺昨天量一人之身高是一百七十五公分,今天再測量卻變成一百七十公分.顯然這捲尺受熱漲冷縮的影響很大,其測量並不可信.
再以民意調查為例,假設羅文嘉在這段競選期間,並沒有發生重大因素足以影響選民原有支持度,那麼同一份問題設計,同一群樣本,上午測得有90%的選民要投票給他,中午再測,有50%的選民要支持他,到了晚上又測一次,竟然只剩20%的選民支持.同一群受訪者的支持度隨著時間的改變而改變,這意味著這份民意調查似乎有誤差存在.換句話說,這份測量工具的信度是被懷疑的,根本無法真正測量出選民的支持度.一份準確且高信度的民意調查工具是具一致性的,不會因為訪問時間,地點,天氣,受訪者當時的心情…等外在條件影響測量結果.

測量工具除了要求高信度之外,還須注意效度,所謂效度是一個測量工具能測出所欲測量的屬性的程度.如,用一把刻度很精確不會熱脹冷縮的尺,也就是信度很高的尺,用此尺來測量一群人以判斷誰輕誰重,就可能不大準確,也就是不很有效.因為尺並不適合用於測量體重這個屬性,也就是一個效度不佳的測量體重的工具.再假設有一大學統計學系微積分期中考,不管學生在前天考,昨天考,今天考或教室內坐著考,校園裡蹲著考,宿舍床上躺著考,甚至天氣晴,天氣陰…等因素,大家的分數總是能達到最高標準,意即此測驗具高信度.但探究其試卷內容,發現試卷標題寫著雖是大一微積分期中考,試題內容卻盡是國小一年級的數學問題,無怪乎不管大家怎麼考,分數總是那麼的一致,那麼的精確無誤.這份試題的確達到了信度的要求,但卻毫無效度可言.又再譬如上述的選前民意調查為例,如果民意調查內容都盡問些無關於是否支持羅文嘉的問題,其調查結果絕對也與羅文嘉無關.也就是說,一份沒有效度的測驗工具所測量出來的結果,無異於是"顛倒是非"
.因此,一個可以讓人信賴的統計數字,其資料蒐集的過程一定是建築在一份信度,效度兼具的測驗工具上.


在追求合乎理想的信度與效度分別是研究者最初的目標與最終目標.但判斷工具是否可信?有效?並不是那麼顯而易見.

隨著選情不斷增溫,有關縣市長民調報導紛紛出爐.為免民眾對選舉民調的信賴日趨低落,各專業民調機構應在調查技術專業表現上更求精進,以更慎重的態度,完整公布調查方法有關的基本資料.社會大眾在面對五花八門的選舉民調數據時,也應有些判斷民調品質的基本認知.如,民調的執行機構是否為有聲譽的專業組織.至於政治人物或政黨自己公布的選舉民調數字,不管如何總有"老王賣瓜自賣自誇"之嫌.此外,如果不想被任何選舉民調唬攏,最保險的判斷方法就是比ㄧ比各單位所公布的選舉民調數字,如果在各家結果差不多,卻出現"獨家"之民調數字就值得懷疑了.最後,如果有民調結果的報導連抽樣誤差都遺漏的話,個人建議把這個統計數字就當成是"樂透"的開獎號碼吧.

雖然選舉民調不是可以預見未來的水晶球,但也不是洪水猛獸.期盼經由社會大眾對於民調素養的提升,以及專業民調機構的自律,讓選舉民調能在合理監督的社會中,成為觀察選情的"科學工具".請民眾切勿跟著非專業機構之民調單位報告瞎起哄.

註二:各位大大可自行判斷tvbs之專業性夠不夠.前些日子在網路上看到tvbs民調中心徵才,對於訪問員之條件並無嚴格規定.另外,就我所了解,如ec大大所言,一個有效樣本之收費約為新台幣300元
,即一個1000份左右的民調要30萬左右.(因要市內或長途電話費,人事費用,…等等.)不知為何tvbs幾乎可以每日都有民調出爐???

在此補充兩篇以前貼過的文章:
=======================================
(以下轉貼自南方快報)

中間選民的迷思 徐永明

 隨著國、親合作的形成,關於兩千零四年總統大選的民調也跟著多起來,大部分的調查結果都呈現一個有趣的落差:就是「連宋配」的支持度高於阿扁,但是,扁、連、宋並列評比時,無論是個人特質的評價,還是人選偏好,則是扁勝於宋,連合乎預期地遙遙落後。

 這樣的選民心態值得進一步解讀,因為選民是對於扁政府有失望,但顯然對於「連宋合」並未有期望,形成一個被動的「反現任者聯盟」,而非積極的「另一種選項(alternative)」出現的挑戰,於是,這樣反動的心態下,輿論的氣氛有兩個面向併陳:雖然不看好阿扁能否連任,但是也對於「連宋配」的成功有疑慮。


 而當心態反映為對局勢演變的焦慮時,民調消費成為這個不確定政治的集體紓解之道。表現在民調上為藍、綠版圖的穩定,不同的民調約有5到10個百分點的差距,之外約兩成的無政黨傾向,或是不表態的選民,則自然被視為決勝的關鍵。

 於是,媒體輿論發現了一個新的政治明星,叫做「中間選民」,因為她?他們無政黨傾向,所以難以捉摸,也因為表態率低,所以其投票趨向會隨著選戰情勢而變化,被認為是易於影響操縱的西瓜派。

 這樣對於「中間選民」的理解有層次上的混淆。首先,中間選民並不完全是「中立選民」,部分是在民調上不表態政黨上的偏好;部分則是在投票上有政黨的傾向,但並不覺得感情上認同這個政黨;最後才是完全中立的選民,但是其投票行為也並非完全隨機的。

 因為有表態或不表態的前提,所以,不單「中間選民」的大小比例,會有劇烈的變化,表態政黨認同的也是起起伏伏。上次立委選後,國民黨的認同度遠低於民進黨、親民黨,在十多個百分點盤旋;但市長選舉後,則竄起與民進黨並立,高達二成五左右,這裡代表選民的表不表態與政治情勢、媒體氣氛相關。

 再者,不表態政黨偏好,不代表政黨中立。因為當投票行為上有一定傾向時,所謂「中間選民」還是有其政治傾向的,所以純粹無立場的選民可能比預期的更少,而選舉的不確定性也可能被壓縮在五至十個百分點之內。

 這時候決定選戰勝負,不單是弊案、選戰策略、文官造勢這個層次,而是如何去解讀這個「選民反動」的心態,紓解其中的迷憫與不安,才是動員「中間選民」的致勝之道。http://www.southnews.com.tw

 2003.03.13

--------------------------
(以下轉貼自大紀元)

中間選民的迷思

作者﹕劉孟奇  中山大學政治經濟學系助理教授
________________________________________
【大紀元3月17日訊】在選舉當中,媒體上經常出現「中間選民」這個名詞。到底誰是中間選民?這不是一個容易回答的問題。不過應該可以說,社會對於中間選民的一般印象就是,不特別偏向某一個政黨或政治立場。或者說,「保持中立」的選民,就是中間選民。

為什麼在選舉當中,很多人或媒體喜歡宣稱自己代表中間選民?我的觀察是,宣稱自己代表中間選民,好像可以讓自己的發言更具份量。特別是當媒體提到中間選民的時候,總會出現一些似乎具有道德性與理想性的詞彙,譬如說:不偏不倚、客觀理性。除此之外,有些人認為,中間選民就是遲遲不表態的那群選民,所以誰能夠在最後贏得中間選民的青睞,就能在勢均力敵的選舉中脫穎而出;因此,以中間選民的身份發言,可以對社會有更大的影響力。


這些說法其實有一些值得商榷的地方。首先,不表態的選民不見得就是所謂的中間選民,而可能是不關心政治結果的選民。其次,如果中間選民的性格就是所謂的「不偏不倚、客觀理性」,那麼,他們對於政治、社會的發展方向與結果,恐怕就沒有什麼影響力。


為什麼?因為所謂的「不偏不倚」,很容易被簡化為「各打五十大板」。不管候選人如何試圖在邊際上調整政策,爭取更多的支持,都會被堅持不表態、難以取悅的「中間選民代言人」以負面的方式檢視,吹毛求疵地加以批評。候選人很快就會發現,調整政策討好這些中間選民代言人的邊際效果接近零。既然如此,還不如針對立場鮮明的選民,提出能明確打動他們的主張。這就是越到選舉後期,這些中間選民代言人會越被邊緣化的主要原因。


除此之外,所謂的「客觀理性」常被詮釋為「沒有預設立場」,這與經濟學上的「理性」定義很不一樣,後者所指的是「在選擇上具有一致性、不會顛三倒四」。絕大部分的公共議題都牽涉到機會成本,需要選擇;要選擇,當然要有立場,才能決定效益與機會成本孰輕孰重。


人必須具有明確的價值觀,才能做出前後一致的選擇。一群選民的選擇如果沒有一致性,自相矛盾,讓候選人無從遵循,就難以對政策有實質影響。如果選民不想做出有一致性的取捨——既要對社會福利大幅加碼,又要財政收支四年平衡;既要課富人稅、取消租稅優惠,又要吸引投資、創造就業;既不增稅,又不舉債,又要大幅增加公共建設;既要人人有大學念,又要百分之八十的學生念國立大學——那麼候選人自然只有大開芭樂票,到頭來,中間選民自詡的「客觀理性」,換來的將只是一堆既不合理,又無法實現的空洞承諾。──轉自台灣大紀元時報


(http://www.dajiyuan.com)
3/17/2004 3:42:51 PM
=======================================
註三:任何一種民意調查的目的是要了解母體的特性,特徵或變數間的關係.
母體特徵例如,平均所得,全國總生產毛額,全國支持總統公民直選的平均比例等等.不管是抽樣調查或普查都是統計調查.其應用範圍包括農業,醫學,工業等,雖處理的問題不盡相同,但方法和精神是一致的.

Reply all
Reply to author
Forward
0 new messages