統(tǒng)計應(yīng)用上常見的謬誤_第1頁
統(tǒng)計應(yīng)用上常見的謬誤_第2頁
統(tǒng)計應(yīng)用上常見的謬誤_第3頁
統(tǒng)計應(yīng)用上常見的謬誤_第4頁
統(tǒng)計應(yīng)用上常見的謬誤_第5頁
已閱讀5頁,還剩57頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng) 計 應(yīng) 用 上 常 見 的 謬 誤謝邦昌 輔仁大學(xué)統(tǒng)計系教授兼主任 葉瑞鈴 輔仁大學(xué)應(yīng)用統(tǒng)計研究所研究生壹、緒論讓統(tǒng)計結(jié)果更接近事實一、研究動機 統(tǒng)計是一門新興的科學(xué),可號稱是人類在二十世紀(jì)的十個偉大發(fā)覺之一。自二十世紀(jì)初,從Neyman、Pearson及Fisher等人發(fā)表一連串開拓性論文之后,統(tǒng)計便不斷地蓬勃進展,一直到今天,不論在自然科學(xué)或是社會科學(xué)的各個領(lǐng)域中,都找得到它的蹤跡。事實上,它已成為我們生活中的一部份。 隨著現(xiàn)代科學(xué)的不斷進展,統(tǒng)計學(xué)不僅早已從數(shù)學(xué)中獨立出來,而也已成為在社會科學(xué)研究上的一種專門的學(xué)科。今日在科學(xué)研究中,統(tǒng)計分析的應(yīng)用早已有其不可或缺的重要地位,不僅于此

2、,在一般人的生活周遭上的應(yīng)用上,甚至在個人理財活動中都少不了統(tǒng)計分析的應(yīng)用。因此,將統(tǒng)計學(xué)當(dāng)成一種解決問題、尋求真相的工具,咸信將使統(tǒng)計對人們的生活產(chǎn)生更大的阻礙及關(guān)心。 統(tǒng)計的應(yīng)用范圍極廣,其方式要緊在搜集、整理、陳示、分析及解釋資料。并可在較少的成本花費下將吾人有興趣的事物之全體(注1)抽出一部份來觀看與研究(注2),然后依照所得到的信息用科學(xué)的數(shù)量方法來推測所欲了解的事實。因此依照以上所述,統(tǒng)計學(xué)又分為敘述統(tǒng)計與推論統(tǒng)計兩大部份。現(xiàn)在各方面的研究工作者無一不將統(tǒng)計學(xué)視為最有關(guān)心的工具之一,除了在一般的學(xué)術(shù)研究之外,尤其在工商業(yè)的各項業(yè)務(wù),如財務(wù)、工管、銷售等,都需要應(yīng)用統(tǒng)計資料及統(tǒng)計方法

3、來作分析及推論,方能使各項工作順利完成(注3)。 近年來,統(tǒng)計確實已受到學(xué)界及工商業(yè)界的普遍應(yīng)用;不管是學(xué)術(shù)研究論文、期刊,或者是政府出版品,乃至于民間企業(yè)刊物、雜志等,都可看到統(tǒng)計應(yīng)用的大幅成長與統(tǒng)計專業(yè)程度的要求明顯提高。但閱讀與參考這些文獻、資料的讀者往往只專注于統(tǒng)計數(shù)字的大小,而忽略了數(shù)字背后的涵義,殊不知許多數(shù)字可能因為統(tǒng)計分析方法的誤用而導(dǎo)致結(jié)果推論的錯誤。因此,探討一般常見的統(tǒng)計分析應(yīng)用上的誤用情形,為本研究的第一個動機。 研究統(tǒng)計的人都一直深信著統(tǒng)計數(shù)字中永久隱藏著某些事實的真相,等待人類的智慧去查找。多年前有位學(xué)者講:Statistics may not tell the t

4、rue, but it never lies.(注4)。這句話反應(yīng)出統(tǒng)計數(shù)字也許不能告訴我們真相,然而它絕對可不能撒謊,只有人們才會這么做。因此,如何使統(tǒng)計數(shù)字講出真話,并找出統(tǒng)計誤用的緣故及補救的方法,為本研究的第二個動機。二、研究目的 統(tǒng)計理論接著不斷的進展,其所論述的范圍及應(yīng)用的層面愈來愈廣,統(tǒng)計除了可敘述數(shù)據(jù)、推論數(shù)據(jù)外,更重要的是其預(yù)測性的功能。因此,如何善用統(tǒng)計分析工具以關(guān)心完成決策與驗證實驗假設(shè),實已成為企業(yè)經(jīng)營治理與科學(xué)研究之重要課題。以周密的設(shè)計,搜集完整的有關(guān)資料,通過適當(dāng)?shù)慕y(tǒng)計分析所得的結(jié)果作為依據(jù),才能使所冒的風(fēng)險與失策的可能愈小,而迅速得到預(yù)期的目的(注5)。 綜合以

5、上所述與研究動機,遂引發(fā)本研究之目的: (1)探討統(tǒng)計分析應(yīng)用上常見的錯誤情形。 (2)了解統(tǒng)計分析誤用的緣故及探討其補救的方法。三、研究范圍 統(tǒng)計的應(yīng)用與分析方法的范圍甚廣,本研究僅就下列二部份進行探討: (1)學(xué)術(shù)研究部份:針對各類學(xué)術(shù)論文之研究設(shè)計、資料分析、論文撰寫部份加以討論。 (2)日常生活應(yīng)用部份:如民意調(diào)查、收視率調(diào)查等等生活上常見的統(tǒng)計應(yīng)用方面加以討論。 本研究先針對上述二個范疇中常犯的錯誤情形加以討論,其次以實際的情形舉例講明,并討論其改進與補救方法。 此外,文內(nèi)所提之例子并不列出其出處,一方面維護他人寫作之權(quán)益,另一方面保障并尊重其隱私權(quán)。 注釋1.在統(tǒng)計的術(shù)語中稱之為母

6、體。2.在統(tǒng)計的術(shù)語中稱為母體的任何部份集合為樣本。3.蔡宗儒(淡江大學(xué)統(tǒng)計系講師),統(tǒng)計與生活,社 教資料雜志,第二二期,p4。4.鄭天澤(政治大學(xué)統(tǒng)計研究所副教授),統(tǒng)計之應(yīng)用 ,社教資料雜志,第二二期,p3。5.顏月珠(臺灣大學(xué)財務(wù)金融學(xué)系教授),商用統(tǒng)計 學(xué),三民書局八版,民國82年8月。 貳、統(tǒng)計應(yīng)用常犯的謬誤 在本部份,將分不針對實務(wù)應(yīng)用上在統(tǒng)計分析時常見之錯誤情形,經(jīng)歸納與整理后分述于后。一、抽樣方法的不適當(dāng)樣本是否能代表母體 ? 1.抽樣方法概論 差不多上,抽樣理論包含三個要緊的部份抽樣、可能、推論。抽樣在于給予從母體抽取樣本的規(guī)則;可能在于利用樣本統(tǒng)計給予母體值的點可能;推論

7、在于給予母體值的區(qū)間可能。在本部分僅針對抽樣部份進行探討。 抽樣方法在統(tǒng)計中的重要性可由圖21中清晰的看出。圖21 抽樣對統(tǒng)計之重要性圖示 為了解母體的性狀,經(jīng)由抽樣調(diào)查,并以其結(jié)果推測母體,此為統(tǒng)計推論的必要過程(注1)。抽樣方法選擇的適當(dāng)與否,不僅阻礙著如何可能,而其精確(precision)度及誤差(error),皆關(guān)系著整個樣本是否可有效的推估母體。 此外,在實務(wù)應(yīng)用上,抽樣方法也涉及兩個重要的因素:即效率與成本。提高效率與降低成本為每個從事研究或調(diào)查者所追求的目標(biāo)。 抽樣方法可分為:機率抽樣與非機率抽樣兩種。在此我們可簡單的將兩者加以區(qū)不:機率抽樣可推估母體;非機率抽樣因其較主觀而產(chǎn)

8、生偏歪樣本,故只能找出母體的某些特性,而未必能推估母體。故一般較嚴(yán)謹(jǐn)?shù)恼{(diào)查或研究其抽樣皆往常者方式為之。而常見的機率抽樣又可分成:單純隨機抽樣(simple random sampling)、分層隨機抽樣(stratified random sampling)、部落抽樣(cluster sampling)、系統(tǒng)抽樣(system sampling)、多時期抽樣(multi-stage sampling)。非機率抽樣則以任意抽樣(convenience sampling)、推斷抽樣(judgement sampling)、配額抽樣(quote sampling)為代表。 選擇抽樣方法時之差不多考

9、慮為:樣本結(jié)構(gòu)是否和母體結(jié)構(gòu)有一致性。因此這也是為何在完成抽樣后必須作適合度檢定的理由,基于此項大原則我們才可選擇適合母體結(jié)構(gòu)的抽樣方法。在此對各抽樣方法及其專門步驟不作多述,僅將其優(yōu)、缺點及適用時機列于表21。表21 各種抽樣方法之比較抽樣方法優(yōu)點缺點適用時機簡單隨機抽樣法分層抽樣法部落抽樣法系統(tǒng)抽樣法1.母體名冊完整時,直接由母體中隨機抽出樣本,方法簡單。2.由于抽出機率均等,較易可能母體總值及抽樣誤差。1.層間差異愈大,層內(nèi)差異愈小。2.適當(dāng)分層抽樣推論之誤差,恒較簡單抽樣為低。3.可得到各層之可能值。1.當(dāng)部落間差異愈小,部落內(nèi)差異愈大,則抽出樣本統(tǒng)計精確度愈高。2.部落內(nèi)樣本較為集中

10、,訪查員行動半徑不大,可節(jié)約調(diào)查人力及費用。1.隨機起號僅需抽出一個,以后累加即可。2.當(dāng)個體序列成隨機出現(xiàn)時,其推估精確度和簡單抽樣相同。1.通常推算結(jié)果之精確度,較分層集體、分段抽樣法為低。2.由于抽出樣本較為分散,所需調(diào)查人力費用較高。3.無法可能子母體特征。分層后之樣本數(shù)據(jù),其整理推算工作,通常較簡單抽樣為繁。1.以部落為抽樣單位,各項整理統(tǒng)計費用將會增加,故一般多采成對抽取,便于可能誤差。2.通常在各部落內(nèi)分子無甚差異時,將增加部落間差異,調(diào)查結(jié)果誤差必大。3.各部落內(nèi)含個體多寡不同時,亦使誤差加大。1.當(dāng)母體名冊和個體單位數(shù)不完整時,無法采納。2.遇有個體成某種周期序列,又恰與抽樣

11、間隔相近時,則抽樣誤差較大。1.母體較小且明白抽樣單位的數(shù)量。2.有較完整的母體名冊。3.單位訪問成本較為固定。4.母體名冊是有關(guān)母體信息的唯一來源。1.當(dāng)樣本的分層達到各層的抽樣單位的特性盡量接近,而層與層之間的差異盡可能地擴大時使用。2.當(dāng)母體中的專門單位較多或分布不均勻時,為幸免抽樣誤差亦使用之。1.當(dāng)母體成若干部落,且部落與部落間個體同質(zhì),而同一部落內(nèi)個體異質(zhì)時使用。2.當(dāng)無法取得母體集團名冊或劃樣樣本對象為前提時使用。1.母體有現(xiàn)成次序的場合時使用。2.使用此法時于劃分間隔抽取的母體,其所有個體的排列次序必須是隨機的。抽樣方法優(yōu)點缺點適用時機多時期抽樣法任意抽樣法推斷抽樣法配額抽樣法

12、1.多時期抽樣法為群集與分層抽樣之折衷方法,兼取兩者之優(yōu)點。2.配合行政區(qū)域抽樣,抽取手續(xù)與調(diào)查治理均較便利。依照調(diào)查者自身的方便程度,不依據(jù)特定的抽樣原則,具有經(jīng)濟、方便之優(yōu)點。可由人為意志自由選擇調(diào)查對象,不受抽樣設(shè)計條件之各種限制,容易進行調(diào)查。適用于母體集團無法取得,且抽樣手續(xù)簡便,為營銷研究者所樂于使用。分段抽樣之誤差可能加大,且整理分析較其它抽樣復(fù)雜。調(diào)查結(jié)果容易產(chǎn)生偏誤,如盲人摸象。調(diào)查結(jié)果無法推估母體平均數(shù)及抽樣誤差,如選擇不當(dāng),其誤差可能甚大。合乎條件之樣本難得,抽樣之誤差也未能可能。當(dāng)母體集團分布廣而散時,如以一段式抽樣,勢必耗時、耗費,現(xiàn)在則以多段式抽樣彌補其缺失。由調(diào)查

13、者主觀決定。由調(diào)查者主觀決定。由調(diào)查者主觀決定。 最后要提到的是,選擇一個適合的抽樣方法當(dāng)然重要,但抽樣過程的處理不當(dāng)亦可造成人為的疏失,而導(dǎo)致結(jié)果的錯誤增加,亦是值得注意的問題。2.常犯的錯誤情形 由以上講明我們可知:抽樣方法對整個統(tǒng)計分析的過程與結(jié)果阻礙甚大。而一般阻礙調(diào)查者對抽樣方法之選擇的因素不外乎(1)正確性、(2)方便性、(3)時刻、(4)費用。此四項因素往往無法兼顧,這也是為何一些研究者在其研究論文中常會提及因時刻、經(jīng)費不足等之研究限制了!事實上,在抽樣方法上的錯誤也多半因此四項因素而發(fā)生。 我們常發(fā)覺:許多以商品之消費行為之研究、與之關(guān)系性研究或商品之市場調(diào)查等為題之研究或調(diào)查

14、,其研究母體為所有消費者或所有某一特定族群,但調(diào)查者往往會先將抽樣母體定為臺北市、臺中市、高雄市三區(qū)(此一觀念類似部落抽樣法之部落定義),在從其中用簡單隨機抽樣、分層抽樣或部落抽樣等方法抽出若干樣本數(shù)來統(tǒng)計分析,最后則用這些樣本來代表所有的母體,如此以偏蓋全的講法,更不講抽樣及可能誤差之估罷了! 更甚者,一些如收視率調(diào)查、民意調(diào)查等的數(shù)據(jù)數(shù)據(jù)在此方面的錯誤與阻礙更大;因為這些數(shù)據(jù)大多會透過媒體的報導(dǎo)而誤導(dǎo)消費者,進而阻礙其推斷與決策。在日常生活中這類錯誤訊息層出不窮,如某報紙報導(dǎo):電視公司八點文件連續(xù)劇收視率突破40,勇冠三臺。如某報紙民意測驗結(jié)果:候選人民眾支持率達50,大幅領(lǐng)先其它兩位候選

15、人。但在相信這些數(shù)字之前,我們至少應(yīng)先了解其抽樣方法是否正確與適當(dāng),否則它們?nèi)缓翢o意義可言!二、樣本大小的問題勿又要馬兒好,又要馬兒不吃草1.決定樣本大小 由于任何一種抽樣方法都無法包含母體中的每一成員(除普查以外),因此抽樣誤差由此發(fā)生。抽樣誤差和樣本的大小有著緊密的關(guān)系;一般來講,抽樣誤差通常隨樣本的大小之增加而降低。此點由中央極限定理(Central Limit Theorem)可看出端倪(注2)。此外,在實務(wù)上我們通常如下計算抽樣誤差(Sampling Error):簡而言之; x由 1.期望值:E(P) (n:樣本數(shù)) n P(1P) 2.變異數(shù):V(P) n 3.機率:P P 故

16、 1.960.50.981 由上可知,抽樣誤差通常以 來計算,樣本愈趨近于無限大,則抽樣誤差愈小。由此也可看出樣本大小對抽樣誤差之重要性。 話雖如此,由先前所述,我們也應(yīng)注意:若是抽樣打算不行則樣本愈大可能偏離母體愈遠,造成更大的誤差發(fā)生,故選擇適當(dāng)?shù)某闃臃椒▌t不但可降低抽樣誤差且可加以可能。2.常犯的錯誤情形 同樣的,在日常生活中我們常發(fā)覺:許多統(tǒng)計分析結(jié)果往往因為其樣本數(shù)過少而導(dǎo)致結(jié)果的不正確。因為常常研究者或調(diào)查者可能因為節(jié)約時刻、成本等因素,而以較小的樣本進行統(tǒng)計分析,因此也使得結(jié)果不正確。因此,當(dāng)我們閱讀某項統(tǒng)計結(jié)果時,最差不多上應(yīng)注意其樣本數(shù)的大小及其抽樣誤差的推估,而媒體也應(yīng)將此

17、差不多要項注明以建立其傳播的責(zé)任。 此外,在實務(wù)上我們從選擇了適當(dāng)?shù)某闃臃椒ǖ綄?shù)據(jù)搜集后,接下來確實是如何計算可能值,但在大多數(shù)的情況下,研究者或調(diào)查者往往忽略了抽樣方法的不同而應(yīng)搜集不同的樣本大小數(shù)據(jù),而常常采納在簡單隨機抽樣方法下的計算方式,其結(jié)果也就值得懷疑。 在此需要強調(diào):抽樣誤差的發(fā)生和抽樣方法的適當(dāng)與否及樣本之大小有緊密的關(guān)系,有時過大的樣本亦會導(dǎo)致結(jié)果的偏差,且會白費時刻與金鈔票的成本,因此唯有選擇適當(dāng)?shù)某闃臃椒?、審慎決定抽樣樣本的大小,并配合研究的方向,方能提高調(diào)查結(jié)果的正確性,這也是較具實質(zhì)意義的作法。三、P-值的誤用僅以P-值大小來作推論是值得懷疑的1.P-值和樣本大小的

18、關(guān)系 提到P-值之誤用,大部份的研究者或調(diào)查者都會認為P-值和抽樣樣本數(shù)目的大小有關(guān)。樣本數(shù)目愈大則會使得P-值變小,雖具有統(tǒng)計分析上的意義,但卻不具研究或調(diào)查的價值;而抽樣樣本過小則會導(dǎo)致P-值過大,促使檢定力(即所謂統(tǒng)計的power,注3)的不足,進而使得統(tǒng)計假設(shè)不易達到其顯著水平。 在多數(shù)的研究論文中發(fā)覺;研究者往往在檢定分析時會以P-值0.05作為是否達到統(tǒng)計分析意義之標(biāo)準(zhǔn)。如某一碩士論文以百貨公司商店印象與消費者購買決策之相關(guān)性研究為題,在其分析結(jié)果中提到:以對假設(shè)Y:不同百貨公司商品消費群與人口統(tǒng)計變量無關(guān)做獨立性檢定,結(jié)果在年齡、職業(yè)與月平均收入三項之P-值0.05,達到顯著水平

19、,故可拒絕上述之虛無假設(shè)Y。在此要特不注意的是;在統(tǒng)計分析上對使用P-值時應(yīng)特不考慮其樣本數(shù)目是否適中,才能對假設(shè)作進一步的推論,如此才有統(tǒng)計上之意義。 以上所云為一般觀念上P-值在統(tǒng)計分析上的運用,以下將討論一些常見的謬誤。2.常犯的錯誤情形 以上述碩士論文為例,本假設(shè)是以-獨立性檢定及Pearson相關(guān)系數(shù)(或相等之無母數(shù)法)來檢定不同百貨公司商品消費群與人口統(tǒng)計變量無關(guān)之假設(shè),它是一種變量以名義尺度表示的相關(guān)性測定,故在樣本數(shù)適中時,這類分析的常犯錯誤確實是過分引用P-值。需知P-值在此情況下所檢定的是母體的相關(guān)系數(shù)(p)是否為零,亦即是檢定不同百貨公司商品消費群與人口統(tǒng)計變數(shù)有沒有相關(guān)

20、。當(dāng)P-值小于顯著水平(0.05)時,我們只能推翻虛無假設(shè)(),表示兩者間有其相關(guān)(如上述的年齡、職業(yè)與月平均收入等三項),但P-值本身并無講明相關(guān)程度的強弱,且在樣本數(shù)目不太小時,樣本相關(guān)系數(shù)(r)大于0.2或0.3時都有可能達到統(tǒng)計意義,但大多數(shù)的研究者或調(diào)查者卻都即以P-值0.05已達顯著水平而大作文章,關(guān)于此點是值得懷疑的。 除此之外,有些人對單尾與雙尾P-值之報告會顯得沒有差異,如上述之以-獨立性檢定為一右尾之單尾檢定,但有些論文中卻常以報告中的雙尾P-值來做單尾檢定的敘述,此乃因為一般統(tǒng)計報表中所顯示的多為雙尾P-值的因素,而報表研讀者對分析報表之經(jīng)驗不足或判讀錯誤又形成了另一個錯

21、誤。 另一常見的錯誤是當(dāng)比較三個或以上不同組不的時候(如MANOVA),研究者或調(diào)查者往往只使用一個P-值來報告不同組不的差異情形,盡管ANOVA的P-值特不?。ㄍǔ?.0001),但因并未進一步實施多重比較(multiple comparison),而卻又在結(jié)論中提出各組間比較性之關(guān)系性敘述(如A組最好,而B組又比C組好),研究者或調(diào)查者如此光以ANOVA的P-值來推論多重比較之結(jié)果是過于大意的。四、型錯誤(Type Error )的忽視值太大容易否定兩變量既有的關(guān)系1.哲學(xué)觀點與統(tǒng)計學(xué)觀點 許多統(tǒng)計應(yīng)用之研究或調(diào)查中,研究者或調(diào)查者通常著重型錯誤的機率,而采納相當(dāng)嚴(yán)苛的標(biāo)準(zhǔn),在此情形下,卻

22、忽略了型錯誤的增加,則可能導(dǎo)致統(tǒng)計分析結(jié)果的錯誤。 社會科學(xué)與自然科學(xué)有一項專門大的差異;自然科學(xué)的法則(Law)大差不多上普遍性法則(Universal Laws),它是指每X事件發(fā)生后,Y事件就會發(fā)生;而社會科學(xué)截至今日為止尚未找到符合如此的法則,然在社會科學(xué)中所使用的法則僅能被稱為統(tǒng)計法則(Statistical Law)(注4)。由此可知統(tǒng)計對社會科學(xué)的重要性。 自波普(Poper)提出否證論后,統(tǒng)計學(xué)的進展亦受到阻礙。簡單來講,否證論即不論有多少次的成功,只要有一次的失敗就足以推翻整套理論。因此,如前所述,在社會科學(xué)中并沒有普遍性法則存在,任何理論被測試時,或是任何被研究關(guān)系被證實時

23、,都會面臨機率的問題,為了強調(diào)確認程度(the Degree of Confirmation)的提升,因此在欲否定的虛無假設(shè)上,即被設(shè)定了如此嚴(yán)苛的標(biāo)準(zhǔn)(通常0.05或0.01)。 在此對型錯誤與型錯誤之定義不再贅述。在一般的研究中,研究者是在查找一些變量間的關(guān)系,因此在統(tǒng)計檢定時,會有如下之形式: :A與B無關(guān) :A與B有關(guān) 在一般情形中討論,也確實是在A與B事實上無關(guān)的情形下卻認為A與B有關(guān)。嚴(yán)格的值意味著否定論的講法不要隨意地認定關(guān)系。而從另外一方面來考慮,在A與B事實上有關(guān)的情形下,而被認為A與B無關(guān),這種錯誤是比較輕微的。2.常犯的錯誤情形 依照上述所述,對此必須提出二項批判:第一:

24、從效果面來看,被否定的機會太大,而就此認定研究或調(diào)查失敗是過于草率的,其緣故可能只是值太大而造成的失敗。第二:社會科學(xué)研究的范圍太大,往往一項關(guān)系被否定后再被研究之機率不大,因此,在每次統(tǒng)計檢定時,附上值的計算應(yīng)有其必要性。由此可知,對型錯誤之重要性忽視而導(dǎo)致值之忽略,是最容易造成的錯誤。 其次,若是抽樣樣本不夠大,就算達到假設(shè)之顯著水平,亦無法被證實。以t檢定為例: t之計算方式,簡單來講可由兩部份組成: t 式中,r表示兩個變量間之相關(guān)程度,是受兩個變量間關(guān)系的強弱而定,r/則能夠解釋成作用力(Effect Size),df則可解釋成樣本大小對統(tǒng)計值t的貢獻度,可稱之為研究力(Study

25、Size),將此概念化可轉(zhuǎn)換成下式: 顯著性檢定作用力研究力 作用力是指變量間關(guān)系性之強弱對顯著性檢定之阻礙,研究力是指樣本大小對顯著性檢定之阻礙。 舉一個例子,若在兩個變量間關(guān)系強度不弱時,假定為0.3,其作用力已達中度之水平(注5)。假如采納0.05雙尾檢定,在總樣本數(shù)只有100個的情況下,則關(guān)系被證實出來的機會不到六成,假如0.01時,則機會趕忙下降至不到四成。由此可見,假如研究的樣本不夠大,就確實是有關(guān)系存在的事實,也無法被證實。 Cohen曾提出一套測定及相對嚴(yán)峻性的指標(biāo),稱之為/比,即在一定的作用力及固定的樣本大小下,每設(shè)定一個值,就相對產(chǎn)生一個值(注6)。藉此觀念,可整理出如表2

26、2的計算值(注7)。表22 作用力與顯著水平之關(guān)系effectt size() and significance level(.05 and .10) N = r=.10 .05 .10 r=.30 .05 .10 r=.50 .05 .10 1020304050607080901001201401601802003004005006007008009001000 19 9 19 9 18 8 18 8 18 8 18 8 17 8 17 8 17 8 17 7 16 7 16 7 15 6 15 6 14 6 12 5 10 4 8 3 6 2 5 2 4 1 3 2 17 8 15 6 1

27、3 5 10 4 9 3 7 2 6 2 4 1 4 1 3 2 1 13* 5+ 7* 2+ 3 1 2 Note:Entries are to nearest integer;blanks indicate values1.*For r=.70 these ratios would drop to 6 and 1,respectively.+For r=.70 these ratios would drop to 2 and 1,respectively. 由表22可了解到問題的嚴(yán)峻性,當(dāng)關(guān)系強度不是專門高時(r=0.1),假如樣本數(shù)不是專門大(樣本數(shù)不超過100),型錯誤的機率將高出型錯

28、誤機率專門多,此意味著:專門容易忽略或否認兩個變量間既有的關(guān)系。五、問卷信度未建立未建立信度或使用不當(dāng)?shù)呐卸ㄐ哦确椒?,可能以偏概?.信度評估的概念 可靠度評估(reliability evaluation)在問卷調(diào)查時又稱為信度評估,在今日各種科學(xué)的量化研究中是專門重要的一環(huán),問卷的信度與效度如未建立,則整個投入時刻、人力與金鈔票等資源的研究或調(diào)查專門可能結(jié)果毫無可信之處。 在問卷信度評估的過程中,常用到不同的統(tǒng)計方法加以分析,但是許多研究者或調(diào)查者通常不了解信度的內(nèi)容事實上甚為廣泛,可概略分為再測信度(test-retest reliability)、客觀性(objectivity)、內(nèi)部

29、一致性(internal consistency)等多個項目,因此往往在此情況之下其研究或調(diào)查結(jié)果因為沒有建立信度而變得毫無價值。 不同種類的信度、不同種類的數(shù)據(jù)及不同的實驗設(shè)計都需要以不同的統(tǒng)計指標(biāo)作為評估的方式,專門多時候在同一份問卷的審查過程中需要用到多種的指標(biāo)以判定其可信的程度。 譬如,我們可能需要以內(nèi)在等級相關(guān)(Intra-Class Correlation,簡稱ICC)系數(shù)評定其再測信度;再以Cronbachs 審定其內(nèi)部一致性;有時候還需要以重復(fù)測驗變異分析(Repeated Measures ANOVA)來找出是在問卷問題本身、亦或是不同的訪員、甚至是不同的研究對象方面發(fā)生了不

30、可信的因素。2.常犯的錯誤情形 在許多研究與調(diào)查中發(fā)覺:問卷信度未建立的情形不在少數(shù),這使得研究或欲調(diào)查問題全然無法得到確實的答案與結(jié)果,且未建立信度的問卷所得到的數(shù)據(jù)往往不僅沒有結(jié)構(gòu)可言,其結(jié)果更可能過于主觀與發(fā)生以偏概全的情形。 在此所講的以偏概全,是指某些研究或調(diào)查,僅以一種統(tǒng)計方式來證明整份問卷的可信度。Cronbachs 點可能的方法是在一般研究中最常出現(xiàn)的問卷信度分析法,但許多研究或調(diào)查僅以Cronbachs 點可能值超過0.7,就認為問卷可信而實施訪問,盡管這些研究者或調(diào)查者在Cronbachs 的使用上、計算上或解釋上并無錯誤,但殊不知Cronbachs 這一指針僅顯示以一個總

31、分代表類似的問題是否合理,而不能僅以此一指標(biāo)有信度就認為整份問卷可正式實施訪問。 此外,在前面提及的再測信度方面,許多人盡管在通過文獻探討后,能夠選擇合適的研究方法,如皮爾森相關(guān)系數(shù)(Pearson Correlation Coefficient)、內(nèi)在等級相關(guān)系數(shù)等,然而,在專門多時候他們并沒有對這些系數(shù)的優(yōu)劣做更深入的探討,只由它們高于預(yù)設(shè)的水平即可(一般常用的臨界標(biāo)準(zhǔn)為0.7),在此要提出的是:皮爾森相關(guān)系數(shù)、內(nèi)在等級相關(guān)系數(shù)在問卷不太可信的情況下,其值仍可能偏高而超過0.7的臨界點(注8)。比如講當(dāng)有系統(tǒng)偏差(systematic bias)時,皮爾森相關(guān)系數(shù)有時會接近于1;而當(dāng)問卷中

32、有許多問題屬重復(fù)性問題時,ICC專門可能高于0.9,且多數(shù)使用者在使用ICC時,不明白ICC有好幾種,而應(yīng)在不同的情況下使用不同的ICC(關(guān)于ICC之使用在此不多述及)。故以此講來,研究者與調(diào)查者在使用時需格外小心。六、多變量分析中對自變項之選擇問題自變項的選擇不應(yīng)先使用單變項方法來決定1.自變項的選擇過程 在此以線性復(fù)回歸來解釋在一般使用多變量分析時常見的操作現(xiàn)象,即是因為多變量分析有多個自變項,故大部份人便會在進行多變量分析前,先以單變項方法(如簡單線性回歸)分析,試圖在眾多的自變項中先找出具有統(tǒng)計意義之項目納入復(fù)回歸分析中。 使用此一方法具有下列兩種好處:首先,假如某些變項在單變項或多變

33、量中都具有統(tǒng)計意義或都不具統(tǒng)計意義,則關(guān)于結(jié)果與解釋都可不能造成太大的阻礙。另一方面,某些自變量在簡單回歸中達到意義,但到了復(fù)回歸中卻意義全失,如此的情形一般也都能找到統(tǒng)計上的緣故,此外,通常假如在分析之前先檢查各自變項間的相關(guān)矩陣(correlation matrix),也不難發(fā)覺其緣故。2.常犯的錯誤情形 以上所述是多變量分析中自變項之一般選擇方法,但我們也發(fā)覺許多文獻中在應(yīng)用多變量分析時,其自變項的選擇完全僅依照研究者或調(diào)查者主觀的推斷而產(chǎn)生,甚至一般的商業(yè)調(diào)查中更無文獻的探討而以經(jīng)驗法則來設(shè)計問卷,如此大概過于武斷而容易主導(dǎo)統(tǒng)計分析的結(jié)果,這是一般最常見的謬誤情形。 然若依循上述之方法

34、,則最常發(fā)生的問題是把單變項分析時,達不到統(tǒng)計意義的變項先行刪除掉,研究者或調(diào)查者認為專門有可能這些自變項假如被放在復(fù)回歸中分析的話,專門有可能可不能有意義,但若其一旦有意義而又被先前淘汰掉的話,則數(shù)據(jù)內(nèi)的含意便會流失。如此一來,則對統(tǒng)計分析的結(jié)果可能造成無法估測的阻礙。七、統(tǒng)計方法正確,但程序編寫錯誤類不性數(shù)據(jù)在程序編寫時須以虛擬變量處理1.問題可能發(fā)生的緣故 大部份的人在從事某項研究或調(diào)查工作時,都會做充分的資料查證、分析與相關(guān)理論、文獻的探討,其中因此免不了會參考其它研究或調(diào)查,只要有相同的架構(gòu)及目的,便采納數(shù)據(jù)中所用到的統(tǒng)計方法;既然有例可循,依此分析自然可將統(tǒng)計方法選擇錯誤的機率降至

35、最低。但惋惜的是,一般研究論文或調(diào)查資料中對統(tǒng)計分析的過程及其運算過程并無完整且深入的提及,許多研究者或調(diào)查者在一知半解的情況下,依樣畫葫蘆的結(jié)果卻造成了更嚴(yán)峻的錯誤,而這些錯誤往往并不是在研究架構(gòu)或統(tǒng)計方法選擇中發(fā)生,而是在軟件的使用與程序的編寫中所犯下的錯誤。 此外,由于各種統(tǒng)計軟件操作使用方法不一,統(tǒng)計報表的研讀方法也不盡相同,在使用者對該軟件不熟悉且信心缺乏的情況下,在操作過程與研讀報表上發(fā)生錯誤的情形也是經(jīng)常發(fā)生的。2.常犯的錯誤情形 一般發(fā)生在統(tǒng)計程序編寫錯誤的情形中,除了人為操作的錯誤外(如鍵入字符錯誤等),較常見的是連續(xù)變項與類不變項間的數(shù)據(jù)轉(zhuǎn)換問題。如某一碩士論文在探討銀行從

36、業(yè)人員的工作中意度中的壓力與壓力來源的問題時,在分析阻礙壓力感高低的因素時,因為壓力在量化后其值介于0與100分之間,為一種連續(xù)性的變項,因此該研究者以逐步線性復(fù)回歸(stepwise multiple linear regression)分析,若在常態(tài)分布、線性關(guān)系、相同變異等統(tǒng)計分析前提都符合的情況下,選擇此一方法并無不合理之處。但在此要注意的是,在這些自變項中有頗多的類不性數(shù)據(jù),有些是兩分的(binary,如性不),有些是有排序的(ordered,如教育程度),還有一些是不排序的(unordered,如不同部門),這些自變量在程序編寫時均需以虛擬變量(dummy variable)方式處

37、理。然在鍵入數(shù)據(jù)的過程中,一般每一個變項都先以1、2、3.,等代號輸入,必須先轉(zhuǎn)換成虛擬變量始可放入復(fù)回歸中,再行檢定其統(tǒng)計意義。唯許多人并未做虛擬變量的轉(zhuǎn)換,而直接把輸入的類據(jù)(即1、2、3.,等)作為自變項的數(shù)值,所跑出來的結(jié)果自然是錯誤的。如此的情形,相信應(yīng)許多見才對。 八、統(tǒng)計方法前后不一致而互相矛盾應(yīng)用統(tǒng)計方法時須符合前提假設(shè)與使用時機1.問題可能發(fā)生的緣故 一個研究或者是調(diào)查工作,一定有其欲研究、調(diào)查之問題與目的,然后依循此問題與目的,通過充分的文獻探討,再進行到研究的設(shè)計、數(shù)據(jù)分析與結(jié)論。這是一個個部份環(huán)環(huán)相扣的過程,而在量化研究中調(diào)查問卷的更是需要依照研究的目的、理論的應(yīng)用等來

38、設(shè)計,再以適合的統(tǒng)計分析方法來得到欲知的結(jié)果。 但在某些研究或調(diào)查中發(fā)覺,許多被采納的研究方法是依照問卷的問題來隨意采納的;比如講,碰到自變項與依變項皆為連續(xù)性的數(shù)據(jù)時,就應(yīng)用相關(guān)分析、復(fù)相關(guān)分析等。而當(dāng)依變項為連續(xù)性數(shù)據(jù),而自變項為類不性數(shù)據(jù)時,則立即會考慮變異數(shù)分析、t考驗等。若依變項與自變項兩者皆為類不性數(shù)據(jù)時,則又會使用考驗。但這些使用者往往并不明白各種分析方法之前提假設(shè)與使用時機,甚至有些問卷設(shè)計毫無理論支持,更遑論使用適當(dāng)?shù)姆治龇椒恕?歸咎緣故,這種統(tǒng)計方法前后矛盾的情形乃是因為研究者或調(diào)查者對研究方法或統(tǒng)計分析理論的不熟悉所致,而此種情況,最常出現(xiàn)在一些商業(yè)雜志的意向調(diào)查中,其

39、結(jié)果也常常過于主觀而不正確。2.常犯的錯誤情形 所謂統(tǒng)計方法前后不一致,舉例來講,某商研所之碩士論文研究國中學(xué)生對飲料的購買行為,該研究以購買地點為依變項,而該變項之測量以李克五點量表給分(15分),故為一連續(xù)性的變項,此外該研究依購買頻率將國中生分為高、中、低三種消費群。在此,研究者認為三種消費群的購買地點之變異數(shù)差距太大,而購買地點不論在任何消費群都不太依循常態(tài)分布,故他以無母數(shù)方法之威克森等級和測驗(Wilcoxon rank sum test)處理;而當(dāng)他試著了解購買地點與其它變項(如信息來源等)個不之關(guān)系時,都以Pearson相關(guān)分析,如此的分析方法看起來是能夠同意的。惋惜的是,當(dāng)他

40、進一步了解在有意義的變項(即上述之信息來源等,在計算Pearson相關(guān)分析時之P-值少于0.05者)調(diào)整后,各消費群的購買地點是否仍有顯示差異時,卻使用了復(fù)回歸分析法。我們明白,在使用復(fù)回歸時,必須遵循一些統(tǒng)計的前提假設(shè),其中兩個假設(shè)便是常態(tài)分布及相同變異,而這兩個假設(shè),尤其是相同變異對統(tǒng)計結(jié)果的阻礙甚巨,偏偏在該研究論文內(nèi)又如前述地使用了威克森等級和測驗和Pearson相關(guān)分析,直接與間接的否定了這兩個假設(shè)的可能性。這類型前后互相矛盾的統(tǒng)計方式,也是應(yīng)當(dāng)特不注意及幸免發(fā)生的。九、統(tǒng)計圖表利用不當(dāng)統(tǒng)計圖表應(yīng)視統(tǒng)計數(shù)據(jù)的特性來選用1.統(tǒng)計圖表之應(yīng)用 統(tǒng)計圖表在統(tǒng)計應(yīng)用方面亦是特不重要的一部份,因

41、為文圖的整合可使閱讀數(shù)據(jù)者能清晰的從圖表中明白數(shù)據(jù)的特性及研究或調(diào)查所想要表達的結(jié)果,而好的統(tǒng)計圖表的運用則更能夠吸引讀者的視線而增加閱讀的興趣。 更重要的是,在許多趨勢分析上,統(tǒng)計圖的運用能使讀者一目了然,舉例而言,在統(tǒng)計圖中最簡單與常見的要確實是曲線圖,它能利用線條的變化性,明白的顯示出以往的情況,使讀者容易地去預(yù)測出以后的進展趨勢,如圖22所示。圖22 公司十年內(nèi)營運收入統(tǒng)計表 由圖22中可知,該企業(yè)的營業(yè)收入除在1987至1989年間是下降外,整體而言是逐年成長的。另外,在實務(wù)的運用上,我們也可由圖表中立即來分析分析究竟是何緣故導(dǎo)致該年度區(qū)間內(nèi)使得收入下降,如此一目了然即是統(tǒng)計圖表的優(yōu)

42、點所在。 除此之外,在日常生活中一些常見的統(tǒng)計圖表還有如區(qū)域圖、柱形圖、橫條圖、折線圖、莖狀圖、散布圖、餅圖等等,然而在運用與解讀上應(yīng)特不注意各種圖形的特性,以免造成事倍功半的缺失。2.常犯的錯誤情形 在運用統(tǒng)計圖表時應(yīng)注意數(shù)據(jù)本身的特性,要明白并非每一類型的資料都能運用在各類的統(tǒng)計圖中,運用不得當(dāng),不但無法指導(dǎo)讀者了解數(shù)據(jù)的特性,更反而容易誤導(dǎo)讀者歪曲數(shù)據(jù)的正確性。而讀者在閱讀統(tǒng)計圖表時,也應(yīng)特不注意資料的橫軸(X軸)與縱軸(Y軸)的單位,以免誤解它所表示的意義。 一般常容易造成讀者發(fā)生上述錯誤的確實是:原點不是零的統(tǒng)計圖。如圖23。圖23 市消費者物價指數(shù)圖 由圖23中可清晰的看出,縱軸底

43、端指數(shù)從80往上加,并非由零開始,縱使圖中的數(shù)據(jù)并無錯誤,但往往會讓粗心或匆忙的的讀者誤解,認為該指數(shù)是由中途開始攀升的。 其次另一個常見的例子確實是,某些統(tǒng)計圖的橫坐標(biāo)或縱坐標(biāo)所用單位容易讓讀者混淆,若不認真分析則會產(chǎn)生誤解,如圖24。圖24 地區(qū)失業(yè)率 由上圖可看出,其縱軸為百分比(),而每一單位基數(shù)為1累加,光由該圖看來會使人覺得地區(qū)失業(yè)率起伏專門大,但若了解上述講明,則會發(fā)覺事實上是本圖使讀者產(chǎn)生的誤解。 最后要提醒統(tǒng)計圖表讀者的是,要真正了解統(tǒng)計資料的結(jié)果光靠統(tǒng)計圖表是不行的,還要熟讀統(tǒng)計文獻的內(nèi)容,更甚者,還要弄清晰各項數(shù)據(jù)所運用的理論及其所代表的意義。尤其在一些生活應(yīng)用上的財務(wù)分

44、析、經(jīng)濟等方面的圖表更是如此,例如,你光看著某一項期貨日指數(shù)曲線節(jié)節(jié)上升,但要明白有時指數(shù)上升未必是利多的的情況,此點相信是更重要的事。 十、其它 最后,提到一些較無法歸類的錯誤。 第一,我們在某些論文中會發(fā)覺,在名詞的選擇上會使人產(chǎn)生誤解。舉個簡單的例子,在專門多研究消費者行為的文獻中都會提及知覺(perception)理論與認知(recognition)理論,但往往并沒有嚴(yán)格的區(qū)不其不同處,使得非此學(xué)術(shù)領(lǐng)域的讀者往往會覺得兩者大概是相同的,如此講來大概對統(tǒng)計分析上的阻礙不大,但有時會發(fā)覺連研究者本身都對該名詞產(chǎn)生混淆,再作統(tǒng)計推論時則會使結(jié)果被誤導(dǎo)。而且在一些醫(yī)學(xué)研究中若發(fā)生名詞選用錯誤的

45、情形,嚴(yán)峻者,則會產(chǎn)生不可預(yù)測的后果。 第二,有些研究或調(diào)查所犯的錯誤,則是在整篇文章中,不論是方法或者是結(jié)果部份,都沒有提到研究或調(diào)查中所使用的統(tǒng)計方法為何?而在結(jié)果或討論中,卻有P-值(或其它統(tǒng)計值)的報告,這些P-值等的背后所使用的方法是對是錯則全然無法評估,這種情形亦是屢屢見到。注釋1.顏月珠(臺灣大學(xué)財務(wù)金融學(xué)系教授),商用統(tǒng)計 學(xué),三民書局八版,民國82年8月,P197。2.同注1,P222。 中央極限定理(Central Limit Theorem)的定義: 設(shè)一機率函數(shù)f(x),其均數(shù)為u,變異數(shù)為;由其中抽取樣本大小為n的樣本,得樣本均數(shù)為,令,則當(dāng)n時,Z的分配以標(biāo)準(zhǔn)常態(tài)分

46、配為其極限。亦即不論母體為何種分配,當(dāng)樣本大小n時,樣本均數(shù)的抽樣分配均以常態(tài)分配為其極限,其E()u,V()。3.盧成皆、李瑛慈,醫(yī)學(xué)研究中常見之統(tǒng)計分析謬 誤,中國統(tǒng)計學(xué)報,第33卷第2期,民國84年6月, P285。4.Shelby D. Hunt, Mondern Marketing Theory:Critical Issues in the philosophy of Marketing Science, Ohio, Cincinnat, U.S.A.:South-western Publishing Co,chap5.5.J. cohen, Statistical power An

47、alysis for Behavioral Sciences, Academic Press, New York, U.S.A.1977.6.同注5。7.同注5。8.同注3。 參、結(jié)論與建議非專業(yè)的統(tǒng)計方法所得的結(jié)果是值得懷疑的一、結(jié)論 統(tǒng)計方法在日常生活中或?qū)W術(shù)領(lǐng)域上能夠關(guān)心我們從一堆繁雜的數(shù)據(jù)數(shù)據(jù)中,藉由一些統(tǒng)計量的計算、可能和檢定,來了解母體的特性。但數(shù)字本身是死的,重要的是我們?nèi)绾稳ソ忉屵@些數(shù)字,如何給予它們專門的意義,因此,在我們看一個統(tǒng)計數(shù)字及不人給它下的推論時,應(yīng)該不要隨便輕易地相信它,因為有時候,數(shù)字是專門聳動的,這時就可能會有某些人為了某些目的或因?qū)y(tǒng)計的不了解,而利用統(tǒng)計數(shù)

48、字講謊或誤用了統(tǒng)計。我們在閱讀統(tǒng)計資料時應(yīng)做一個聰慧的讀者,不要被這些誤用統(tǒng)計的情形所蒙騙。 在此提供五項原則來關(guān)心我們?nèi)ナ∷妓玫降慕y(tǒng)計數(shù)字,是不是確實有足夠的把握去下那樣的結(jié)論,及它的正確度有多少。1.原則一:Who Say So? 我們常??煽吹?,不論在報章或雜志上的文章內(nèi)容有如此的陳述:依照某某調(diào)查顯示.或是某某研究報告指出.我們一定要特不注意接下來的結(jié)論,確實是所謂正確的統(tǒng)計分析結(jié)果嗎?就如先前所講的,統(tǒng)計數(shù)字雖能講話,但它所表達的言語全靠這些研究或調(diào)查者來詮釋,因往往我們看不到這些分析與推論的過程,而是直接面對他們給我們的結(jié)論,那我們?nèi)绾蚊靼资钦l講的呢?若是有人刻意利用統(tǒng)計數(shù)字來歪

49、曲事實,那豈不是讓讀者誤會了無辜的統(tǒng)計數(shù)字了。2.原則二:How Does He Know? 你一定看過一些專門明顯的大標(biāo)題,看了讓人嚇一大跳,例如,在年月日的某報紙刊載了如此的標(biāo)題:每三對夫妻中,就有一對有婚前性行為。假如我們就如此相信了,那大概這篇報導(dǎo)就有違統(tǒng)計學(xué)所應(yīng)負的社會責(zé)任了,因為它并無講明如何統(tǒng)計分析而得知的結(jié)果,而使得讀者被欺騙或誤導(dǎo)。 因此,在閱讀某些乍看是統(tǒng)計的資料時,我們絕對不能依它的結(jié)論而下推論,我們應(yīng)該先想到一個問題:他如何明白的?在一般的研究調(diào)查中,這就牽涉到方法與信度的問題,如前章節(jié)所述,在此不多做補述。3.原則三:Whats Missing? 在一般的文獻中,多數(shù)

50、的研究者與調(diào)查者在其有限的篇幅中,并可不能詳列統(tǒng)計分析的過程與計算步驟,更甚者,在某些文章中亦可不能告訴我們有多少抽樣樣本、用何種抽樣方法、問卷如何設(shè)計、研究如何設(shè)計、信賴區(qū)間為何等等,或許連研究調(diào)查的日期都不得而知,但往往這些沒有出現(xiàn)的訊息,涵蓋了足以讓我們分析數(shù)據(jù)的可信度與其它重要的意義,因此,在我們閱讀一份統(tǒng)計資料時,應(yīng)該察覺它是不是遺漏些什么重要的信息,然后再決定該如何下定論。 作為一個理智的統(tǒng)計資料運用者,應(yīng)時時警惕資料是否完整,千萬不只是隨便一翻,如此難保可不能使自己誤信了有偏誤的統(tǒng)計推論。4.原則四:Did Somebody Change The Subject? 或許,你也曾看

51、過如此的廣告詞:依照調(diào)查,使用品牌的人,其中意度遠高于使用其它品牌的人。但這有可能指示廣告商的一種營銷策略而已。看統(tǒng)計文獻的時候,最怕的確實是因不了解統(tǒng)計分析的過程而被誤導(dǎo),要明白,調(diào)查的母體不同則推論的結(jié)果因此也就不同。許多人會妄將統(tǒng)計的主題改變而使讀者有錯誤的認知。因此,讀者必須自己做好把關(guān)的工作,因為文章的作者或許不是有意的偏歪事實,但可確信的是,最后將事實偏歪的可能是讀者你自己。 舉一個例子,在一本家庭社會學(xué)中提到:美國1984年的離婚率是47。乍看之下,表示每兩對夫妻中,就有一對會離婚,但事實是如何?好險在書中的附注有講明此一離婚率的計算,是由全年離婚夫妻對數(shù)除以該年新婚夫妻對數(shù),再

52、乘以100,但此一算法容易引起讀者的恐慌與爭議,因為離婚和新婚的人差不多上是沒有關(guān)連的,因此,另一種較合理的計算方式為:全年的總離婚對數(shù)除以該年的總結(jié)(已)婚對數(shù),再乘以100,如此大概較合情合理。5.原則五:Does It Make Sense? 這是一個最重要的問題,即是:如此的推論有意義嗎?以一個報紙的收視率調(diào)查為例;某時刻八點檔連續(xù)劇收視結(jié)果如下,華視36、臺視34、中視26,故華視大獲全勝。但認真分析之,如此的推論有意義嗎?那個地點的數(shù)字是否能下如此的推論,其信賴區(qū)間并未提及,且抽樣是否偏重于某一地區(qū)而導(dǎo)致抽樣誤差,如此光是2的差距,就能分辨出收視情形的優(yōu)劣大概是太危言聳聽了。 由此

53、可知,統(tǒng)計數(shù)字本身是無辜的,但看人如何去解釋與給予其正確的意義,在閱讀統(tǒng)計資料時,千萬應(yīng)警覺該推論是否確實可信。二、建議 最后,針對前述各項統(tǒng)計應(yīng)用上常見的錯誤提出幾點建議。1.在樣本大小與抽樣方法方面 一般人常迷信大量的樣本,但事實上若大量而有偏差的樣本,表面上雖看似不錯,但事實上只是一再的重復(fù)其偏差而已,反而將導(dǎo)致結(jié)論的誤差更加嚴(yán)峻。 因此,唯有慎選適當(dāng)?shù)某闃臃椒?,選取較小規(guī)模的隨機樣本,并盡可能的降低抽樣誤差、反應(yīng)誤差及無反應(yīng)誤差等,并提高問卷的回收率。故依照所要研究的方向,選取合適的抽樣方法才能提高調(diào)查結(jié)果的正確性,如此也是較具實質(zhì)意義的。2.在P-值的誤用方面 在如前述的P-值和相關(guān)

54、系數(shù)間的問題,可藉由其它統(tǒng)計方法之計算來增加P-值的引用正確性。 如信賴區(qū)間之計算,它除了能夠了解樣本相關(guān)系數(shù)的變異情形外,亦能夠檢查這一區(qū)間是否包含可靠度定義之標(biāo)準(zhǔn),以做出適當(dāng)?shù)慕Y(jié)論。3.在統(tǒng)計檢定力方面 型錯誤被忽視的嚴(yán)峻性是有其討論的必要的。盡管教科書中常有如下的敘述:型錯誤比較嚴(yán)峻,故可不理會型錯誤。但要明白值的計確實是會阻礙整個統(tǒng)計檢定力。 欲增加作用力的阻礙可藉由四個方面著手(注1):第一:選用適當(dāng)?shù)慕y(tǒng)計值,例如在組間或組內(nèi)有線性回歸關(guān)系存在時,選用r比t值好,因為t值無法取得線性回歸之趨勢。第二:值之設(shè)定,在可容許的范圍內(nèi)適度提高值,而使值下降,或是在一般顯著水平下,檢定結(jié)果不具

55、顯著性時,應(yīng)將P值計算出來。第三:樣本大小的調(diào)整,樣本愈大時,值及值能夠同時兼顧。第四:作用力大小亦可阻礙檢定力,假如作用力愈大,則值愈小,然而作用力是被研究的對象,通常是一個未知數(shù)。4.多變量分析中自變項的選擇方面 依照一般決定多變量分析中自變項之方法中,發(fā)生單變項中不具統(tǒng)計意義,但于多變量分析中有統(tǒng)計意義的緣故,大致可歸納如下:(1)干擾因子(confounding factor)的關(guān)系,(2)數(shù)據(jù)本身的問題。 欲解決此一問題,前者如Y與X1本來是有顯著相關(guān)的,但卻受到干擾因子X2的阻礙,因此當(dāng)把Y與X1作簡單回歸分析時,X1不一定有意義,假如把X1與X2都納入復(fù)回歸分析的話,再把X2的效

56、果(effect)調(diào)整(adjust)后,則X1便會達成統(tǒng)計意義。后者,因為數(shù)據(jù)本身的問題較常見的為遺漏值(missing value)的刪除問題,故減少遺漏值是一條可行的方法。5.程序編寫錯誤方面 欲明白是否發(fā)生變量轉(zhuǎn)換上的錯誤,可使用察看自由度的方法,部份作者會將回歸結(jié)果以表格方式發(fā)表,當(dāng)以原始數(shù)據(jù)分析,軟件勢必將此變項視為連續(xù)性數(shù)據(jù)處理,其自由度等于1,否則自由度自然應(yīng)是該變項所含之層次(level)數(shù)目減1。 除此之外,若沒有自由度報告的話,有時亦能夠憑參數(shù)可能(parameter estimate)推斷,因為三個層次(level)之變項會變?yōu)閮蓚€虛擬變數(shù),而每個虛擬變量均被軟件視為一

57、個自變項,因此會有兩個參數(shù)可能值,連續(xù)性自變項則只有一個可能值。 比較困難的是當(dāng)自變項為兩分變項時,不論以虛擬變量或連續(xù)性數(shù)據(jù)方式處理,其自由度均為1,亦只有一個參數(shù)估值,現(xiàn)在唯有依經(jīng)驗與察看上下文來推斷而已了。6.統(tǒng)計方法前后不一致與統(tǒng)計圖表不當(dāng)利用方面 為幸免此類問題發(fā)生,希望使用統(tǒng)計分析之研究者應(yīng)注意,若對統(tǒng)計方法一知半解,專門容易造成論文內(nèi)容不同程度的謬誤,應(yīng)該明白光靠參考已發(fā)表的論文是不夠的,因為論文篇幅有限,詳細的數(shù)據(jù)分析過程往往可不能在論文中介紹,因此應(yīng)與統(tǒng)計專家合作,請教正確的統(tǒng)計方法、分析過程與結(jié)果闡釋。 此外,亦建議常用統(tǒng)計圖表的作者,在使用圖表時亦應(yīng)提升圖表的適合性,幸免

58、圖表的誤用導(dǎo)致數(shù)據(jù)特征的偏頗,而使讀者蒙受其害。 注釋1.Robert Rosenthal and Ralph L. Rosnow, Essentials of Behavioral Research:Methods and Data Analysis, McGRAw-HILL, Inc, New York, U.S.A.,1991,2nd. editor,P452.肆、附錄附錄一:統(tǒng)計在生活上的應(yīng)用 一般人對統(tǒng)計的概念大概仍停留在一些主觀的刻板印象之中,人們總是誤把統(tǒng)計和數(shù)學(xué)聯(lián)想在一起;認為統(tǒng)計總是在玩弄一些數(shù)字上的游戲,因此認定統(tǒng)計應(yīng)為某種應(yīng)用數(shù)學(xué),因此統(tǒng)計就應(yīng)和數(shù)學(xué)一樣沒有什么有用的價值

59、可言。這點是必須加以澄清的;實際上,統(tǒng)計確實是以數(shù)學(xué)中的部份理論為基礎(chǔ),但它僅是以其為運算工具,而配合現(xiàn)實環(huán)境中我們所關(guān)懷的相關(guān)問題,進展出一種透過運用資料搜集、匯總、整理及分析的科學(xué)方法,來解決與達成我們的需求。因此,統(tǒng)計和人們確實有著密不可分的關(guān)系。 以下,讓我們來看看統(tǒng)計究竟在人們?nèi)粘I钪惺侨绾伟l(fā)揮它的阻礙力。茲將一般常見的應(yīng)用分述如下:一、民意調(diào)查統(tǒng)計: 選舉前為了解選民對各政黨及候選人的意向所做的調(diào)查,或是對某項政府施政與重要公共政策實施前后所做的調(diào)查皆屬此一范疇。這類調(diào)查要緊皆屬于對統(tǒng)計抽樣理論之實際應(yīng)用,故抽樣母體之代表性往往決定了調(diào)查結(jié)果的適用范圍。二、收視率調(diào)查統(tǒng)計: 隨著

60、有線電視的快速普及,競爭激烈的電視臺間為了解其節(jié)目收視率,因此興起了此一調(diào)查,而廣告商亦對其相當(dāng)重視,一方面欲了解廣告的收視率,另一方面需了解某一類型的節(jié)目收視率,以決定廣告推出的時刻是否有較大之效益。而此一調(diào)查結(jié)果亦往往因抽樣母體及資料收集技巧(訪員電話訪問、計數(shù)器等)之好壞而決定調(diào)查結(jié)果之信度。三、運動統(tǒng)計: 運用于各種球類競賽中相關(guān)資料的搜集,如球員攻守統(tǒng)計、球隊?wèi)?zhàn)績勝負等,以做為教練與球迷分析與參考之用。值得一提的是,目前許多職業(yè)運動皆成為賭徒一擲千金的工具,此一資料恰可提供他們下注的依據(jù)。四、人口統(tǒng)計: 有關(guān)出生率、死亡率、婦女生育率、平均生育子女?dāng)?shù)等與整體人口結(jié)構(gòu)間關(guān)系性的探討都屬

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論