統(tǒng)計應(yīng)用上常見的謬誤

上傳人：c*** IP屬地：江蘇上傳時間：2022-07-27 格式：DOC 頁數(shù)：62 大?。?58.51KB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩57頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng) 計應(yīng) 用上常見的謬誤謝邦昌輔仁大學(xué)統(tǒng)計系教授兼主任葉瑞鈴輔仁大學(xué)應(yīng)用統(tǒng)計研究所研究生壹、緒論讓統(tǒng)計結(jié)果更接近事實一、研究動機統(tǒng)計是一門新興的科學(xué)，可號稱是人類在二十世紀(jì)的十個偉大發(fā)覺之一。自二十世紀(jì)初，從Neyman、Pearson及Fisher等人發(fā)表一連串開拓性論文之后，統(tǒng)計便不斷地蓬勃進展，一直到今天，不論在自然科學(xué)或是社會科學(xué)的各個領(lǐng)域中，都找得到它的蹤跡。事實上，它已成為我們生活中的一部份。隨著現(xiàn)代科學(xué)的不斷進展，統(tǒng)計學(xué)不僅早已從數(shù)學(xué)中獨立出來，而也已成為在社會科學(xué)研究上的一種專門的學(xué)科。今日在科學(xué)研究中，統(tǒng)計分析的應(yīng)用早已有其不可或缺的重要地位，不僅于此

2、，在一般人的生活周遭上的應(yīng)用上，甚至在個人理財活動中都少不了統(tǒng)計分析的應(yīng)用。因此，將統(tǒng)計學(xué)當(dāng)成一種解決問題、尋求真相的工具，咸信將使統(tǒng)計對人們的生活產(chǎn)生更大的阻礙及關(guān)心。統(tǒng)計的應(yīng)用范圍極廣，其方式要緊在搜集、整理、陳示、分析及解釋資料。并可在較少的成本花費下將吾人有興趣的事物之全體（注1）抽出一部份來觀看與研究（注2），然后依照所得到的信息用科學(xué)的數(shù)量方法來推測所欲了解的事實。因此依照以上所述，統(tǒng)計學(xué)又分為敘述統(tǒng)計與推論統(tǒng)計兩大部份。現(xiàn)在各方面的研究工作者無一不將統(tǒng)計學(xué)視為最有關(guān)心的工具之一，除了在一般的學(xué)術(shù)研究之外，尤其在工商業(yè)的各項業(yè)務(wù)，如財務(wù)、工管、銷售等，都需要應(yīng)用統(tǒng)計資料及統(tǒng)計方法

3、來作分析及推論，方能使各項工作順利完成（注3）。近年來，統(tǒng)計確實已受到學(xué)界及工商業(yè)界的普遍應(yīng)用；不管是學(xué)術(shù)研究論文、期刊，或者是政府出版品，乃至于民間企業(yè)刊物、雜志等，都可看到統(tǒng)計應(yīng)用的大幅成長與統(tǒng)計專業(yè)程度的要求明顯提高。但閱讀與參考這些文獻、資料的讀者往往只專注于統(tǒng)計數(shù)字的大小，而忽略了數(shù)字背后的涵義，殊不知許多數(shù)字可能因為統(tǒng)計分析方法的誤用而導(dǎo)致結(jié)果推論的錯誤。因此，探討一般常見的統(tǒng)計分析應(yīng)用上的誤用情形，為本研究的第一個動機。研究統(tǒng)計的人都一直深信著統(tǒng)計數(shù)字中永久隱藏著某些事實的真相，等待人類的智慧去查找。多年前有位學(xué)者講：Statistics may not tell the t

4、rue, but it never lies.（注4）。這句話反應(yīng)出統(tǒng)計數(shù)字也許不能告訴我們真相，然而它絕對可不能撒謊，只有人們才會這么做。因此，如何使統(tǒng)計數(shù)字講出真話，并找出統(tǒng)計誤用的緣故及補救的方法，為本研究的第二個動機。二、研究目的統(tǒng)計理論接著不斷的進展，其所論述的范圍及應(yīng)用的層面愈來愈廣，統(tǒng)計除了可敘述數(shù)據(jù)、推論數(shù)據(jù)外，更重要的是其預(yù)測性的功能。因此，如何善用統(tǒng)計分析工具以關(guān)心完成決策與驗證實驗假設(shè)，實已成為企業(yè)經(jīng)營治理與科學(xué)研究之重要課題。以周密的設(shè)計，搜集完整的有關(guān)資料，通過適當(dāng)?shù)慕y(tǒng)計分析所得的結(jié)果作為依據(jù)，才能使所冒的風(fēng)險與失策的可能愈小，而迅速得到預(yù)期的目的（注5）。綜合以

5、上所述與研究動機，遂引發(fā)本研究之目的：（1）探討統(tǒng)計分析應(yīng)用上常見的錯誤情形。（2）了解統(tǒng)計分析誤用的緣故及探討其補救的方法。三、研究范圍統(tǒng)計的應(yīng)用與分析方法的范圍甚廣，本研究僅就下列二部份進行探討：（1）學(xué)術(shù)研究部份：針對各類學(xué)術(shù)論文之研究設(shè)計、資料分析、論文撰寫部份加以討論。（2）日常生活應(yīng)用部份：如民意調(diào)查、收視率調(diào)查等等生活上常見的統(tǒng)計應(yīng)用方面加以討論。本研究先針對上述二個范疇中常犯的錯誤情形加以討論，其次以實際的情形舉例講明，并討論其改進與補救方法。此外，文內(nèi)所提之例子并不列出其出處，一方面維護他人寫作之權(quán)益，另一方面保障并尊重其隱私權(quán)。注釋1.在統(tǒng)計的術(shù)語中稱之為母

6、體。2.在統(tǒng)計的術(shù)語中稱為母體的任何部份集合為樣本。3.蔡宗儒（淡江大學(xué)統(tǒng)計系講師），統(tǒng)計與生活，社教資料雜志，第二二期，p4。4.鄭天澤（政治大學(xué)統(tǒng)計研究所副教授），統(tǒng)計之應(yīng)用，社教資料雜志，第二二期，p3。5.顏月珠（臺灣大學(xué)財務(wù)金融學(xué)系教授），商用統(tǒng)計學(xué)，三民書局八版，民國82年8月。貳、統(tǒng)計應(yīng)用常犯的謬誤在本部份，將分不針對實務(wù)應(yīng)用上在統(tǒng)計分析時常見之錯誤情形，經(jīng)歸納與整理后分述于后。一、抽樣方法的不適當(dāng)樣本是否能代表母體 ? 1.抽樣方法概論差不多上，抽樣理論包含三個要緊的部份抽樣、可能、推論。抽樣在于給予從母體抽取樣本的規(guī)則；可能在于利用樣本統(tǒng)計給予母體值的點可能；推論

7、在于給予母體值的區(qū)間可能。在本部分僅針對抽樣部份進行探討。抽樣方法在統(tǒng)計中的重要性可由圖21中清晰的看出。圖21 抽樣對統(tǒng)計之重要性圖示為了解母體的性狀，經(jīng)由抽樣調(diào)查，并以其結(jié)果推測母體，此為統(tǒng)計推論的必要過程（注1）。抽樣方法選擇的適當(dāng)與否，不僅阻礙著如何可能，而其精確（precision）度及誤差（error），皆關(guān)系著整個樣本是否可有效的推估母體。此外，在實務(wù)應(yīng)用上，抽樣方法也涉及兩個重要的因素：即效率與成本。提高效率與降低成本為每個從事研究或調(diào)查者所追求的目標(biāo)。抽樣方法可分為：機率抽樣與非機率抽樣兩種。在此我們可簡單的將兩者加以區(qū)不：機率抽樣可推估母體；非機率抽樣因其較主觀而產(chǎn)

8、生偏歪樣本，故只能找出母體的某些特性，而未必能推估母體。故一般較嚴(yán)謹(jǐn)?shù)恼{(diào)查或研究其抽樣皆往常者方式為之。而常見的機率抽樣又可分成：單純隨機抽樣（simple random sampling）、分層隨機抽樣（stratified random sampling）、部落抽樣（cluster sampling）、系統(tǒng)抽樣（system sampling）、多時期抽樣（multi-stage sampling）。非機率抽樣則以任意抽樣（convenience sampling）、推斷抽樣（judgement sampling）、配額抽樣（quote sampling）為代表。選擇抽樣方法時之差不多考

9、慮為：樣本結(jié)構(gòu)是否和母體結(jié)構(gòu)有一致性。因此這也是為何在完成抽樣后必須作適合度檢定的理由，基于此項大原則我們才可選擇適合母體結(jié)構(gòu)的抽樣方法。在此對各抽樣方法及其專門步驟不作多述，僅將其優(yōu)、缺點及適用時機列于表21。表21 各種抽樣方法之比較抽樣方法優(yōu)點缺點適用時機簡單隨機抽樣法分層抽樣法部落抽樣法系統(tǒng)抽樣法1.母體名冊完整時，直接由母體中隨機抽出樣本，方法簡單。2.由于抽出機率均等，較易可能母體總值及抽樣誤差。1.層間差異愈大，層內(nèi)差異愈小。2.適當(dāng)分層抽樣推論之誤差，恒較簡單抽樣為低。3.可得到各層之可能值。1.當(dāng)部落間差異愈小，部落內(nèi)差異愈大，則抽出樣本統(tǒng)計精確度愈高。2.部落內(nèi)樣本較為集中

10、，訪查員行動半徑不大，可節(jié)約調(diào)查人力及費用。1.隨機起號僅需抽出一個，以后累加即可。2.當(dāng)個體序列成隨機出現(xiàn)時，其推估精確度和簡單抽樣相同。1.通常推算結(jié)果之精確度，較分層集體、分段抽樣法為低。2.由于抽出樣本較為分散，所需調(diào)查人力費用較高。3.無法可能子母體特征。分層后之樣本數(shù)據(jù)，其整理推算工作，通常較簡單抽樣為繁。1.以部落為抽樣單位，各項整理統(tǒng)計費用將會增加，故一般多采成對抽取，便于可能誤差。2.通常在各部落內(nèi)分子無甚差異時，將增加部落間差異，調(diào)查結(jié)果誤差必大。3.各部落內(nèi)含個體多寡不同時，亦使誤差加大。1.當(dāng)母體名冊和個體單位數(shù)不完整時，無法采納。2.遇有個體成某種周期序列，又恰與抽樣

11、間隔相近時，則抽樣誤差較大。1.母體較小且明白抽樣單位的數(shù)量。2.有較完整的母體名冊。3.單位訪問成本較為固定。4.母體名冊是有關(guān)母體信息的唯一來源。1.當(dāng)樣本的分層達到各層的抽樣單位的特性盡量接近，而層與層之間的差異盡可能地擴大時使用。2.當(dāng)母體中的專門單位較多或分布不均勻時，為幸免抽樣誤差亦使用之。1.當(dāng)母體成若干部落，且部落與部落間個體同質(zhì)，而同一部落內(nèi)個體異質(zhì)時使用。2.當(dāng)無法取得母體集團名冊或劃樣樣本對象為前提時使用。1.母體有現(xiàn)成次序的場合時使用。2.使用此法時于劃分間隔抽取的母體，其所有個體的排列次序必須是隨機的。抽樣方法優(yōu)點缺點適用時機多時期抽樣法任意抽樣法推斷抽樣法配額抽樣法

12、1.多時期抽樣法為群集與分層抽樣之折衷方法，兼取兩者之優(yōu)點。2.配合行政區(qū)域抽樣，抽取手續(xù)與調(diào)查治理均較便利。依照調(diào)查者自身的方便程度，不依據(jù)特定的抽樣原則，具有經(jīng)濟、方便之優(yōu)點。可由人為意志自由選擇調(diào)查對象，不受抽樣設(shè)計條件之各種限制，容易進行調(diào)查。適用于母體集團無法取得，且抽樣手續(xù)簡便，為營銷研究者所樂于使用。分段抽樣之誤差可能加大，且整理分析較其它抽樣復(fù)雜。調(diào)查結(jié)果容易產(chǎn)生偏誤，如盲人摸象。調(diào)查結(jié)果無法推估母體平均數(shù)及抽樣誤差，如選擇不當(dāng)，其誤差可能甚大。合乎條件之樣本難得，抽樣之誤差也未能可能。當(dāng)母體集團分布廣而散時，如以一段式抽樣，勢必耗時、耗費，現(xiàn)在則以多段式抽樣彌補其缺失。由調(diào)查

13、者主觀決定。由調(diào)查者主觀決定。由調(diào)查者主觀決定。最后要提到的是，選擇一個適合的抽樣方法當(dāng)然重要，但抽樣過程的處理不當(dāng)亦可造成人為的疏失，而導(dǎo)致結(jié)果的錯誤增加，亦是值得注意的問題。2.常犯的錯誤情形由以上講明我們可知：抽樣方法對整個統(tǒng)計分析的過程與結(jié)果阻礙甚大。而一般阻礙調(diào)查者對抽樣方法之選擇的因素不外乎（1）正確性、（2）方便性、（3）時刻、（4）費用。此四項因素往往無法兼顧，這也是為何一些研究者在其研究論文中常會提及因時刻、經(jīng)費不足等之研究限制了！事實上，在抽樣方法上的錯誤也多半因此四項因素而發(fā)生。我們常發(fā)覺：許多以商品之消費行為之研究、與之關(guān)系性研究或商品之市場調(diào)查等為題之研究或調(diào)查

14、，其研究母體為所有消費者或所有某一特定族群，但調(diào)查者往往會先將抽樣母體定為臺北市、臺中市、高雄市三區(qū)（此一觀念類似部落抽樣法之部落定義），在從其中用簡單隨機抽樣、分層抽樣或部落抽樣等方法抽出若干樣本數(shù)來統(tǒng)計分析，最后則用這些樣本來代表所有的母體，如此以偏蓋全的講法，更不講抽樣及可能誤差之估罷了！更甚者，一些如收視率調(diào)查、民意調(diào)查等的數(shù)據(jù)數(shù)據(jù)在此方面的錯誤與阻礙更大；因為這些數(shù)據(jù)大多會透過媒體的報導(dǎo)而誤導(dǎo)消費者，進而阻礙其推斷與決策。在日常生活中這類錯誤訊息層出不窮，如某報紙報導(dǎo)：電視公司八點文件連續(xù)劇收視率突破40，勇冠三臺。如某報紙民意測驗結(jié)果：候選人民眾支持率達50，大幅領(lǐng)先其它兩位候選

15、人。但在相信這些數(shù)字之前，我們至少應(yīng)先了解其抽樣方法是否正確與適當(dāng)，否則它們?nèi)缓翢o意義可言！二、樣本大小的問題勿又要馬兒好，又要馬兒不吃草1.決定樣本大小由于任何一種抽樣方法都無法包含母體中的每一成員（除普查以外），因此抽樣誤差由此發(fā)生。抽樣誤差和樣本的大小有著緊密的關(guān)系；一般來講，抽樣誤差通常隨樣本的大小之增加而降低。此點由中央極限定理（Central Limit Theorem）可看出端倪（注2）。此外，在實務(wù)上我們通常如下計算抽樣誤差（Sampling Error）：簡而言之； x由 1.期望值：E（P）（n：樣本數(shù)） n P（1P） 2.變異數(shù)：V（P） n 3.機率：P P 故

16、 1.960.50.981 由上可知，抽樣誤差通常以來計算，樣本愈趨近于無限大，則抽樣誤差愈小。由此也可看出樣本大小對抽樣誤差之重要性。話雖如此，由先前所述，我們也應(yīng)注意：若是抽樣打算不行則樣本愈大可能偏離母體愈遠，造成更大的誤差發(fā)生，故選擇適當(dāng)?shù)某闃臃椒▌t不但可降低抽樣誤差且可加以可能。2.常犯的錯誤情形同樣的，在日常生活中我們常發(fā)覺：許多統(tǒng)計分析結(jié)果往往因為其樣本數(shù)過少而導(dǎo)致結(jié)果的不正確。因為常常研究者或調(diào)查者可能因為節(jié)約時刻、成本等因素，而以較小的樣本進行統(tǒng)計分析，因此也使得結(jié)果不正確。因此，當(dāng)我們閱讀某項統(tǒng)計結(jié)果時，最差不多上應(yīng)注意其樣本數(shù)的大小及其抽樣誤差的推估，而媒體也應(yīng)將此

17、差不多要項注明以建立其傳播的責(zé)任。此外，在實務(wù)上我們從選擇了適當(dāng)?shù)某闃臃椒ǖ綄?shù)據(jù)搜集后，接下來確實是如何計算可能值，但在大多數(shù)的情況下，研究者或調(diào)查者往往忽略了抽樣方法的不同而應(yīng)搜集不同的樣本大小數(shù)據(jù)，而常常采納在簡單隨機抽樣方法下的計算方式，其結(jié)果也就值得懷疑。在此需要強調(diào)：抽樣誤差的發(fā)生和抽樣方法的適當(dāng)與否及樣本之大小有緊密的關(guān)系，有時過大的樣本亦會導(dǎo)致結(jié)果的偏差，且會白費時刻與金鈔票的成本，因此唯有選擇適當(dāng)?shù)某闃臃椒?、審慎決定抽樣樣本的大小，并配合研究的方向，方能提高調(diào)查結(jié)果的正確性，這也是較具實質(zhì)意義的作法。三、P-值的誤用僅以P-值大小來作推論是值得懷疑的1.P-值和樣本大小的

18、關(guān)系提到P-值之誤用，大部份的研究者或調(diào)查者都會認為P-值和抽樣樣本數(shù)目的大小有關(guān)。樣本數(shù)目愈大則會使得P-值變小，雖具有統(tǒng)計分析上的意義，但卻不具研究或調(diào)查的價值；而抽樣樣本過小則會導(dǎo)致P-值過大，促使檢定力（即所謂統(tǒng)計的power，注3）的不足，進而使得統(tǒng)計假設(shè)不易達到其顯著水平。在多數(shù)的研究論文中發(fā)覺；研究者往往在檢定分析時會以P-值0.05作為是否達到統(tǒng)計分析意義之標(biāo)準(zhǔn)。如某一碩士論文以百貨公司商店印象與消費者購買決策之相關(guān)性研究為題，在其分析結(jié)果中提到：以對假設(shè)Y：不同百貨公司商品消費群與人口統(tǒng)計變量無關(guān)做獨立性檢定，結(jié)果在年齡、職業(yè)與月平均收入三項之P-值0.05，達到顯著水平

19、，故可拒絕上述之虛無假設(shè)Y。在此要特不注意的是；在統(tǒng)計分析上對使用P-值時應(yīng)特不考慮其樣本數(shù)目是否適中，才能對假設(shè)作進一步的推論，如此才有統(tǒng)計上之意義。以上所云為一般觀念上P-值在統(tǒng)計分析上的運用，以下將討論一些常見的謬誤。2.常犯的錯誤情形以上述碩士論文為例，本假設(shè)是以-獨立性檢定及Pearson相關(guān)系數(shù)（或相等之無母數(shù)法）來檢定不同百貨公司商品消費群與人口統(tǒng)計變量無關(guān)之假設(shè)，它是一種變量以名義尺度表示的相關(guān)性測定，故在樣本數(shù)適中時，這類分析的常犯錯誤確實是過分引用P-值。需知P-值在此情況下所檢定的是母體的相關(guān)系數(shù)（p）是否為零，亦即是檢定不同百貨公司商品消費群與人口統(tǒng)計變數(shù)有沒有相關(guān)

20、。當(dāng)P-值小于顯著水平（0.05）時，我們只能推翻虛無假設(shè)（），表示兩者間有其相關(guān)（如上述的年齡、職業(yè)與月平均收入等三項），但P-值本身并無講明相關(guān)程度的強弱，且在樣本數(shù)目不太小時，樣本相關(guān)系數(shù)（r）大于0.2或0.3時都有可能達到統(tǒng)計意義，但大多數(shù)的研究者或調(diào)查者卻都即以P-值0.05已達顯著水平而大作文章，關(guān)于此點是值得懷疑的。除此之外，有些人對單尾與雙尾P-值之報告會顯得沒有差異，如上述之以-獨立性檢定為一右尾之單尾檢定，但有些論文中卻常以報告中的雙尾P-值來做單尾檢定的敘述，此乃因為一般統(tǒng)計報表中所顯示的多為雙尾P-值的因素，而報表研讀者對分析報表之經(jīng)驗不足或判讀錯誤又形成了另一個錯

21、誤。另一常見的錯誤是當(dāng)比較三個或以上不同組不的時候（如MANOVA），研究者或調(diào)查者往往只使用一個P-值來報告不同組不的差異情形，盡管ANOVA的P-值特不?。ㄍǔ?.0001），但因并未進一步實施多重比較（multiple comparison），而卻又在結(jié)論中提出各組間比較性之關(guān)系性敘述（如A組最好，而B組又比C組好），研究者或調(diào)查者如此光以ANOVA的P-值來推論多重比較之結(jié)果是過于大意的。四、型錯誤（Type Error ）的忽視值太大容易否定兩變量既有的關(guān)系1.哲學(xué)觀點與統(tǒng)計學(xué)觀點許多統(tǒng)計應(yīng)用之研究或調(diào)查中，研究者或調(diào)查者通常著重型錯誤的機率，而采納相當(dāng)嚴(yán)苛的標(biāo)準(zhǔn)，在此情形下，卻

22、忽略了型錯誤的增加，則可能導(dǎo)致統(tǒng)計分析結(jié)果的錯誤。社會科學(xué)與自然科學(xué)有一項專門大的差異；自然科學(xué)的法則（Law）大差不多上普遍性法則（Universal Laws），它是指每X事件發(fā)生后，Y事件就會發(fā)生；而社會科學(xué)截至今日為止尚未找到符合如此的法則，然在社會科學(xué)中所使用的法則僅能被稱為統(tǒng)計法則（Statistical Law）（注4）。由此可知統(tǒng)計對社會科學(xué)的重要性。自波普（Poper）提出否證論后，統(tǒng)計學(xué)的進展亦受到阻礙。簡單來講，否證論即不論有多少次的成功，只要有一次的失敗就足以推翻整套理論。因此，如前所述，在社會科學(xué)中并沒有普遍性法則存在，任何理論被測試時，或是任何被研究關(guān)系被證實時

23、，都會面臨機率的問題，為了強調(diào)確認程度（the Degree of Confirmation）的提升，因此在欲否定的虛無假設(shè)上，即被設(shè)定了如此嚴(yán)苛的標(biāo)準(zhǔn)（通常0.05或0.01）。在此對型錯誤與型錯誤之定義不再贅述。在一般的研究中，研究者是在查找一些變量間的關(guān)系，因此在統(tǒng)計檢定時，會有如下之形式：：A與B無關(guān) ：A與B有關(guān) 在一般情形中討論，也確實是在A與B事實上無關(guān)的情形下卻認為A與B有關(guān)。嚴(yán)格的值意味著否定論的講法不要隨意地認定關(guān)系。而從另外一方面來考慮，在A與B事實上有關(guān)的情形下，而被認為A與B無關(guān)，這種錯誤是比較輕微的。2.常犯的錯誤情形依照上述所述，對此必須提出二項批判：第一：

24、從效果面來看，被否定的機會太大，而就此認定研究或調(diào)查失敗是過于草率的，其緣故可能只是值太大而造成的失敗。第二：社會科學(xué)研究的范圍太大，往往一項關(guān)系被否定后再被研究之機率不大，因此，在每次統(tǒng)計檢定時，附上值的計算應(yīng)有其必要性。由此可知，對型錯誤之重要性忽視而導(dǎo)致值之忽略，是最容易造成的錯誤。其次，若是抽樣樣本不夠大，就算達到假設(shè)之顯著水平，亦無法被證實。以t檢定為例： t之計算方式，簡單來講可由兩部份組成： t 式中，r表示兩個變量間之相關(guān)程度，是受兩個變量間關(guān)系的強弱而定，r/則能夠解釋成作用力（Effect Size），df則可解釋成樣本大小對統(tǒng)計值t的貢獻度，可稱之為研究力（Study

25、Size），將此概念化可轉(zhuǎn)換成下式：顯著性檢定作用力研究力作用力是指變量間關(guān)系性之強弱對顯著性檢定之阻礙，研究力是指樣本大小對顯著性檢定之阻礙。舉一個例子，若在兩個變量間關(guān)系強度不弱時，假定為0.3，其作用力已達中度之水平（注5）。假如采納0.05雙尾檢定，在總樣本數(shù)只有100個的情況下，則關(guān)系被證實出來的機會不到六成，假如0.01時，則機會趕忙下降至不到四成。由此可見，假如研究的樣本不夠大，就確實是有關(guān)系存在的事實，也無法被證實。 Cohen曾提出一套測定及相對嚴(yán)峻性的指標(biāo)，稱之為/比，即在一定的作用力及固定的樣本大小下，每設(shè)定一個值，就相對產(chǎn)生一個值（注6）。藉此觀念，可整理出如表2

26、2的計算值（注7）。表22 作用力與顯著水平之關(guān)系effectt size（） and significance level（.05 and .10） N = r=.10 .05 .10 r=.30 .05 .10 r=.50 .05 .10 1020304050607080901001201401601802003004005006007008009001000 19 9 19 9 18 8 18 8 18 8 18 8 17 8 17 8 17 8 17 7 16 7 16 7 15 6 15 6 14 6 12 5 10 4 8 3 6 2 5 2 4 1 3 2 17 8 15 6 1

27、3 5 10 4 9 3 7 2 6 2 4 1 4 1 3 2 1 13* 5+ 7* 2+ 3 1 2 Note：Entries are to nearest integer;blanks indicate values1.*For r=.70 these ratios would drop to 6 and 1,respectively.+For r=.70 these ratios would drop to 2 and 1,respectively. 由表22可了解到問題的嚴(yán)峻性，當(dāng)關(guān)系強度不是專門高時（r=0.1），假如樣本數(shù)不是專門大（樣本數(shù)不超過100），型錯誤的機率將高出型錯

28、誤機率專門多，此意味著：專門容易忽略或否認兩個變量間既有的關(guān)系。五、問卷信度未建立未建立信度或使用不當(dāng)?shù)呐卸ㄐ哦确椒?，可能以偏概?.信度評估的概念可靠度評估（reliability evaluation）在問卷調(diào)查時又稱為信度評估，在今日各種科學(xué)的量化研究中是專門重要的一環(huán)，問卷的信度與效度如未建立，則整個投入時刻、人力與金鈔票等資源的研究或調(diào)查專門可能結(jié)果毫無可信之處。在問卷信度評估的過程中，常用到不同的統(tǒng)計方法加以分析，但是許多研究者或調(diào)查者通常不了解信度的內(nèi)容事實上甚為廣泛，可概略分為再測信度（test-retest reliability）、客觀性（objectivity）、內(nèi)部

29、一致性（internal consistency）等多個項目，因此往往在此情況之下其研究或調(diào)查結(jié)果因為沒有建立信度而變得毫無價值。不同種類的信度、不同種類的數(shù)據(jù)及不同的實驗設(shè)計都需要以不同的統(tǒng)計指標(biāo)作為評估的方式，專門多時候在同一份問卷的審查過程中需要用到多種的指標(biāo)以判定其可信的程度。譬如，我們可能需要以內(nèi)在等級相關(guān)（Intra-Class Correlation，簡稱ICC）系數(shù)評定其再測信度；再以Cronbachs 審定其內(nèi)部一致性；有時候還需要以重復(fù)測驗變異分析（Repeated Measures ANOVA）來找出是在問卷問題本身、亦或是不同的訪員、甚至是不同的研究對象方面發(fā)生了不

30、可信的因素。2.常犯的錯誤情形在許多研究與調(diào)查中發(fā)覺：問卷信度未建立的情形不在少數(shù)，這使得研究或欲調(diào)查問題全然無法得到確實的答案與結(jié)果，且未建立信度的問卷所得到的數(shù)據(jù)往往不僅沒有結(jié)構(gòu)可言，其結(jié)果更可能過于主觀與發(fā)生以偏概全的情形。在此所講的以偏概全，是指某些研究或調(diào)查，僅以一種統(tǒng)計方式來證明整份問卷的可信度。Cronbachs 點可能的方法是在一般研究中最常出現(xiàn)的問卷信度分析法，但許多研究或調(diào)查僅以Cronbachs 點可能值超過0.7，就認為問卷可信而實施訪問，盡管這些研究者或調(diào)查者在Cronbachs 的使用上、計算上或解釋上并無錯誤，但殊不知Cronbachs 這一指針僅顯示以一個總

31、分代表類似的問題是否合理，而不能僅以此一指標(biāo)有信度就認為整份問卷可正式實施訪問。此外，在前面提及的再測信度方面，許多人盡管在通過文獻探討后，能夠選擇合適的研究方法，如皮爾森相關(guān)系數(shù)（Pearson Correlation Coefficient）、內(nèi)在等級相關(guān)系數(shù)等，然而，在專門多時候他們并沒有對這些系數(shù)的優(yōu)劣做更深入的探討，只由它們高于預(yù)設(shè)的水平即可（一般常用的臨界標(biāo)準(zhǔn)為0.7），在此要提出的是：皮爾森相關(guān)系數(shù)、內(nèi)在等級相關(guān)系數(shù)在問卷不太可信的情況下，其值仍可能偏高而超過0.7的臨界點（注8）。比如講當(dāng)有系統(tǒng)偏差（systematic bias）時，皮爾森相關(guān)系數(shù)有時會接近于1；而當(dāng)問卷中

32、有許多問題屬重復(fù)性問題時，ICC專門可能高于0.9，且多數(shù)使用者在使用ICC時，不明白ICC有好幾種，而應(yīng)在不同的情況下使用不同的ICC（關(guān)于ICC之使用在此不多述及）。故以此講來，研究者與調(diào)查者在使用時需格外小心。六、多變量分析中對自變項之選擇問題自變項的選擇不應(yīng)先使用單變項方法來決定1.自變項的選擇過程在此以線性復(fù)回歸來解釋在一般使用多變量分析時常見的操作現(xiàn)象，即是因為多變量分析有多個自變項，故大部份人便會在進行多變量分析前，先以單變項方法（如簡單線性回歸）分析，試圖在眾多的自變項中先找出具有統(tǒng)計意義之項目納入復(fù)回歸分析中。使用此一方法具有下列兩種好處：首先，假如某些變項在單變項或多變

33、量中都具有統(tǒng)計意義或都不具統(tǒng)計意義，則關(guān)于結(jié)果與解釋都可不能造成太大的阻礙。另一方面，某些自變量在簡單回歸中達到意義，但到了復(fù)回歸中卻意義全失，如此的情形一般也都能找到統(tǒng)計上的緣故，此外，通常假如在分析之前先檢查各自變項間的相關(guān)矩陣（correlation matrix），也不難發(fā)覺其緣故。2.常犯的錯誤情形以上所述是多變量分析中自變項之一般選擇方法，但我們也發(fā)覺許多文獻中在應(yīng)用多變量分析時，其自變項的選擇完全僅依照研究者或調(diào)查者主觀的推斷而產(chǎn)生，甚至一般的商業(yè)調(diào)查中更無文獻的探討而以經(jīng)驗法則來設(shè)計問卷，如此大概過于武斷而容易主導(dǎo)統(tǒng)計分析的結(jié)果，這是一般最常見的謬誤情形。然若依循上述之方法

34、，則最常發(fā)生的問題是把單變項分析時，達不到統(tǒng)計意義的變項先行刪除掉，研究者或調(diào)查者認為專門有可能這些自變項假如被放在復(fù)回歸中分析的話，專門有可能可不能有意義，但若其一旦有意義而又被先前淘汰掉的話，則數(shù)據(jù)內(nèi)的含意便會流失。如此一來，則對統(tǒng)計分析的結(jié)果可能造成無法估測的阻礙。七、統(tǒng)計方法正確，但程序編寫錯誤類不性數(shù)據(jù)在程序編寫時須以虛擬變量處理1.問題可能發(fā)生的緣故大部份的人在從事某項研究或調(diào)查工作時，都會做充分的資料查證、分析與相關(guān)理論、文獻的探討，其中因此免不了會參考其它研究或調(diào)查，只要有相同的架構(gòu)及目的，便采納數(shù)據(jù)中所用到的統(tǒng)計方法；既然有例可循，依此分析自然可將統(tǒng)計方法選擇錯誤的機率降至

35、最低。但惋惜的是，一般研究論文或調(diào)查資料中對統(tǒng)計分析的過程及其運算過程并無完整且深入的提及，許多研究者或調(diào)查者在一知半解的情況下，依樣畫葫蘆的結(jié)果卻造成了更嚴(yán)峻的錯誤，而這些錯誤往往并不是在研究架構(gòu)或統(tǒng)計方法選擇中發(fā)生，而是在軟件的使用與程序的編寫中所犯下的錯誤。此外，由于各種統(tǒng)計軟件操作使用方法不一，統(tǒng)計報表的研讀方法也不盡相同，在使用者對該軟件不熟悉且信心缺乏的情況下，在操作過程與研讀報表上發(fā)生錯誤的情形也是經(jīng)常發(fā)生的。2.常犯的錯誤情形一般發(fā)生在統(tǒng)計程序編寫錯誤的情形中，除了人為操作的錯誤外（如鍵入字符錯誤等），較常見的是連續(xù)變項與類不變項間的數(shù)據(jù)轉(zhuǎn)換問題。如某一碩士論文在探討銀行從

36、業(yè)人員的工作中意度中的壓力與壓力來源的問題時，在分析阻礙壓力感高低的因素時，因為壓力在量化后其值介于0與100分之間，為一種連續(xù)性的變項，因此該研究者以逐步線性復(fù)回歸（stepwise multiple linear regression）分析，若在常態(tài)分布、線性關(guān)系、相同變異等統(tǒng)計分析前提都符合的情況下，選擇此一方法并無不合理之處。但在此要注意的是，在這些自變項中有頗多的類不性數(shù)據(jù)，有些是兩分的（binary，如性不），有些是有排序的（ordered，如教育程度），還有一些是不排序的（unordered，如不同部門），這些自變量在程序編寫時均需以虛擬變量（dummy variable）方式處

37、理。然在鍵入數(shù)據(jù)的過程中，一般每一個變項都先以1、2、3.，等代號輸入，必須先轉(zhuǎn)換成虛擬變量始可放入復(fù)回歸中，再行檢定其統(tǒng)計意義。唯許多人并未做虛擬變量的轉(zhuǎn)換，而直接把輸入的類據(jù)（即1、2、3.，等）作為自變項的數(shù)值，所跑出來的結(jié)果自然是錯誤的。如此的情形，相信應(yīng)許多見才對。八、統(tǒng)計方法前后不一致而互相矛盾應(yīng)用統(tǒng)計方法時須符合前提假設(shè)與使用時機1.問題可能發(fā)生的緣故一個研究或者是調(diào)查工作，一定有其欲研究、調(diào)查之問題與目的，然后依循此問題與目的，通過充分的文獻探討，再進行到研究的設(shè)計、數(shù)據(jù)分析與結(jié)論。這是一個個部份環(huán)環(huán)相扣的過程，而在量化研究中調(diào)查問卷的更是需要依照研究的目的、理論的應(yīng)用等來

38、設(shè)計，再以適合的統(tǒng)計分析方法來得到欲知的結(jié)果。但在某些研究或調(diào)查中發(fā)覺，許多被采納的研究方法是依照問卷的問題來隨意采納的；比如講，碰到自變項與依變項皆為連續(xù)性的數(shù)據(jù)時，就應(yīng)用相關(guān)分析、復(fù)相關(guān)分析等。而當(dāng)依變項為連續(xù)性數(shù)據(jù)，而自變項為類不性數(shù)據(jù)時，則立即會考慮變異數(shù)分析、t考驗等。若依變項與自變項兩者皆為類不性數(shù)據(jù)時，則又會使用考驗。但這些使用者往往并不明白各種分析方法之前提假設(shè)與使用時機，甚至有些問卷設(shè)計毫無理論支持，更遑論使用適當(dāng)?shù)姆治龇椒恕?歸咎緣故，這種統(tǒng)計方法前后矛盾的情形乃是因為研究者或調(diào)查者對研究方法或統(tǒng)計分析理論的不熟悉所致，而此種情況，最常出現(xiàn)在一些商業(yè)雜志的意向調(diào)查中，其

39、結(jié)果也常常過于主觀而不正確。2.常犯的錯誤情形所謂統(tǒng)計方法前后不一致，舉例來講，某商研所之碩士論文研究國中學(xué)生對飲料的購買行為，該研究以購買地點為依變項，而該變項之測量以李克五點量表給分（15分），故為一連續(xù)性的變項，此外該研究依購買頻率將國中生分為高、中、低三種消費群。在此，研究者認為三種消費群的購買地點之變異數(shù)差距太大，而購買地點不論在任何消費群都不太依循常態(tài)分布，故他以無母數(shù)方法之威克森等級和測驗（Wilcoxon rank sum test）處理；而當(dāng)他試著了解購買地點與其它變項（如信息來源等）個不之關(guān)系時，都以Pearson相關(guān)分析，如此的分析方法看起來是能夠同意的。惋惜的是，當(dāng)他

40、進一步了解在有意義的變項（即上述之信息來源等，在計算Pearson相關(guān)分析時之P-值少于0.05者）調(diào)整后，各消費群的購買地點是否仍有顯示差異時，卻使用了復(fù)回歸分析法。我們明白，在使用復(fù)回歸時，必須遵循一些統(tǒng)計的前提假設(shè)，其中兩個假設(shè)便是常態(tài)分布及相同變異，而這兩個假設(shè)，尤其是相同變異對統(tǒng)計結(jié)果的阻礙甚巨，偏偏在該研究論文內(nèi)又如前述地使用了威克森等級和測驗和Pearson相關(guān)分析，直接與間接的否定了這兩個假設(shè)的可能性。這類型前后互相矛盾的統(tǒng)計方式，也是應(yīng)當(dāng)特不注意及幸免發(fā)生的。九、統(tǒng)計圖表利用不當(dāng)統(tǒng)計圖表應(yīng)視統(tǒng)計數(shù)據(jù)的特性來選用1.統(tǒng)計圖表之應(yīng)用統(tǒng)計圖表在統(tǒng)計應(yīng)用方面亦是特不重要的一部份，因

41、為文圖的整合可使閱讀數(shù)據(jù)者能清晰的從圖表中明白數(shù)據(jù)的特性及研究或調(diào)查所想要表達的結(jié)果，而好的統(tǒng)計圖表的運用則更能夠吸引讀者的視線而增加閱讀的興趣。更重要的是，在許多趨勢分析上，統(tǒng)計圖的運用能使讀者一目了然，舉例而言，在統(tǒng)計圖中最簡單與常見的要確實是曲線圖，它能利用線條的變化性，明白的顯示出以往的情況，使讀者容易地去預(yù)測出以后的進展趨勢，如圖22所示。圖22 公司十年內(nèi)營運收入統(tǒng)計表由圖22中可知，該企業(yè)的營業(yè)收入除在1987至1989年間是下降外，整體而言是逐年成長的。另外，在實務(wù)的運用上，我們也可由圖表中立即來分析分析究竟是何緣故導(dǎo)致該年度區(qū)間內(nèi)使得收入下降，如此一目了然即是統(tǒng)計圖表的優(yōu)

42、點所在。除此之外，在日常生活中一些常見的統(tǒng)計圖表還有如區(qū)域圖、柱形圖、橫條圖、折線圖、莖狀圖、散布圖、餅圖等等，然而在運用與解讀上應(yīng)特不注意各種圖形的特性，以免造成事倍功半的缺失。2.常犯的錯誤情形在運用統(tǒng)計圖表時應(yīng)注意數(shù)據(jù)本身的特性，要明白并非每一類型的資料都能運用在各類的統(tǒng)計圖中，運用不得當(dāng)，不但無法指導(dǎo)讀者了解數(shù)據(jù)的特性，更反而容易誤導(dǎo)讀者歪曲數(shù)據(jù)的正確性。而讀者在閱讀統(tǒng)計圖表時，也應(yīng)特不注意資料的橫軸（X軸）與縱軸（Y軸）的單位，以免誤解它所表示的意義。一般常容易造成讀者發(fā)生上述錯誤的確實是：原點不是零的統(tǒng)計圖。如圖23。圖23 市消費者物價指數(shù)圖由圖23中可清晰的看出，縱軸底

43、端指數(shù)從80往上加，并非由零開始，縱使圖中的數(shù)據(jù)并無錯誤，但往往會讓粗心或匆忙的的讀者誤解，認為該指數(shù)是由中途開始攀升的。其次另一個常見的例子確實是，某些統(tǒng)計圖的橫坐標(biāo)或縱坐標(biāo)所用單位容易讓讀者混淆，若不認真分析則會產(chǎn)生誤解，如圖24。圖24 地區(qū)失業(yè)率由上圖可看出，其縱軸為百分比（），而每一單位基數(shù)為1累加，光由該圖看來會使人覺得地區(qū)失業(yè)率起伏專門大，但若了解上述講明，則會發(fā)覺事實上是本圖使讀者產(chǎn)生的誤解。最后要提醒統(tǒng)計圖表讀者的是，要真正了解統(tǒng)計資料的結(jié)果光靠統(tǒng)計圖表是不行的，還要熟讀統(tǒng)計文獻的內(nèi)容，更甚者，還要弄清晰各項數(shù)據(jù)所運用的理論及其所代表的意義。尤其在一些生活應(yīng)用上的財務(wù)分

44、析、經(jīng)濟等方面的圖表更是如此，例如，你光看著某一項期貨日指數(shù)曲線節(jié)節(jié)上升，但要明白有時指數(shù)上升未必是利多的的情況，此點相信是更重要的事。十、其它最后，提到一些較無法歸類的錯誤。第一，我們在某些論文中會發(fā)覺，在名詞的選擇上會使人產(chǎn)生誤解。舉個簡單的例子，在專門多研究消費者行為的文獻中都會提及知覺（perception）理論與認知（recognition）理論，但往往并沒有嚴(yán)格的區(qū)不其不同處，使得非此學(xué)術(shù)領(lǐng)域的讀者往往會覺得兩者大概是相同的，如此講來大概對統(tǒng)計分析上的阻礙不大，但有時會發(fā)覺連研究者本身都對該名詞產(chǎn)生混淆，再作統(tǒng)計推論時則會使結(jié)果被誤導(dǎo)。而且在一些醫(yī)學(xué)研究中若發(fā)生名詞選用錯誤的

45、情形，嚴(yán)峻者，則會產(chǎn)生不可預(yù)測的后果。第二，有些研究或調(diào)查所犯的錯誤，則是在整篇文章中，不論是方法或者是結(jié)果部份，都沒有提到研究或調(diào)查中所使用的統(tǒng)計方法為何？而在結(jié)果或討論中，卻有P-值（或其它統(tǒng)計值）的報告，這些P-值等的背后所使用的方法是對是錯則全然無法評估，這種情形亦是屢屢見到。注釋1.顏月珠（臺灣大學(xué)財務(wù)金融學(xué)系教授），商用統(tǒng)計學(xué)，三民書局八版，民國82年8月，P197。2.同注1，P222。中央極限定理（Central Limit Theorem）的定義：設(shè)一機率函數(shù)f（x），其均數(shù)為u，變異數(shù)為；由其中抽取樣本大小為n的樣本，得樣本均數(shù)為，令，則當(dāng)n時，Z的分配以標(biāo)準(zhǔn)常態(tài)分

46、配為其極限。亦即不論母體為何種分配，當(dāng)樣本大小n時，樣本均數(shù)的抽樣分配均以常態(tài)分配為其極限，其E（）u，V（）。3.盧成皆、李瑛慈，醫(yī)學(xué)研究中常見之統(tǒng)計分析謬誤，中國統(tǒng)計學(xué)報，第33卷第2期，民國84年6月， P285。4.Shelby D. Hunt, Mondern Marketing Theory：Critical Issues in the philosophy of Marketing Science, Ohio, Cincinnat, U.S.A.：South-western Publishing Co,chap5.5.J. cohen, Statistical power An

47、alysis for Behavioral Sciences, Academic Press, New York, U.S.A.1977.6.同注5。7.同注5。8.同注3。參、結(jié)論與建議非專業(yè)的統(tǒng)計方法所得的結(jié)果是值得懷疑的一、結(jié)論統(tǒng)計方法在日常生活中或?qū)W術(shù)領(lǐng)域上能夠關(guān)心我們從一堆繁雜的數(shù)據(jù)數(shù)據(jù)中，藉由一些統(tǒng)計量的計算、可能和檢定，來了解母體的特性。但數(shù)字本身是死的，重要的是我們?nèi)绾稳ソ忉屵@些數(shù)字，如何給予它們專門的意義，因此，在我們看一個統(tǒng)計數(shù)字及不人給它下的推論時，應(yīng)該不要隨便輕易地相信它，因為有時候，數(shù)字是專門聳動的，這時就可能會有某些人為了某些目的或因?qū)y(tǒng)計的不了解，而利用統(tǒng)計數(shù)

48、字講謊或誤用了統(tǒng)計。我們在閱讀統(tǒng)計資料時應(yīng)做一個聰慧的讀者，不要被這些誤用統(tǒng)計的情形所蒙騙。在此提供五項原則來關(guān)心我們?nèi)ナ∷妓玫降慕y(tǒng)計數(shù)字，是不是確實有足夠的把握去下那樣的結(jié)論，及它的正確度有多少。1.原則一：Who Say So？我們常?？煽吹?，不論在報章或雜志上的文章內(nèi)容有如此的陳述：依照某某調(diào)查顯示.或是某某研究報告指出.我們一定要特不注意接下來的結(jié)論，確實是所謂正確的統(tǒng)計分析結(jié)果嗎？就如先前所講的，統(tǒng)計數(shù)字雖能講話，但它所表達的言語全靠這些研究或調(diào)查者來詮釋，因往往我們看不到這些分析與推論的過程，而是直接面對他們給我們的結(jié)論，那我們?nèi)绾蚊靼资钦l講的呢？若是有人刻意利用統(tǒng)計數(shù)字來歪

49、曲事實，那豈不是讓讀者誤會了無辜的統(tǒng)計數(shù)字了。2.原則二：How Does He Know？你一定看過一些專門明顯的大標(biāo)題，看了讓人嚇一大跳，例如，在年月日的某報紙刊載了如此的標(biāo)題：每三對夫妻中，就有一對有婚前性行為。假如我們就如此相信了，那大概這篇報導(dǎo)就有違統(tǒng)計學(xué)所應(yīng)負的社會責(zé)任了，因為它并無講明如何統(tǒng)計分析而得知的結(jié)果，而使得讀者被欺騙或誤導(dǎo)。因此，在閱讀某些乍看是統(tǒng)計的資料時，我們絕對不能依它的結(jié)論而下推論，我們應(yīng)該先想到一個問題：他如何明白的？在一般的研究調(diào)查中，這就牽涉到方法與信度的問題，如前章節(jié)所述，在此不多做補述。3.原則三：Whats Missing？在一般的文獻中，多數(shù)

50、的研究者與調(diào)查者在其有限的篇幅中，并可不能詳列統(tǒng)計分析的過程與計算步驟，更甚者，在某些文章中亦可不能告訴我們有多少抽樣樣本、用何種抽樣方法、問卷如何設(shè)計、研究如何設(shè)計、信賴區(qū)間為何等等，或許連研究調(diào)查的日期都不得而知，但往往這些沒有出現(xiàn)的訊息，涵蓋了足以讓我們分析數(shù)據(jù)的可信度與其它重要的意義，因此，在我們閱讀一份統(tǒng)計資料時，應(yīng)該察覺它是不是遺漏些什么重要的信息，然后再決定該如何下定論。作為一個理智的統(tǒng)計資料運用者，應(yīng)時時警惕資料是否完整，千萬不只是隨便一翻，如此難保可不能使自己誤信了有偏誤的統(tǒng)計推論。4.原則四：Did Somebody Change The Subject？或許，你也曾看

51、過如此的廣告詞：依照調(diào)查，使用品牌的人，其中意度遠高于使用其它品牌的人。但這有可能指示廣告商的一種營銷策略而已。看統(tǒng)計文獻的時候，最怕的確實是因不了解統(tǒng)計分析的過程而被誤導(dǎo)，要明白，調(diào)查的母體不同則推論的結(jié)果因此也就不同。許多人會妄將統(tǒng)計的主題改變而使讀者有錯誤的認知。因此，讀者必須自己做好把關(guān)的工作，因為文章的作者或許不是有意的偏歪事實，但可確信的是，最后將事實偏歪的可能是讀者你自己。舉一個例子，在一本家庭社會學(xué)中提到：美國1984年的離婚率是47。乍看之下，表示每兩對夫妻中，就有一對會離婚，但事實是如何？好險在書中的附注有講明此一離婚率的計算，是由全年離婚夫妻對數(shù)除以該年新婚夫妻對數(shù)，再

52、乘以100，但此一算法容易引起讀者的恐慌與爭議，因為離婚和新婚的人差不多上是沒有關(guān)連的，因此，另一種較合理的計算方式為：全年的總離婚對數(shù)除以該年的總結(jié)（已）婚對數(shù)，再乘以100，如此大概較合情合理。5.原則五：Does It Make Sense？這是一個最重要的問題，即是：如此的推論有意義嗎？以一個報紙的收視率調(diào)查為例；某時刻八點檔連續(xù)劇收視結(jié)果如下，華視36、臺視34、中視26，故華視大獲全勝。但認真分析之，如此的推論有意義嗎？那個地點的數(shù)字是否能下如此的推論，其信賴區(qū)間并未提及，且抽樣是否偏重于某一地區(qū)而導(dǎo)致抽樣誤差，如此光是2的差距，就能分辨出收視情形的優(yōu)劣大概是太危言聳聽了。由此

53、可知，統(tǒng)計數(shù)字本身是無辜的，但看人如何去解釋與給予其正確的意義，在閱讀統(tǒng)計資料時，千萬應(yīng)警覺該推論是否確實可信。二、建議最后，針對前述各項統(tǒng)計應(yīng)用上常見的錯誤提出幾點建議。1.在樣本大小與抽樣方法方面一般人常迷信大量的樣本，但事實上若大量而有偏差的樣本，表面上雖看似不錯，但事實上只是一再的重復(fù)其偏差而已，反而將導(dǎo)致結(jié)論的誤差更加嚴(yán)峻。因此，唯有慎選適當(dāng)?shù)某闃臃椒?，選取較小規(guī)模的隨機樣本，并盡可能的降低抽樣誤差、反應(yīng)誤差及無反應(yīng)誤差等，并提高問卷的回收率。故依照所要研究的方向，選取合適的抽樣方法才能提高調(diào)查結(jié)果的正確性，如此也是較具實質(zhì)意義的。2.在P-值的誤用方面在如前述的P-值和相關(guān)

54、系數(shù)間的問題，可藉由其它統(tǒng)計方法之計算來增加P-值的引用正確性。如信賴區(qū)間之計算，它除了能夠了解樣本相關(guān)系數(shù)的變異情形外，亦能夠檢查這一區(qū)間是否包含可靠度定義之標(biāo)準(zhǔn)，以做出適當(dāng)?shù)慕Y(jié)論。3.在統(tǒng)計檢定力方面型錯誤被忽視的嚴(yán)峻性是有其討論的必要的。盡管教科書中常有如下的敘述：型錯誤比較嚴(yán)峻，故可不理會型錯誤。但要明白值的計確實是會阻礙整個統(tǒng)計檢定力。欲增加作用力的阻礙可藉由四個方面著手（注1）：第一：選用適當(dāng)?shù)慕y(tǒng)計值，例如在組間或組內(nèi)有線性回歸關(guān)系存在時，選用r比t值好，因為t值無法取得線性回歸之趨勢。第二：值之設(shè)定，在可容許的范圍內(nèi)適度提高值，而使值下降，或是在一般顯著水平下，檢定結(jié)果不具

55、顯著性時，應(yīng)將P值計算出來。第三：樣本大小的調(diào)整，樣本愈大時，值及值能夠同時兼顧。第四：作用力大小亦可阻礙檢定力，假如作用力愈大，則值愈小，然而作用力是被研究的對象，通常是一個未知數(shù)。4.多變量分析中自變項的選擇方面依照一般決定多變量分析中自變項之方法中，發(fā)生單變項中不具統(tǒng)計意義，但于多變量分析中有統(tǒng)計意義的緣故，大致可歸納如下：（1）干擾因子（confounding factor）的關(guān)系，（2）數(shù)據(jù)本身的問題。欲解決此一問題，前者如Y與X1本來是有顯著相關(guān)的，但卻受到干擾因子X2的阻礙，因此當(dāng)把Y與X1作簡單回歸分析時，X1不一定有意義，假如把X1與X2都納入復(fù)回歸分析的話，再把X2的效

56、果（effect）調(diào)整（adjust）后，則X1便會達成統(tǒng)計意義。后者，因為數(shù)據(jù)本身的問題較常見的為遺漏值（missing value）的刪除問題，故減少遺漏值是一條可行的方法。5.程序編寫錯誤方面欲明白是否發(fā)生變量轉(zhuǎn)換上的錯誤，可使用察看自由度的方法，部份作者會將回歸結(jié)果以表格方式發(fā)表，當(dāng)以原始數(shù)據(jù)分析，軟件勢必將此變項視為連續(xù)性數(shù)據(jù)處理，其自由度等于1，否則自由度自然應(yīng)是該變項所含之層次（level）數(shù)目減1。除此之外，若沒有自由度報告的話，有時亦能夠憑參數(shù)可能（parameter estimate）推斷，因為三個層次（level）之變項會變?yōu)閮蓚€虛擬變數(shù)，而每個虛擬變量均被軟件視為一

57、個自變項，因此會有兩個參數(shù)可能值，連續(xù)性自變項則只有一個可能值。比較困難的是當(dāng)自變項為兩分變項時，不論以虛擬變量或連續(xù)性數(shù)據(jù)方式處理，其自由度均為1，亦只有一個參數(shù)估值，現(xiàn)在唯有依經(jīng)驗與察看上下文來推斷而已了。6.統(tǒng)計方法前后不一致與統(tǒng)計圖表不當(dāng)利用方面為幸免此類問題發(fā)生，希望使用統(tǒng)計分析之研究者應(yīng)注意，若對統(tǒng)計方法一知半解，專門容易造成論文內(nèi)容不同程度的謬誤，應(yīng)該明白光靠參考已發(fā)表的論文是不夠的，因為論文篇幅有限，詳細的數(shù)據(jù)分析過程往往可不能在論文中介紹，因此應(yīng)與統(tǒng)計專家合作，請教正確的統(tǒng)計方法、分析過程與結(jié)果闡釋。此外，亦建議常用統(tǒng)計圖表的作者，在使用圖表時亦應(yīng)提升圖表的適合性，幸免

58、圖表的誤用導(dǎo)致數(shù)據(jù)特征的偏頗，而使讀者蒙受其害。注釋1.Robert Rosenthal and Ralph L. Rosnow, Essentials of Behavioral Research:Methods and Data Analysis, McGRAw-HILL, Inc, New York, U.S.A.,1991,2nd. editor,P452.肆、附錄附錄一：統(tǒng)計在生活上的應(yīng)用一般人對統(tǒng)計的概念大概仍停留在一些主觀的刻板印象之中，人們總是誤把統(tǒng)計和數(shù)學(xué)聯(lián)想在一起；認為統(tǒng)計總是在玩弄一些數(shù)字上的游戲，因此認定統(tǒng)計應(yīng)為某種應(yīng)用數(shù)學(xué)，因此統(tǒng)計就應(yīng)和數(shù)學(xué)一樣沒有什么有用的價值

59、可言。這點是必須加以澄清的；實際上，統(tǒng)計確實是以數(shù)學(xué)中的部份理論為基礎(chǔ)，但它僅是以其為運算工具，而配合現(xiàn)實環(huán)境中我們所關(guān)懷的相關(guān)問題，進展出一種透過運用資料搜集、匯總、整理及分析的科學(xué)方法，來解決與達成我們的需求。因此，統(tǒng)計和人們確實有著密不可分的關(guān)系。以下，讓我們來看看統(tǒng)計究竟在人們?nèi)粘Ｉ钪惺侨绾伟l(fā)揮它的阻礙力。茲將一般常見的應(yīng)用分述如下：一、民意調(diào)查統(tǒng)計：選舉前為了解選民對各政黨及候選人的意向所做的調(diào)查，或是對某項政府施政與重要公共政策實施前后所做的調(diào)查皆屬此一范疇。這類調(diào)查要緊皆屬于對統(tǒng)計抽樣理論之實際應(yīng)用，故抽樣母體之代表性往往決定了調(diào)查結(jié)果的適用范圍。二、收視率調(diào)查統(tǒng)計：隨著

60、有線電視的快速普及，競爭激烈的電視臺間為了解其節(jié)目收視率，因此興起了此一調(diào)查，而廣告商亦對其相當(dāng)重視，一方面欲了解廣告的收視率，另一方面需了解某一類型的節(jié)目收視率，以決定廣告推出的時刻是否有較大之效益。而此一調(diào)查結(jié)果亦往往因抽樣母體及資料收集技巧（訪員電話訪問、計數(shù)器等）之好壞而決定調(diào)查結(jié)果之信度。三、運動統(tǒng)計：運用于各種球類競賽中相關(guān)資料的搜集，如球員攻守統(tǒng)計、球隊?wèi)?zhàn)績勝負等，以做為教練與球迷分析與參考之用。值得一提的是，目前許多職業(yè)運動皆成為賭徒一擲千金的工具，此一資料恰可提供他們下注的依據(jù)。四、人口統(tǒng)計：有關(guān)出生率、死亡率、婦女生育率、平均生育子女?dāng)?shù)等與整體人口結(jié)構(gòu)間關(guān)系性的探討都屬

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

統(tǒng)計應(yīng)用上常見的謬誤

文檔簡介

溫馨提示

最新文檔

評論

統(tǒng)計應(yīng)用上常見的謬誤

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔