


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統(tǒng)計陷阱讀后感放寒假前,經(jīng)學長的介紹,特地在圖書館里借了一本統(tǒng)計陷阱在假期里讀,看完之后的感觸到真不少,而且總想著什么時候寫一點讀后心得之類的東西,無奈,因為惰性,總是找各種各樣的理由來推遲。這次還得感謝學校這個次機會,讓我終于可以完成早該結束的任務了。先來談談寫這本書的背景:在20世紀50年代,美國出現(xiàn)了一種尊崇統(tǒng)計風,太多的人都樂意,也輕易的相信了那些統(tǒng)計數(shù)據(jù),原因很簡單,大多數(shù)的統(tǒng)計數(shù)據(jù)都可以讓不同的人產生不同的效果。例如,一個企業(yè)可以讓員工看出今年的效益,同樣的數(shù)據(jù),換一種統(tǒng)計方法,也可以反映出企業(yè)的不景氣,這就是為什么太多的公司,企業(yè),甚至政府部門都習慣用統(tǒng)計的方法來傳達自己的意思。
2、介于這個背景之下,美國作家達萊爾·哈夫以一個經(jīng)驗老道,且退休的竊賊的身份,用回憶錄的形式,在本書的前八章講述了常用的一些行騙手段,在第九章總結了前面所列出的所有方法,而在最后一章中,教人們如何識破統(tǒng)計數(shù)據(jù)中的陷阱,告誡人們以一個正確的態(tài)度去看待一個數(shù)據(jù),從而不做一個被數(shù)據(jù)玩弄于手的玩偶。本書中列舉出的,常用統(tǒng)計手段大致可分為:利用內在有偏樣本,選出不同的平均數(shù),隱藏總要的數(shù)據(jù),忽略必要的誤差,濫用統(tǒng)計圖形,采用不完整匹配的資料以及誤解相關關系等。當讀完這本書時,回過頭在,如果你用書中的衡量標準來看任何一組數(shù)據(jù),都會發(fā)現(xiàn)其中的不可行性,所有的數(shù)據(jù)都是可以質疑的,那么不禁會有兩種念頭:其
3、一,為什么統(tǒng)計著要這樣做,公布這樣的數(shù)據(jù)是為什么?答案很簡單,無非是利益所趨,商家,政府乃至所有人都想隱藏掉那些自己認為很重要的數(shù)據(jù),公諸于世的無非是想博得同情或者獲得榮耀。其二,這個世上不就沒有可以相信的數(shù)據(jù),因為沒喲絕對的正確,那么我們是否就因此而否定自己看到的,聽到的一切呢?顯然不是,這本書最重要的是,教會我們如何正確的看待數(shù)據(jù),正確的從數(shù)據(jù)中拿去自己需要的,不可全信,但不意味著一點也都不可信。在這里,我重點來談談:內在有偏樣本,選取不同平均數(shù),采用不完整匹配的資料以及誤解相關關系這幾種“行騙手段”。首先說說內在有偏樣本,我用原文中的一個例子來解釋這種方法的意思:“1924級的耶魯畢業(yè)生
4、平均年收入有25111美元?!睍r代雜志在評論紐約太陽報的某篇報道時曾經(jīng)指出。 乍眼一看,感覺耶魯大學的確是個很了不起的學校,那里面的畢業(yè)生都有高質量的就業(yè)率。在感嘆之余,細細想想,你會發(fā)現(xiàn)有兩點可以之處:第一,如此的精確;第二,竟然如此的大。那么,這個精確地個位的收入是如何得出來的呢?除非是在保證沒有外快的情況下,只靠工資條生活的人,他的工資才是有可能精確地個位的,那么現(xiàn)實并非如此,越是成功的人,他的工資來源越是不那么單一。我們都知道,只要樣本足夠大,并且具有代表性,在多數(shù)情況下,樣本的信息可以很好地代表總體。但如果條件不滿足,抽樣的結果比一個臆想的結果好不到哪兒去除了會形成一種十分科學精確的
5、虛假印象意外,這種方法分本不值得推薦。然而,令人悲傷的事實是,在我們看到的或自以為知道的事物中,充斥著許多從類似的樣本,即有偏的或過小的或兩者都滿足的樣本中得出的結論。 耶魯大學的收入同樣也是一個樣本,但恰恰這個因為是有太多的偏差的??梢钥隙ǖ氖?,沒有誰可以掌握25年后所以存活的1924屆耶魯大學生的收入情況。此外,在你可以聯(lián)系得到的人中,能接受問卷調查的人數(shù)是屈指可數(shù)的。在這里,需要提醒大家的是,一般的問卷調查,5%10%的回收率就已是相當可觀的了,在加上調查內容的不同,這個比例還是會有出入的,但決定不能達到百分之百。最重要的,并非所有接受問卷調查的人都是可以說實話的。尤其是在工資這種很敏感
6、的話題上。試想想一個稅務局的人員來調查你的收入情況,你會如實回答嗎?我想未必,多數(shù)人都會盡可能的說的小一點,畢竟說的多了,可能意味著要多交一點稅呢。再有,和同學聚會是,看見被人都在侃侃而談,你非但不會如實回答自己的工資數(shù),因為虛榮心,多多少少都會夸大一點。這些都是合乎常理,同樣也是無法避免的。而對于那些從名校畢業(yè),但現(xiàn)狀落魄的人,肯定不愿意透露自己的實際情況。那么,不難看出,耶魯大學的畢業(yè)生收入情況,它僅僅代表了1924屆中可以聯(lián)系得到的人中的愿意站出來說出自己輸入的那些特殊人群。因為調查的對象本來就存在明顯的差異和偏向性,這是導致其最終結果失敗的根本原因。接下來,同樣用一個例子來談談對平均數(shù)
7、的選取。一個老板為了炫耀自己公司的福利有多好,就在招聘部門公布了這樣的一個信息:本公司的全體員工的平均收入是5700美元。聽上去挺不錯的??墒悄愕米粤曄胂?,這里的平均到底是什么平均數(shù)?是算術平均數(shù)?是眾數(shù)還是中位數(shù)?作為應聘的你,更希望的這個平均是眾數(shù)吧,因為這樣以來,公司總出現(xiàn)次數(shù)最多的是5700美元,而任何一個公司的基層人員往往是最多的,那么就意味著即使你是普通員工,也可以拿到這個豐厚的薪水。可現(xiàn)實并非如此,通常這里的均數(shù)都是算術平均數(shù),因為全體員工中,包含了老板,經(jīng)理等高層人士,同樣也包括了基層員工。可是當高層的工資數(shù)高達上萬,甚至幾十萬,而基層的員工拿著不到兩千甚至不足一千的收入時,照
8、樣可以平均到五六千的收入。所以,在以后的閱讀中,尤其是對這種帶有平均感念的統(tǒng)計數(shù)據(jù)中,不禁的要反問一句,它到底是什么平均數(shù),不然,你將得到會與你的想法大徑相同。讓我們一同來看看不完整的匹配資料這種手段。有這樣的一個例子:“去年飛機失事造成的人員死亡比1910年多”,這是否意味著現(xiàn)在乘飛機要比過去危險?我們都知道,在現(xiàn)階段的這個社會中,因交通事故死亡的人數(shù)比上個世紀中整整一百年中死亡的人數(shù)還要多,難道就因此要否定社會的進步嗎?這種牛頭不對馬嘴的匹配顯然是不對的。看看歷史,不難發(fā)現(xiàn),在過去的一個世紀了,能乘坐飛機的的人數(shù)有多少,而現(xiàn)階段,在這樣大的一個基數(shù)下,我們不妨做個簡單是算術,用每年死亡的人
9、數(shù)除以每年的客流量,那么你將會發(fā)現(xiàn),現(xiàn)階段的死亡比率將會小的可以忽略。而太多的人們總喜歡用比較多額手段來評判事物的好壞,可遺憾的是用錯誤的參考對象;來作比較。這種情況在我們的生活中比比皆是。在這里也不一一列舉,只想告訴大家的是,在對于比較性的統(tǒng)計數(shù)據(jù)中,在被統(tǒng)計數(shù)據(jù)所震驚的同時,想想他們的對比是否在同一個標準,所采用的對象是否具有比較的意義。接下來的這種“行騙手段”是我們在生活中最難察覺,恰恰是最被“騙子們”慣用的一種手法。相關關系與因果關系。在這里先介紹一種統(tǒng)計學中的一個經(jīng)典謬誤:如果B緊跟著A出現(xiàn),那么A一定導致了B的發(fā)生。舉一個簡單例子:有兩塊準時的時鐘,當a到某一整點時刻是,時鐘b就會
10、敲響。那么是否b鐘的敲響是否取決于a鐘是否走到該整點時刻呢?顯然不是的。我們只能稱之為是一種聯(lián)合變動。而聯(lián)合變動一種普遍形式是存在其真實性的,但無法區(qū)分之間的因果關系,或者說,他們之間就沒有必然的因果聯(lián)系。收入與擁有的股票之間便是這種相關。你擁有越多的錢,便能買更多的股票;同時,你手頭的股票越多,又可以為你帶來更多的收入。在這種情況下,簡單地認為一個因素引起另一個因素是不全面的。最具有戲劇性的相關是所有變量相互間沒有任何影響,卻存在著顯著的相關。例如:抽煙和學習成績的問題。有人曾經(jīng)費盡周折以探求是否抽煙者的大學成績比不吸煙者的差,結果的確如此。這著實讓一些人高興,從此,他們多次使用這個結論。往
11、通往好成績的道路上存在著放棄抽煙的痛苦。進步使用該結論,還有這樣合理的推斷:抽煙使人的頭腦變笨。當抽煙與低分同時出現(xiàn)時,人們得到了一個未經(jīng)證實的假設,抽煙導致低分。難道就不能是相反的解釋嗎?也許低分促使學生不喝酒而變得愛抽煙。這種說法與前一種一樣能得到證據(jù)很好的支撐。只是它不能夠滿足宣傳人員的要求。 最后,和大家共同分享一則我最喜歡的統(tǒng)計案例。紐約時報在報道一條來自印第安納波利斯城的美聯(lián)社新聞時,在偷換基數(shù)問題上犯了錯誤。 今天,經(jīng)濟危機已大為緩解。屬于印第安納波利斯城建筑貿易工會的管子工、泥水匠、木工、油漆工和其他工種的工人享受了5的工資提升,這是去年冬天工資下降20的四分之一補償。表面上很
12、合理但是請注意,減少是以原有工資為基數(shù)計算的,而增加卻使用了較小的基數(shù),即削減后的收入。 我們可以通過一些假設數(shù)據(jù)來進行檢驗。為簡單起見,假設原有收入為1美元,減少20,即為80美分,而在80美分的基礎上增加5僅提高了4美分,它是原來減少量20美分的五分之一,而非四分之一。和許多看起來似乎正確的錯誤一樣,這個錯誤通過巧妙的夸張,使事情看上去更美妙了。 這種偷換概念是最難察覺得到的,同時是欺騙手段最高明的,舉一個最簡單的例子,讓我們假設去年一夸脫牛奶值20美分,一條面包5美分。今年牛奶的價格降至10美分,而面包的價格升至l0美分?,F(xiàn)在你想證明什么呢?物價指數(shù)上升?物價指數(shù)下降?或者根本沒有變化?
13、 首先選擇去年作為基期,也就是說,以去年的價格為100。既然牛奶的價格降了一半(即50),并且面包的價格是去年的2倍(即200),將50與200進行平均得125,與去年相比,今年的價格上漲了25。用另一種方法試試,以今年的價格為基期。去年牛奶的價格是今年的200,而面包的價格是今年的50,平均數(shù)又是125,也就是說,去年的價格比今年的高25,今年的價格下降了。如果你想證明價格沒有發(fā)生變化,試試使用幾何平均數(shù),這時你可以隨意選擇基期。幾何平均數(shù)不同于算術平均數(shù),或均值;但它也是合法的計算方法,而且在某些情況下它是一種最有效的方法。計算3個數(shù)的幾何平均數(shù),只需將3個數(shù)相乘,開3次方根;4個數(shù)的幾何平均數(shù),開4次方根;兩個數(shù)的則開平方根,以此類推。 事實是,如果不去考慮它的數(shù)學基礎。統(tǒng)計不僅是一門科學,而且還是一門藝術。許多控制甚至扭曲都是在合理范圍之內進行的。統(tǒng)計工作者經(jīng)常要在許多方法中主觀地選擇一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高級算法與數(shù)據(jù)結構試題及答案
- 法學概論基礎知識的復習方法試題及答案
- 網(wǎng)絡管理員考試復習課程試題及答案
- 軟件設計師備考時間管理技巧試題及答案
- 法律責任與法律后果試題及答案
- 法律職業(yè)的倫理與社會責任試題及答案
- 未來投入產出分析與戰(zhàn)略試題及答案
- 明確方向2025年軟件設計師試題及答案
- 公司戰(zhàn)略與社會影響試題及答案
- 法學概論中的法律政策評估與反饋機制試題及答案
- 2025年小升初語文第一次全真模擬試卷(1)(統(tǒng)編版+含答案解析)
- 廠區(qū)保安培訓試題及答案
- 2025年消防設施操作員(中級)職業(yè)技能鑒定參考試題庫(500題含答案)
- 購銷庫爾勒香梨合同協(xié)議
- 2025年山東交通技師學院招聘筆試試題(附答案)
- (三模)豫西北教研聯(lián)盟 (平許洛濟)2024-2025學年高三第三次質量檢測英語試卷(含答案)
- 2025年海淀高三二模語文試題及答案
- 2025年智能型低壓電器、智能型低壓開關柜項目可行性研究方案
- 三方合伙開店協(xié)議合同
- 《緊急多發(fā)傷的臨床救治》課件
- 2025年危險品水路運輸從業(yè)資格考試復習題庫-上(單選題)
評論
0/150
提交評論