統(tǒng)計(jì)陷阱讀后感參考模板_第1頁
統(tǒng)計(jì)陷阱讀后感參考模板_第2頁
統(tǒng)計(jì)陷阱讀后感參考模板_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計(jì)陷阱讀后感放寒假前,經(jīng)學(xué)長的介紹,特地在圖書館里借了一本統(tǒng)計(jì)陷阱在假期里讀,看完之后的感觸到真不少,而且總想著什么時候?qū)懸稽c(diǎn)讀后心得之類的東西,無奈,因?yàn)槎栊?,總是找各種各樣的理由來推遲。這次還得感謝學(xué)校這個次機(jī)會,讓我終于可以完成早該結(jié)束的任務(wù)了。先來談?wù)剬戇@本書的背景:在20世紀(jì)50年代,美國出現(xiàn)了一種尊崇統(tǒng)計(jì)風(fēng),太多的人都樂意,也輕易的相信了那些統(tǒng)計(jì)數(shù)據(jù),原因很簡單,大多數(shù)的統(tǒng)計(jì)數(shù)據(jù)都可以讓不同的人產(chǎn)生不同的效果。例如,一個企業(yè)可以讓員工看出今年的效益,同樣的數(shù)據(jù),換一種統(tǒng)計(jì)方法,也可以反映出企業(yè)的不景氣,這就是為什么太多的公司,企業(yè),甚至政府部門都習(xí)慣用統(tǒng)計(jì)的方法來傳達(dá)自己的意思。

2、介于這個背景之下,美國作家達(dá)萊爾·哈夫以一個經(jīng)驗(yàn)老道,且退休的竊賊的身份,用回憶錄的形式,在本書的前八章講述了常用的一些行騙手段,在第九章總結(jié)了前面所列出的所有方法,而在最后一章中,教人們?nèi)绾巫R破統(tǒng)計(jì)數(shù)據(jù)中的陷阱,告誡人們以一個正確的態(tài)度去看待一個數(shù)據(jù),從而不做一個被數(shù)據(jù)玩弄于手的玩偶。本書中列舉出的,常用統(tǒng)計(jì)手段大致可分為:利用內(nèi)在有偏樣本,選出不同的平均數(shù),隱藏總要的數(shù)據(jù),忽略必要的誤差,濫用統(tǒng)計(jì)圖形,采用不完整匹配的資料以及誤解相關(guān)關(guān)系等。當(dāng)讀完這本書時,回過頭在,如果你用書中的衡量標(biāo)準(zhǔn)來看任何一組數(shù)據(jù),都會發(fā)現(xiàn)其中的不可行性,所有的數(shù)據(jù)都是可以質(zhì)疑的,那么不禁會有兩種念頭:其

3、一,為什么統(tǒng)計(jì)著要這樣做,公布這樣的數(shù)據(jù)是為什么?答案很簡單,無非是利益所趨,商家,政府乃至所有人都想隱藏掉那些自己認(rèn)為很重要的數(shù)據(jù),公諸于世的無非是想博得同情或者獲得榮耀。其二,這個世上不就沒有可以相信的數(shù)據(jù),因?yàn)闆]喲絕對的正確,那么我們是否就因此而否定自己看到的,聽到的一切呢?顯然不是,這本書最重要的是,教會我們?nèi)绾握_的看待數(shù)據(jù),正確的從數(shù)據(jù)中拿去自己需要的,不可全信,但不意味著一點(diǎn)也都不可信。在這里,我重點(diǎn)來談?wù)劊簝?nèi)在有偏樣本,選取不同平均數(shù),采用不完整匹配的資料以及誤解相關(guān)關(guān)系這幾種“行騙手段”。首先說說內(nèi)在有偏樣本,我用原文中的一個例子來解釋這種方法的意思:“1924級的耶魯畢業(yè)生

4、平均年收入有25111美元。”時代雜志在評論紐約太陽報(bào)的某篇報(bào)道時曾經(jīng)指出。 乍眼一看,感覺耶魯大學(xué)的確是個很了不起的學(xué)校,那里面的畢業(yè)生都有高質(zhì)量的就業(yè)率。在感嘆之余,細(xì)細(xì)想想,你會發(fā)現(xiàn)有兩點(diǎn)可以之處:第一,如此的精確;第二,竟然如此的大。那么,這個精確地個位的收入是如何得出來的呢?除非是在保證沒有外快的情況下,只靠工資條生活的人,他的工資才是有可能精確地個位的,那么現(xiàn)實(shí)并非如此,越是成功的人,他的工資來源越是不那么單一。我們都知道,只要樣本足夠大,并且具有代表性,在多數(shù)情況下,樣本的信息可以很好地代表總體。但如果條件不滿足,抽樣的結(jié)果比一個臆想的結(jié)果好不到哪兒去除了會形成一種十分科學(xué)精確的

5、虛假印象意外,這種方法分本不值得推薦。然而,令人悲傷的事實(shí)是,在我們看到的或自以為知道的事物中,充斥著許多從類似的樣本,即有偏的或過小的或兩者都滿足的樣本中得出的結(jié)論。 耶魯大學(xué)的收入同樣也是一個樣本,但恰恰這個因?yàn)槭怯刑嗟钠畹???梢钥隙ǖ氖?,沒有誰可以掌握25年后所以存活的1924屆耶魯大學(xué)生的收入情況。此外,在你可以聯(lián)系得到的人中,能接受問卷調(diào)查的人數(shù)是屈指可數(shù)的。在這里,需要提醒大家的是,一般的問卷調(diào)查,5%10%的回收率就已是相當(dāng)可觀的了,在加上調(diào)查內(nèi)容的不同,這個比例還是會有出入的,但決定不能達(dá)到百分之百。最重要的,并非所有接受問卷調(diào)查的人都是可以說實(shí)話的。尤其是在工資這種很敏感

6、的話題上。試想想一個稅務(wù)局的人員來調(diào)查你的收入情況,你會如實(shí)回答嗎?我想未必,多數(shù)人都會盡可能的說的小一點(diǎn),畢竟說的多了,可能意味著要多交一點(diǎn)稅呢。再有,和同學(xué)聚會是,看見被人都在侃侃而談,你非但不會如實(shí)回答自己的工資數(shù),因?yàn)樘摌s心,多多少少都會夸大一點(diǎn)。這些都是合乎常理,同樣也是無法避免的。而對于那些從名校畢業(yè),但現(xiàn)狀落魄的人,肯定不愿意透露自己的實(shí)際情況。那么,不難看出,耶魯大學(xué)的畢業(yè)生收入情況,它僅僅代表了1924屆中可以聯(lián)系得到的人中的愿意站出來說出自己輸入的那些特殊人群。因?yàn)檎{(diào)查的對象本來就存在明顯的差異和偏向性,這是導(dǎo)致其最終結(jié)果失敗的根本原因。接下來,同樣用一個例子來談?wù)剬ζ骄鶖?shù)

7、的選取。一個老板為了炫耀自己公司的福利有多好,就在招聘部門公布了這樣的一個信息:本公司的全體員工的平均收入是5700美元。聽上去挺不錯的??墒悄愕米粤?xí)想想,這里的平均到底是什么平均數(shù)?是算術(shù)平均數(shù)?是眾數(shù)還是中位數(shù)?作為應(yīng)聘的你,更希望的這個平均是眾數(shù)吧,因?yàn)檫@樣以來,公司總出現(xiàn)次數(shù)最多的是5700美元,而任何一個公司的基層人員往往是最多的,那么就意味著即使你是普通員工,也可以拿到這個豐厚的薪水??涩F(xiàn)實(shí)并非如此,通常這里的均數(shù)都是算術(shù)平均數(shù),因?yàn)槿w員工中,包含了老板,經(jīng)理等高層人士,同樣也包括了基層員工??墒钱?dāng)高層的工資數(shù)高達(dá)上萬,甚至幾十萬,而基層的員工拿著不到兩千甚至不足一千的收入時,照

8、樣可以平均到五六千的收入。所以,在以后的閱讀中,尤其是對這種帶有平均感念的統(tǒng)計(jì)數(shù)據(jù)中,不禁的要反問一句,它到底是什么平均數(shù),不然,你將得到會與你的想法大徑相同。讓我們一同來看看不完整的匹配資料這種手段。有這樣的一個例子:“去年飛機(jī)失事造成的人員死亡比1910年多”,這是否意味著現(xiàn)在乘飛機(jī)要比過去危險?我們都知道,在現(xiàn)階段的這個社會中,因交通事故死亡的人數(shù)比上個世紀(jì)中整整一百年中死亡的人數(shù)還要多,難道就因此要否定社會的進(jìn)步嗎?這種牛頭不對馬嘴的匹配顯然是不對的。看看歷史,不難發(fā)現(xiàn),在過去的一個世紀(jì)了,能乘坐飛機(jī)的的人數(shù)有多少,而現(xiàn)階段,在這樣大的一個基數(shù)下,我們不妨做個簡單是算術(shù),用每年死亡的人

9、數(shù)除以每年的客流量,那么你將會發(fā)現(xiàn),現(xiàn)階段的死亡比率將會小的可以忽略。而太多的人們總喜歡用比較多額手段來評判事物的好壞,可遺憾的是用錯誤的參考對象;來作比較。這種情況在我們的生活中比比皆是。在這里也不一一列舉,只想告訴大家的是,在對于比較性的統(tǒng)計(jì)數(shù)據(jù)中,在被統(tǒng)計(jì)數(shù)據(jù)所震驚的同時,想想他們的對比是否在同一個標(biāo)準(zhǔn),所采用的對象是否具有比較的意義。接下來的這種“行騙手段”是我們在生活中最難察覺,恰恰是最被“騙子們”慣用的一種手法。相關(guān)關(guān)系與因果關(guān)系。在這里先介紹一種統(tǒng)計(jì)學(xué)中的一個經(jīng)典謬誤:如果B緊跟著A出現(xiàn),那么A一定導(dǎo)致了B的發(fā)生。舉一個簡單例子:有兩塊準(zhǔn)時的時鐘,當(dāng)a到某一整點(diǎn)時刻是,時鐘b就會

10、敲響。那么是否b鐘的敲響是否取決于a鐘是否走到該整點(diǎn)時刻呢?顯然不是的。我們只能稱之為是一種聯(lián)合變動。而聯(lián)合變動一種普遍形式是存在其真實(shí)性的,但無法區(qū)分之間的因果關(guān)系,或者說,他們之間就沒有必然的因果聯(lián)系。收入與擁有的股票之間便是這種相關(guān)。你擁有越多的錢,便能買更多的股票;同時,你手頭的股票越多,又可以為你帶來更多的收入。在這種情況下,簡單地認(rèn)為一個因素引起另一個因素是不全面的。最具有戲劇性的相關(guān)是所有變量相互間沒有任何影響,卻存在著顯著的相關(guān)。例如:抽煙和學(xué)習(xí)成績的問題。有人曾經(jīng)費(fèi)盡周折以探求是否抽煙者的大學(xué)成績比不吸煙者的差,結(jié)果的確如此。這著實(shí)讓一些人高興,從此,他們多次使用這個結(jié)論。往

11、通往好成績的道路上存在著放棄抽煙的痛苦。進(jìn)步使用該結(jié)論,還有這樣合理的推斷:抽煙使人的頭腦變笨。當(dāng)抽煙與低分同時出現(xiàn)時,人們得到了一個未經(jīng)證實(shí)的假設(shè),抽煙導(dǎo)致低分。難道就不能是相反的解釋嗎?也許低分促使學(xué)生不喝酒而變得愛抽煙。這種說法與前一種一樣能得到證據(jù)很好的支撐。只是它不能夠滿足宣傳人員的要求。 最后,和大家共同分享一則我最喜歡的統(tǒng)計(jì)案例。紐約時報(bào)在報(bào)道一條來自印第安納波利斯城的美聯(lián)社新聞時,在偷換基數(shù)問題上犯了錯誤。 今天,經(jīng)濟(jì)危機(jī)已大為緩解。屬于印第安納波利斯城建筑貿(mào)易工會的管子工、泥水匠、木工、油漆工和其他工種的工人享受了5的工資提升,這是去年冬天工資下降20的四分之一補(bǔ)償。表面上很

12、合理但是請注意,減少是以原有工資為基數(shù)計(jì)算的,而增加卻使用了較小的基數(shù),即削減后的收入。 我們可以通過一些假設(shè)數(shù)據(jù)來進(jìn)行檢驗(yàn)。為簡單起見,假設(shè)原有收入為1美元,減少20,即為80美分,而在80美分的基礎(chǔ)上增加5僅提高了4美分,它是原來減少量20美分的五分之一,而非四分之一。和許多看起來似乎正確的錯誤一樣,這個錯誤通過巧妙的夸張,使事情看上去更美妙了。 這種偷換概念是最難察覺得到的,同時是欺騙手段最高明的,舉一個最簡單的例子,讓我們假設(shè)去年一夸脫牛奶值20美分,一條面包5美分。今年牛奶的價格降至10美分,而面包的價格升至l0美分?,F(xiàn)在你想證明什么呢?物價指數(shù)上升?物價指數(shù)下降?或者根本沒有變化?

13、 首先選擇去年作為基期,也就是說,以去年的價格為100。既然牛奶的價格降了一半(即50),并且面包的價格是去年的2倍(即200),將50與200進(jìn)行平均得125,與去年相比,今年的價格上漲了25。用另一種方法試試,以今年的價格為基期。去年牛奶的價格是今年的200,而面包的價格是今年的50,平均數(shù)又是125,也就是說,去年的價格比今年的高25,今年的價格下降了。如果你想證明價格沒有發(fā)生變化,試試使用幾何平均數(shù),這時你可以隨意選擇基期。幾何平均數(shù)不同于算術(shù)平均數(shù),或均值;但它也是合法的計(jì)算方法,而且在某些情況下它是一種最有效的方法。計(jì)算3個數(shù)的幾何平均數(shù),只需將3個數(shù)相乘,開3次方根;4個數(shù)的幾何平均數(shù),開4次方根;兩個數(shù)的則開平方根,以此類推。 事實(shí)是,如果不去考慮它的數(shù)學(xué)基礎(chǔ)。統(tǒng)計(jì)不僅是一門科學(xué),而且還是一門藝術(shù)。許多控制甚至扭曲都是在合理范圍之內(nèi)進(jìn)行的。統(tǒng)計(jì)工作者經(jīng)常要在許多方法中主觀地選擇一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論