




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
現(xiàn)代社會調(diào)查方法第九講警惕統(tǒng)計陷阱現(xiàn)代社會調(diào)查方法第九講警惕統(tǒng)計陷阱蒙提霍爾問題/三門問題
MontyHallproblem出自美國的電視游戲節(jié)目Let‘sMakeaDeal。問題名字來自該節(jié)目的主持人蒙提·霍爾。參賽者會看見三扇關(guān)閉了的門,其中一扇的后面有一輛汽車,選中后面有車的那扇門可贏得該汽車,另外兩扇門后面則各藏有一只山羊。當參賽者選定了一扇門,但未去開啟它的時候,節(jié)目主持人開啟剩下兩扇門的其中一扇,露出其中一只山羊。主持人其后會問參賽者要不要換另一扇仍然關(guān)上的門。那么問題來了:換另一扇門會否增加參賽者贏得汽車的概率?蒙提霍爾問題/三門問題
MontyHallproblem參賽者選擇汽車
(1/3概率)參賽者選擇A羊
(1/3概率)主持人挑出
任一只羊主持人必須
挑出B羊參賽者選擇B羊
(1/3概率)主持人必須
挑出A羊參賽者最初選擇時有1/3的相同概率選擇汽車、A羊和B羊,轉(zhuǎn)換后的獲勝概率為2/3。參賽者選擇汽車
(1/3概率)參賽者選擇A羊
(1/3概率)解釋:當你從三扇門中選了門1后,這扇門后面有獎的幾率是1/3,另兩扇門是2/3。但接下來主持人給了你一個線索。如果獎品在門2后,主持人將會打開門3;如果獎品在門3后,他會打開門2。所以如果你改選的話,只要獎品在門2或門3后你就會贏,兩種情況你都會贏!但是如果你不改選,只有當獎品在門1后你才會贏。總結(jié):概率存在于被給予的條件下,概率不能寄托在實際的物體上。解釋:當你從三扇門中選了門1后,這扇門后面有獎的幾率是1/3霍桑效應
HawthorneEffect20世紀20年代,位于美國芝加哥城郊外的西方電器公司的霍桑工廠,是一家制造電話機的專用工廠,它設備完善,福利優(yōu)越,具有良好的娛樂設施、醫(yī)療制度和養(yǎng)老金制度。但是工人仍然憤憤不平,生產(chǎn)效率也很不理想。為此,1924年美國科學院組織了一個包括各方面專家在內(nèi)的研究小組,對該廠的工作條件和生產(chǎn)效率的關(guān)系,進行考察和實驗,就此拉開了著名的霍桑實驗的序幕。1927年至1933年,由哈佛大學心理家喬梅約(GeorgeMayo)教授為首的研究小組進行了第二回合的實驗研究?;羯P?/p>
HawthorneEffect20世紀20年代,實驗最開始研究的是工作條件與生產(chǎn)效率之間的關(guān)系,包括外部環(huán)境影響條件(如照明強度、濕度)以及心理影響因素(如休息間隔、團隊壓力、工作時間、管理者的領(lǐng)導力)。研究意外發(fā)現(xiàn),各種試驗處理對生產(chǎn)效率都有促進作用,甚至當控制條件回歸初始狀態(tài)時,促進作用仍然存在。這一現(xiàn)象發(fā)生在每一名受試驗者身上,對于受試驗者整體而言,促進作用的結(jié)論亦為真。顯然,實驗假設的各項條件并非是唯一的或決定性的生產(chǎn)效率影響因素。對此,梅奧團隊所做的解釋是,受試者對于新的實驗測試會產(chǎn)生正向反應,即由于環(huán)境改變(研究者的出現(xiàn))而改變行為。所以績效的提高,并非由實驗條件造成,而是自身的反應。這一效果即所謂的“霍桑效應”。實驗最開始研究的是工作條件與生產(chǎn)效率之間的關(guān)系,包括外部環(huán)境由于受到額外的關(guān)注而引起績效或努力上升的情況我們稱之為“霍桑效應”,也就是所謂的“宣泄效應”。在此之前的管理學把人假設為“經(jīng)濟人”,認為金錢是刺激積極性的唯一動力;霍桑實驗首次證明了人是“社會人”,是復雜的社會關(guān)系的成員,因此,要調(diào)動工人的生產(chǎn)積極性,還必須從社會、心理方面去努力。由于受到額外的關(guān)注而引起績效或努力上升的情況我們稱之為“霍桑統(tǒng)計數(shù)字會撒謊
HowtoLiewithStatistics作者:[美]達萊爾·哈夫(DarrelHuff)統(tǒng)計數(shù)字會撒謊
HowtoLiewithStatis《統(tǒng)計數(shù)字會撒謊》1.內(nèi)在有偏的樣本2.精心挑選的平均數(shù)3.沒有披露的數(shù)據(jù)4.毫無意義的工作5.令人驚奇的圖形6.一維圖形的濫用7.不完全匹配的資料8.相關(guān)關(guān)系的誤解9.如何反駁統(tǒng)計資料《統(tǒng)計數(shù)字會撒謊》1.內(nèi)在有偏的樣本2.精心挑選的平均數(shù)3.1.內(nèi)在有偏的樣本
Thesamplewiththebuilt-inbias示例1:“6月15日,人工智能公司iPIN.com在北京發(fā)布了《2015年中國大學薪酬排行榜》,清華大學高居榜首,復旦大學和上海財經(jīng)大學分列二三位。據(jù)介紹,這份薪酬排行榜是根據(jù)來自招聘和獵頭公司的4000萬大學畢業(yè)生真實畢業(yè)去向數(shù)據(jù)分析所得,由各大學畢業(yè)五年薪酬指數(shù)計算所得。”——轉(zhuǎn)自新浪·教育頻道,2015年6月16日1.內(nèi)在有偏的樣本
Thesamplewith第講+警惕統(tǒng)計陷阱課件第講+警惕統(tǒng)計陷阱課件示例2:“近年來,湖南衡陽親子鑒定人數(shù)越來越多。衡陽市中心醫(yī)院病理科法醫(yī)伍先生介紹,去年1月至今年7月,前來咨詢做親子鑒定的約有100例,其中不是親生的占35%?!H子鑒定35%非親生,如果這個數(shù)據(jù)確鑿,確實令人驚訝。盡管社會的開放度提升了,但這個比例實在太高了?!@個問題非常嚴重,一定要想辦法解決?!薄稙t湘晨報》2013年7月28日示例2:示例3:“據(jù)杜蕾斯的一項全球調(diào)查顯示,男人一生平均有13個性伴侶,而女人的(性伴侶)只有7個?!薄腥苏娴谋扰嘶ㄐ??——轉(zhuǎn)自搜狐網(wǎng)·男人頻道,2013年1月11日示例3:小結(jié):究竟調(diào)查了多少樣本?多少人愿意回答調(diào)查問卷?調(diào)查問卷基本是那些現(xiàn)在還能取得聯(lián)系而且愿意回答這些問題的人“壟斷”,基本沒什么意義。→你只能調(diào)查你看得到的人們在回答問題的時候也不會真的說真話,可能會美化自己的形象,或者迎合提問者的偏好。→人格面具不可避免(尤其是面訪時)小結(jié):無論如何,只要有可能的誤差(有形的、無形的),你都應該對結(jié)論保持懷疑的態(tài)度。可以刻意造成的誤差:調(diào)查對象的年齡層、調(diào)查地點(大商場大多是年輕人,高級酒店大多是商務人士)、調(diào)查時間(早、晚)?!鷪鼍耙ヅ鋸目傮w中抽出的樣本(第一次抽樣)遠不能稱為隨機抽樣,因此可能對所有的總體都不具有顯著的代表性。無論如何,只要有可能的誤差(有形的、無形的),你都應該對結(jié)論被調(diào)查的樣本是否具有代表性,是否能代表未參加調(diào)查的樣本?統(tǒng)計中會出現(xiàn)兩種趨勢:夸大和縮小。兩種趨勢相互抵消的可能性極小。一般,一種趨勢會強過另一種趨勢,我們很難猜測哪種趨勢勝出根據(jù)樣本得到的結(jié)論,不會比樣本更精確。看到精確的統(tǒng)計數(shù)據(jù)時,要思考統(tǒng)計的過程是什么樣的。被調(diào)查的樣本是否具有代表性,是否能代表未參加調(diào)查的樣本?為了確保結(jié)論有價值,要采用有代表性的樣本,這樣才能排除各種誤差。心理學家說:人都點神經(jīng)質(zhì)從病例的數(shù)量來看,確實可以證明
但病人在正常人中的比例是多少,正常人是不看心理醫(yī)生的最基本的樣本是隨機樣本,它是指完全遵循隨機選擇從總體中選出的樣本,總體即形成樣本的母體。為了確保結(jié)論有價值,要采用有代表性的樣本,這樣才能排除各種誤隨機樣本的檢驗方法是,總體中的每個名字或事物是否有相同的幾率被選進樣本?純隨機樣本是唯一有足夠把握經(jīng)受統(tǒng)計理論審查的樣本,樣本選取難度大,成本昂貴。分層隨機抽樣是一個更經(jīng)濟的替代品,通過準備好內(nèi)部所有單位的名單,只調(diào)查被隨機抽中的單位。隨機樣本的檢驗方法是,總體中的每個名字或事物是否有相同的幾率示例4:1936年,共和黨人蘭登與當時的總統(tǒng)羅斯福競選下屆總統(tǒng)美國,《文學文摘》(LiteraryDigest)這家頗有聲望的雜志承擔了選情預測的任務。此前,它已經(jīng)成功地預測了5次總統(tǒng)選舉的結(jié)果。當時采用的是郵寄問卷的辦法,調(diào)查人員雄心勃勃,從電話號碼簿里和本雜志的訂戶中選取了需要郵寄問卷的對象1000萬個,覆蓋四分之一的選民。雜志最終收到了驚人的240萬份回執(zhí),在統(tǒng)計計算完成以后,它預言蘭登將擊敗尋求連任的羅斯??偨y(tǒng),然而這次調(diào)查的結(jié)論和實際的結(jié)果大相徑庭,結(jié)果卻是羅斯福以壓倒多數(shù)再次當選。示例4:2.精心挑選的平均數(shù)
Thewell-chosenaverage示例1:“2012年底,城鎮(zhèn)和農(nóng)村人均住房面積32.9平方米、37.1平方米,分別比2007年增加2.8平方米和5.5平方米?!薄獪丶覍殻骸墩ぷ鲌蟾妗罚谑萌珖舜笠淮螘h,2013年3月25日2.精心挑選的平均數(shù)
Thewell-chose質(zhì)疑:“32.9平方米”這個數(shù)字表明我國“全面小康”中含金量最大的一塊住房小康已經(jīng)基本實現(xiàn)(主要指標為:到2010年城鎮(zhèn)人均住房建筑面積達到30平米,到2020年達到35平米),標志著我國城鎮(zhèn)居民的住房問題基本解決。真相果真如此嗎?又被平均了?這并非“民生話題”,而是一個再簡單不過的“算術(shù)問題”。讓我們來算一算~~質(zhì)疑:根據(jù)國家統(tǒng)計局2012年度統(tǒng)計年報,到2012年底,“全國大陸總?cè)丝跒?35404萬人,其中城鎮(zhèn)人口為71182萬人”。71182萬乘以人均32.9平方米的住房面積,意味著全國城鎮(zhèn)到2012年底擁有的全部住房應該為2341887.8萬平方米(約234.2億平方米)。然而,根據(jù)原建設部公布的2002年底全國城鎮(zhèn)存量住宅面積,加上《中國統(tǒng)計年鑒》公布的2003-2012年全國城鎮(zhèn)住宅竣工的總面積,可得全國城鎮(zhèn)總的住宅總面積為155.49億平方米??芍?,用官方公布的統(tǒng)計數(shù)據(jù)計算,城鎮(zhèn)人均住房面積僅有21.8平方米,遠低于政府工作報告所稱的32.9平方米。根據(jù)國家統(tǒng)計局2012年度統(tǒng)計年報,到2012年底,“全國大何為“平均”?提問:一條河的平均深度是0.8米,一個小孩身高1.3米,他雖然不會游泳,但肯定不會在這條河里淹死。對嗎?為什么?何為“平均”?示例2:富有的鄰居:一個人聲稱社區(qū)居民的年平均收入為15萬元,同時另一個人則說社區(qū)年平均收入是3.5萬元。兩個人都對,為什么?鄰居年收入(萬元)老張100老李22.5老王8老趙6老錢4老孫3老楊2老吳2老周1.5老鄭1均值15萬中位數(shù)3.5萬眾數(shù)2萬示例2:鄰居年收入(萬元)老張100老李22.5老王8老趙6第講+警惕統(tǒng)計陷阱課件小結(jié):三者關(guān)系:平均數(shù)(Arithmeticmean)為一個平衡點,是一組數(shù)據(jù)的重心。它使數(shù)軸保持平衡,即支點兩側(cè)的力矩是相等的。中位數(shù)(Median)只使其兩側(cè)的數(shù)據(jù)個數(shù)相同。眾數(shù)(Mode)是指次數(shù)出現(xiàn)最多的,重量較大的那個數(shù)據(jù)。正態(tài)分布的鐘型曲線,三個數(shù)落在相同點上。例如人類身高、體型→訂制校服長尾曲線(偏態(tài)分布),三種數(shù)值相差甚遠。小結(jié):三者比較:比較的項目平均數(shù)中數(shù)眾數(shù)適用數(shù)據(jù)類型定距、定比定序、定距、定比定類、定序、定距、定比計算需要所有的數(shù)據(jù)只需中間數(shù)據(jù)計算迅速進一步運算特性可以不可以不可以受抽樣的影響較少較大較大受分組的影響不大較大最大受極端數(shù)據(jù)的影響最嚴重最少一般適用場合一般情況都用平均數(shù)①有極端數(shù)據(jù)時;
②當兩端數(shù)據(jù)或個別數(shù)據(jù)不清楚時;
③快速估計代表值時。①有極端數(shù)據(jù)時;
②數(shù)據(jù)不同質(zhì)找典型;
③快速估計代表值時;
④估計分布形態(tài)時。三者比較:比較的平均數(shù)中數(shù)眾數(shù)適用數(shù)據(jù)類型定距、定比定序、定示例3:“截至2011年8月,中國家庭資產(chǎn)平均為121.69萬元,城市家庭平均為247.60萬元,農(nóng)村家庭平均為37.70萬元?!薄袊彝ソ鹑谡{(diào)查與研究中心:《中國家庭金融調(diào)查報告》,2012年示例3:3.沒有披露的數(shù)據(jù)
Thelittlefiguresthatarenotthere示例1:經(jīng)科學驗證,高露潔360°牙膏能減少口腔細菌滋生,效果最高高出75%*,有效對抗八大口腔問題。*數(shù)據(jù)來自高露潔研究資料。與高露潔普通含氟牙膏相比。——高露潔官網(wǎng)3.沒有披露的數(shù)據(jù)
Thelittlefigu沒有披露的數(shù)據(jù):1.樣本容量:10個還是100個?2.實驗過程:測試對象選取、持續(xù)時間?沒有披露的數(shù)據(jù):來做一個小實驗:每人拿出一枚硬幣,連續(xù)拋10次,記錄正面(數(shù)字)朝上的次數(shù)。四種可能性:正面反面豎起來消失了來做一個小實驗:四種可能性:小結(jié):數(shù)量小的樣本存在偶然因素→不充分的樣本,必然導致偶然的、毫無指導意義的統(tǒng)計結(jié)論。任何由于機遇所產(chǎn)生的差異,在大樣本的使用中都是微不足道的(如2%的抑菌效果)。樣本究竟需要多大?取決于采用抽樣方式所研究的總體容量有多大、變動程度有多大。但有時樣本規(guī)模與看上去的并不一致(如小兒麻痹癥疫苗實驗,450名實驗組成員vs.680名對照組成員,所有人都沒患?。_€有統(tǒng)計實驗的持續(xù)時間問題(如感冒藥盛行的邏輯)小結(jié):數(shù)據(jù)的顯著性檢驗:注意沒有披露的數(shù)據(jù)顯著性程度:10%、5%、1%另一種沒有披露的數(shù)據(jù):表明事物的變動范圍(全距)和給定平均數(shù)的偏離水平(標準差)“第六次全國人口普查顯示,我國平均每個家庭戶的人口為3.1人”→兩居室戶型重復建設,低估了更大或更小規(guī)模家庭的需求。昆明和北非撒哈拉沙漠地區(qū)的年平均氣溫都在15℃左右,但昆明的氣溫波動范圍是7~28℃,而沙漠的波動范圍是-9~40℃數(shù)據(jù)的顯著性檢驗:注意沒有披露的數(shù)據(jù)4.毫無意義的工作
Muchadoaboutpracticallynothing示例1:小紅和小明做了公認最好的智力測驗——斯坦福-比內(nèi)測驗(Stanford-Binetscale),結(jié)果是小紅的智商為101,小明的只有98。專家告訴我們智商的平均數(shù)是100,即100意味著“正?!?。于是進一步推斷,小紅是比較聰明的孩子,小明是個笨孩子。任何類似的結(jié)論都是胡說!4.毫無意義的工作
Muchadoabout解讀:無論智力測驗的是什么,它與通常意義上的智商都不會是一回事。智力測試只是智力水平的一個抽樣,與其他抽樣一樣,智商值也具有統(tǒng)計誤差,誤差值將衡量該數(shù)值的準確度和可信度。假定測量的誤差是3%,這樣一個孩子的真正智商可能是98±3,也即95到101;而另一個孩子的真正智商可能是101±3,也即98到104,而且在此區(qū)間內(nèi)的分布是相同的。在這種情況下,其實還有不小的可能那個“智商低”的孩子的智商比那個“智商高”的孩子要高。解讀:第講+警惕統(tǒng)計陷阱課件小結(jié):對待智力測驗以及許多其他類似的抽樣結(jié)果都應該注意它的范圍。如平均智商不應該只是100這樣的一個數(shù)值,而應該是諸如90~110這樣的一個范圍。所有抽樣統(tǒng)計都存在誤差,忽略這些誤差將導致一些愚蠢的舉動。只有當差別有意義時,才能稱之為差別。小結(jié):示例2:10種香煙焦油含量比較圖示例2:5.令人驚奇的圖形
Thegee-whizgraph一張圖告訴你樸實的10%的增長,而另一張卻看起來是讓人振奮的100%的增長,別懷疑你的眼睛,截然不同的兩幅圖說的可是同一回事!5.令人驚奇的圖形
Thegee-whizgr第講+警惕統(tǒng)計陷阱課件第講+警惕統(tǒng)計陷阱課件小結(jié):最簡單的統(tǒng)計圖形是直線類圖形。在顯示趨勢時,直線圖形非常有用。數(shù)據(jù)是相同的,所以圖形也相同,除了圖形給人留下的印象不同之外,沒有進行任何的偽造。改變一下橫縱坐標的比例關(guān)系,就可改變圖形(沒有規(guī)定不可以這么做)。圖形比文字更有效,圖形更具有客觀性的幻覺。小結(jié):6.一維圖形的濫用
Theone-dimensionalpicture數(shù)字是2∶1,但視覺效果卻是8∶1。嘴上說的是1.5倍,看起來卻是3倍……或許你正在被這些圖形所振奮著。6.一維圖形的濫用
Theone-dimensi第講+警惕統(tǒng)計陷阱課件小結(jié):在比較兩種或兩種以上事物某個方面的具體數(shù)量時,柱狀圖是一種便捷常用的方法。柱狀圖也具有欺騙性!在描述單一物體時,柱體改變寬度的同時,長度也會發(fā)生變好;在描述三維物體時,物體的體積又不容易進行比較,因此不論何種情況,我們都應該對柱狀圖保留一些懷疑。使用錢袋的形象,雖然長寬高都是1:2,但給人的感覺是體積感,顯示數(shù)值的比例是遠遠大于1:2的。因此,在大多數(shù)時候,視覺效果起著決定性的作用。小結(jié):7.不完全匹配的資料
Thesemi-attachedfigure示例1:
火車和飛機哪個更安全?“2010年全國鐵路交通死亡人數(shù)1589人,航空運輸方面死亡42人?!薄y(tǒng)計公報7.不完全匹配的資料
Thesemi-attac解讀:
統(tǒng)計基數(shù)不同:2010年全國鐵路共發(fā)送旅客16.76億人次,全國民航旅客運輸量則為2.68億人次。統(tǒng)計口徑不同:鐵路交通事故數(shù)據(jù)絕大多數(shù)都是路外事故和生產(chǎn)事故,而不是行車事故,即真正因行車事故死亡的車內(nèi)乘客只占一部分。而航空運輸只統(tǒng)計飛行事故,不包含地面事故和生產(chǎn)事故。直接比較各類交通工具的意外事故數(shù)量來判斷旅途安全情況是不正確的,應該通過詢問每100萬乘客里程的遇難人數(shù),并比較這些人數(shù)才能確定哪種出行方式的風險最大。解讀:小結(jié):當無法證明某件事時,通過證明別的事情,并假裝它們是一回事,因此產(chǎn)生混淆。不完全匹配的資料很容易糊弄人。許多不相匹配的數(shù)據(jù)不是故意欺騙,而是被報道故意歪曲(如:當兵更安全?)。通過照片對比也可以制造不匹配(如減肥效果對比)。小結(jié):第講+警惕統(tǒng)計陷阱課件8.相關(guān)關(guān)系的誤解
Posthocridesagain示例1:“目前吸煙大學生的學習成績差,與目前不吸煙大學生有顯著性差異。應重視吸煙行為對大學生健康的危害,積極開展健康教育以及對大學生吸煙的行為進行干預?!薄燮降龋骸洞髮W生吸煙狀況調(diào)查》,《中國實用醫(yī)藥》2007年第22期8.相關(guān)關(guān)系的誤解
Posthocrides解讀:樣本容量是否足夠大?抽樣過程是否科學合理?相關(guān)關(guān)系是否確實十分顯著?兩個事物之間的關(guān)聯(lián)關(guān)系并不能用于說明其中一個將引起另外一個的變化。謬誤:如果b緊跟著a出現(xiàn),那么a形成了b抽煙與低分同時出現(xiàn)→抽煙導致低分會不會是相反的作用關(guān)系?因為成績不理想促使學生變得愛抽煙,依次釋放壓力。兩個因素并不互為因果,而可能同為第三個因素的產(chǎn)物。也許性格與分數(shù)相關(guān),也許內(nèi)向性格的學生更愛抽煙。解讀:小結(jié):一種相關(guān)是由偶然性產(chǎn)生的小概率發(fā)生的事情,可以用很小的樣本證明一種相關(guān)是互為因果收入越多,買的股票越多;買的股票越多,收入越多。一種相關(guān)是所有變量相互間沒有影響,但是存在顯著的關(guān)系抽煙多與成績低之間的關(guān)系,但可能涉及第三因素:性格。小結(jié):小結(jié):超過相關(guān)關(guān)系的數(shù)據(jù)范圍而得出的結(jié)論雨多,谷物長得好;但是要是下連續(xù)下暴雨呢?不能超過“度”一種趨勢通常不是一對一的理想關(guān)系有些可以證明是正相關(guān),但是同樣也可以證明其毫無意義數(shù)據(jù)是真實的,但是未必能得出一個可以證實的結(jié)論,也許完全建立在假設之上。在胡亂使用相關(guān)性時,要分辨這種相關(guān)是事件變遷的產(chǎn)物或時代趨勢的產(chǎn)物。小結(jié):9.如何反駁統(tǒng)計資料
Howtotalkbacktoastatistic其一,誰說的?首先尋找有意識的偏差。當提到權(quán)威人士的時候,應看內(nèi)容是不是權(quán)威的,而不是僅僅扯上大名。其二,他是如何知道的?看樣本是否有偏?樣本是否足夠大?以保證結(jié)論值得信賴9.如何反駁統(tǒng)計資料
Howtotalkba關(guān)于數(shù)據(jù)的來源我們需要注意五點:(1)數(shù)據(jù)發(fā)布機構(gòu)是否權(quán)威(代表性)?國研網(wǎng):行研報告,各類數(shù)據(jù)。國家統(tǒng)計局數(shù)據(jù)庫:宏觀數(shù)據(jù)、金融、教育、行業(yè)數(shù)據(jù)等,包含國家一級、31個省以及200多個市的數(shù)據(jù)?!吨袊y(tǒng)計年鑒》:歷年統(tǒng)計年鑒以及普查數(shù)據(jù)、專題數(shù)據(jù)等。(2)是否發(fā)布機構(gòu)的原版文件(可信度)?關(guān)于數(shù)據(jù)的來源我們需要注意五點:(3)數(shù)據(jù)采集面向的對象(調(diào)研主體)?(4)數(shù)據(jù)是一手數(shù)據(jù)還是二手數(shù)據(jù)(時效性、相關(guān)性)?
(3)數(shù)據(jù)采集面向的對象(調(diào)研主體)?(5)數(shù)據(jù)采集方式是什么?(投票方式)在網(wǎng)絡上進行投票還是在現(xiàn)實中分發(fā)問卷有很大的不同,兩者都有很多細節(jié)點需要注意。網(wǎng)絡投票:如何防止機器人、惡意投票以及UI的設計是關(guān)鍵?,F(xiàn)實問卷:如何設計題目(邏輯性、完整性、非誘導性)以及投放方式(時間、地點、對象)是關(guān)鍵。(5)數(shù)據(jù)采集方式是什么?(投票方式)其三,遺漏了什么?信息發(fā)布者和信息本身具有利害關(guān)系,需要關(guān)注一下。很多信息缺乏比較而失去意義。有時僅給出百分數(shù)卻沒有原始數(shù)據(jù)也能造成欺騙。選擇數(shù)據(jù)的產(chǎn)生的時期,也會產(chǎn)生誤導大蕭條后,利潤指數(shù)增長超過工資,工會因此要求漲工資。實際上,大蕭條時,利潤降到了最低。有時文章遺漏引起變化的原因,而使讀者誤解其他因素是引起變化的原因。其三,遺漏了什么?其四,是否有人偷換了概念?相關(guān)關(guān)系變成因果關(guān)系。很多人標榜第一,但是從沒有說清是哪個具體領(lǐng)域。其五,這些資料有意義嗎?建立在未經(jīng)證實的假設之上有意義嗎?已發(fā)生的事情都是事實,而未來的趨勢都是預測,暗含的條件是所有條件都相同,現(xiàn)在的趨勢將繼續(xù)下去。其四,是否有人偷換了概念?以下說法存在什么問題?成龍的格力空調(diào)廣告說:“我要省電30%。”在美國與西班牙交戰(zhàn)期間,美國海軍的死亡率是9‰,而同時期紐約市居民的死亡率是千分16‰。后來海軍征兵人員就用這些數(shù)據(jù)來證明參軍更安全。英國新赫布里群島土著居民的信條:身上的跳蚤會帶來健康。因為通過幾個世紀的觀察,土著居民發(fā)現(xiàn)健康人的身上總有一些跳蚤,而身體羸弱的人身上通常沒有跳蚤。于是他們得出結(jié)論:跳蚤使人身體健康,每個人身上都應該有跳蚤。以下說法存在什么問題?成龍的格力空調(diào)廣告說:“我要省電30%調(diào)查顯示近半數(shù)中國富人想移居海外巴克萊(Barclays)的一項新調(diào)查顯示,近半數(shù)中國富人打算在未來五年內(nèi)移居他國。這項調(diào)查訪問了超過2000名高資產(chǎn)值個人,這些人的資產(chǎn)總額超過15億美元。該調(diào)查顯示47%的中國受訪者表示他們想移居他國,而調(diào)查得到的全球平均比例為29%。華爾街日報中文網(wǎng),2014年9月20日調(diào)查顯示近半數(shù)中國富人想移居海外巴克萊(Barclays)的中國取暖政策導致的空氣污染對預期壽命的影響2013年7月8日發(fā)表在《美國國家科學院院刊》(PNAS)的一篇論文,向已經(jīng)逐漸意識到空氣污染危害的中國民眾再次展現(xiàn)了殘酷的現(xiàn)實:以淮河為界,燒煤供暖的中國北方地區(qū)空氣污染水平高于中國南方,北方5億居民因嚴重的空氣污染,平均每人失去5年壽命。/content/110/32/12936.full中國取暖政策導致的空氣污染對預期壽命的影響2013年7月8日由于使用燃煤取暖,中國5億北方居民預期壽命將縮短5.5年由于使用燃煤取暖,中國5億北方居民預期壽命將縮短5.5現(xiàn)代社會調(diào)查方法第九講警惕統(tǒng)計陷阱現(xiàn)代社會調(diào)查方法第九講警惕統(tǒng)計陷阱蒙提霍爾問題/三門問題
MontyHallproblem出自美國的電視游戲節(jié)目Let‘sMakeaDeal。問題名字來自該節(jié)目的主持人蒙提·霍爾。參賽者會看見三扇關(guān)閉了的門,其中一扇的后面有一輛汽車,選中后面有車的那扇門可贏得該汽車,另外兩扇門后面則各藏有一只山羊。當參賽者選定了一扇門,但未去開啟它的時候,節(jié)目主持人開啟剩下兩扇門的其中一扇,露出其中一只山羊。主持人其后會問參賽者要不要換另一扇仍然關(guān)上的門。那么問題來了:換另一扇門會否增加參賽者贏得汽車的概率?蒙提霍爾問題/三門問題
MontyHallproblem參賽者選擇汽車
(1/3概率)參賽者選擇A羊
(1/3概率)主持人挑出
任一只羊主持人必須
挑出B羊參賽者選擇B羊
(1/3概率)主持人必須
挑出A羊參賽者最初選擇時有1/3的相同概率選擇汽車、A羊和B羊,轉(zhuǎn)換后的獲勝概率為2/3。參賽者選擇汽車
(1/3概率)參賽者選擇A羊
(1/3概率)解釋:當你從三扇門中選了門1后,這扇門后面有獎的幾率是1/3,另兩扇門是2/3。但接下來主持人給了你一個線索。如果獎品在門2后,主持人將會打開門3;如果獎品在門3后,他會打開門2。所以如果你改選的話,只要獎品在門2或門3后你就會贏,兩種情況你都會贏!但是如果你不改選,只有當獎品在門1后你才會贏??偨Y(jié):概率存在于被給予的條件下,概率不能寄托在實際的物體上。解釋:當你從三扇門中選了門1后,這扇門后面有獎的幾率是1/3霍桑效應
HawthorneEffect20世紀20年代,位于美國芝加哥城郊外的西方電器公司的霍桑工廠,是一家制造電話機的專用工廠,它設備完善,福利優(yōu)越,具有良好的娛樂設施、醫(yī)療制度和養(yǎng)老金制度。但是工人仍然憤憤不平,生產(chǎn)效率也很不理想。為此,1924年美國科學院組織了一個包括各方面專家在內(nèi)的研究小組,對該廠的工作條件和生產(chǎn)效率的關(guān)系,進行考察和實驗,就此拉開了著名的霍桑實驗的序幕。1927年至1933年,由哈佛大學心理家喬梅約(GeorgeMayo)教授為首的研究小組進行了第二回合的實驗研究?;羯P?/p>
HawthorneEffect20世紀20年代,實驗最開始研究的是工作條件與生產(chǎn)效率之間的關(guān)系,包括外部環(huán)境影響條件(如照明強度、濕度)以及心理影響因素(如休息間隔、團隊壓力、工作時間、管理者的領(lǐng)導力)。研究意外發(fā)現(xiàn),各種試驗處理對生產(chǎn)效率都有促進作用,甚至當控制條件回歸初始狀態(tài)時,促進作用仍然存在。這一現(xiàn)象發(fā)生在每一名受試驗者身上,對于受試驗者整體而言,促進作用的結(jié)論亦為真。顯然,實驗假設的各項條件并非是唯一的或決定性的生產(chǎn)效率影響因素。對此,梅奧團隊所做的解釋是,受試者對于新的實驗測試會產(chǎn)生正向反應,即由于環(huán)境改變(研究者的出現(xiàn))而改變行為。所以績效的提高,并非由實驗條件造成,而是自身的反應。這一效果即所謂的“霍桑效應”。實驗最開始研究的是工作條件與生產(chǎn)效率之間的關(guān)系,包括外部環(huán)境由于受到額外的關(guān)注而引起績效或努力上升的情況我們稱之為“霍桑效應”,也就是所謂的“宣泄效應”。在此之前的管理學把人假設為“經(jīng)濟人”,認為金錢是刺激積極性的唯一動力;霍桑實驗首次證明了人是“社會人”,是復雜的社會關(guān)系的成員,因此,要調(diào)動工人的生產(chǎn)積極性,還必須從社會、心理方面去努力。由于受到額外的關(guān)注而引起績效或努力上升的情況我們稱之為“霍桑統(tǒng)計數(shù)字會撒謊
HowtoLiewithStatistics作者:[美]達萊爾·哈夫(DarrelHuff)統(tǒng)計數(shù)字會撒謊
HowtoLiewithStatis《統(tǒng)計數(shù)字會撒謊》1.內(nèi)在有偏的樣本2.精心挑選的平均數(shù)3.沒有披露的數(shù)據(jù)4.毫無意義的工作5.令人驚奇的圖形6.一維圖形的濫用7.不完全匹配的資料8.相關(guān)關(guān)系的誤解9.如何反駁統(tǒng)計資料《統(tǒng)計數(shù)字會撒謊》1.內(nèi)在有偏的樣本2.精心挑選的平均數(shù)3.1.內(nèi)在有偏的樣本
Thesamplewiththebuilt-inbias示例1:“6月15日,人工智能公司iPIN.com在北京發(fā)布了《2015年中國大學薪酬排行榜》,清華大學高居榜首,復旦大學和上海財經(jīng)大學分列二三位。據(jù)介紹,這份薪酬排行榜是根據(jù)來自招聘和獵頭公司的4000萬大學畢業(yè)生真實畢業(yè)去向數(shù)據(jù)分析所得,由各大學畢業(yè)五年薪酬指數(shù)計算所得?!薄D(zhuǎn)自新浪·教育頻道,2015年6月16日1.內(nèi)在有偏的樣本
Thesamplewith第講+警惕統(tǒng)計陷阱課件第講+警惕統(tǒng)計陷阱課件示例2:“近年來,湖南衡陽親子鑒定人數(shù)越來越多。衡陽市中心醫(yī)院病理科法醫(yī)伍先生介紹,去年1月至今年7月,前來咨詢做親子鑒定的約有100例,其中不是親生的占35%。……親子鑒定35%非親生,如果這個數(shù)據(jù)確鑿,確實令人驚訝。盡管社會的開放度提升了,但這個比例實在太高了?!@個問題非常嚴重,一定要想辦法解決?!薄稙t湘晨報》2013年7月28日示例2:示例3:“據(jù)杜蕾斯的一項全球調(diào)查顯示,男人一生平均有13個性伴侶,而女人的(性伴侶)只有7個?!薄腥苏娴谋扰嘶ㄐ??——轉(zhuǎn)自搜狐網(wǎng)·男人頻道,2013年1月11日示例3:小結(jié):究竟調(diào)查了多少樣本?多少人愿意回答調(diào)查問卷?調(diào)查問卷基本是那些現(xiàn)在還能取得聯(lián)系而且愿意回答這些問題的人“壟斷”,基本沒什么意義?!阒荒苷{(diào)查你看得到的人們在回答問題的時候也不會真的說真話,可能會美化自己的形象,或者迎合提問者的偏好?!烁衩婢卟豢杀苊猓ㄓ绕涫敲嬖L時)小結(jié):無論如何,只要有可能的誤差(有形的、無形的),你都應該對結(jié)論保持懷疑的態(tài)度。可以刻意造成的誤差:調(diào)查對象的年齡層、調(diào)查地點(大商場大多是年輕人,高級酒店大多是商務人士)、調(diào)查時間(早、晚)?!鷪鼍耙ヅ鋸目傮w中抽出的樣本(第一次抽樣)遠不能稱為隨機抽樣,因此可能對所有的總體都不具有顯著的代表性。無論如何,只要有可能的誤差(有形的、無形的),你都應該對結(jié)論被調(diào)查的樣本是否具有代表性,是否能代表未參加調(diào)查的樣本?統(tǒng)計中會出現(xiàn)兩種趨勢:夸大和縮小。兩種趨勢相互抵消的可能性極小。一般,一種趨勢會強過另一種趨勢,我們很難猜測哪種趨勢勝出根據(jù)樣本得到的結(jié)論,不會比樣本更精確??吹骄_的統(tǒng)計數(shù)據(jù)時,要思考統(tǒng)計的過程是什么樣的。被調(diào)查的樣本是否具有代表性,是否能代表未參加調(diào)查的樣本?為了確保結(jié)論有價值,要采用有代表性的樣本,這樣才能排除各種誤差。心理學家說:人都點神經(jīng)質(zhì)從病例的數(shù)量來看,確實可以證明
但病人在正常人中的比例是多少,正常人是不看心理醫(yī)生的最基本的樣本是隨機樣本,它是指完全遵循隨機選擇從總體中選出的樣本,總體即形成樣本的母體。為了確保結(jié)論有價值,要采用有代表性的樣本,這樣才能排除各種誤隨機樣本的檢驗方法是,總體中的每個名字或事物是否有相同的幾率被選進樣本?純隨機樣本是唯一有足夠把握經(jīng)受統(tǒng)計理論審查的樣本,樣本選取難度大,成本昂貴。分層隨機抽樣是一個更經(jīng)濟的替代品,通過準備好內(nèi)部所有單位的名單,只調(diào)查被隨機抽中的單位。隨機樣本的檢驗方法是,總體中的每個名字或事物是否有相同的幾率示例4:1936年,共和黨人蘭登與當時的總統(tǒng)羅斯福競選下屆總統(tǒng)美國,《文學文摘》(LiteraryDigest)這家頗有聲望的雜志承擔了選情預測的任務。此前,它已經(jīng)成功地預測了5次總統(tǒng)選舉的結(jié)果。當時采用的是郵寄問卷的辦法,調(diào)查人員雄心勃勃,從電話號碼簿里和本雜志的訂戶中選取了需要郵寄問卷的對象1000萬個,覆蓋四分之一的選民。雜志最終收到了驚人的240萬份回執(zhí),在統(tǒng)計計算完成以后,它預言蘭登將擊敗尋求連任的羅斯??偨y(tǒng),然而這次調(diào)查的結(jié)論和實際的結(jié)果大相徑庭,結(jié)果卻是羅斯福以壓倒多數(shù)再次當選。示例4:2.精心挑選的平均數(shù)
Thewell-chosenaverage示例1:“2012年底,城鎮(zhèn)和農(nóng)村人均住房面積32.9平方米、37.1平方米,分別比2007年增加2.8平方米和5.5平方米?!薄獪丶覍殻骸墩ぷ鲌蟾妗罚谑萌珖舜笠淮螘h,2013年3月25日2.精心挑選的平均數(shù)
Thewell-chose質(zhì)疑:“32.9平方米”這個數(shù)字表明我國“全面小康”中含金量最大的一塊住房小康已經(jīng)基本實現(xiàn)(主要指標為:到2010年城鎮(zhèn)人均住房建筑面積達到30平米,到2020年達到35平米),標志著我國城鎮(zhèn)居民的住房問題基本解決。真相果真如此嗎?又被平均了?這并非“民生話題”,而是一個再簡單不過的“算術(shù)問題”。讓我們來算一算~~質(zhì)疑:根據(jù)國家統(tǒng)計局2012年度統(tǒng)計年報,到2012年底,“全國大陸總?cè)丝跒?35404萬人,其中城鎮(zhèn)人口為71182萬人”。71182萬乘以人均32.9平方米的住房面積,意味著全國城鎮(zhèn)到2012年底擁有的全部住房應該為2341887.8萬平方米(約234.2億平方米)。然而,根據(jù)原建設部公布的2002年底全國城鎮(zhèn)存量住宅面積,加上《中國統(tǒng)計年鑒》公布的2003-2012年全國城鎮(zhèn)住宅竣工的總面積,可得全國城鎮(zhèn)總的住宅總面積為155.49億平方米??芍?,用官方公布的統(tǒng)計數(shù)據(jù)計算,城鎮(zhèn)人均住房面積僅有21.8平方米,遠低于政府工作報告所稱的32.9平方米。根據(jù)國家統(tǒng)計局2012年度統(tǒng)計年報,到2012年底,“全國大何為“平均”?提問:一條河的平均深度是0.8米,一個小孩身高1.3米,他雖然不會游泳,但肯定不會在這條河里淹死。對嗎?為什么?何為“平均”?示例2:富有的鄰居:一個人聲稱社區(qū)居民的年平均收入為15萬元,同時另一個人則說社區(qū)年平均收入是3.5萬元。兩個人都對,為什么?鄰居年收入(萬元)老張100老李22.5老王8老趙6老錢4老孫3老楊2老吳2老周1.5老鄭1均值15萬中位數(shù)3.5萬眾數(shù)2萬示例2:鄰居年收入(萬元)老張100老李22.5老王8老趙6第講+警惕統(tǒng)計陷阱課件小結(jié):三者關(guān)系:平均數(shù)(Arithmeticmean)為一個平衡點,是一組數(shù)據(jù)的重心。它使數(shù)軸保持平衡,即支點兩側(cè)的力矩是相等的。中位數(shù)(Median)只使其兩側(cè)的數(shù)據(jù)個數(shù)相同。眾數(shù)(Mode)是指次數(shù)出現(xiàn)最多的,重量較大的那個數(shù)據(jù)。正態(tài)分布的鐘型曲線,三個數(shù)落在相同點上。例如人類身高、體型→訂制校服長尾曲線(偏態(tài)分布),三種數(shù)值相差甚遠。小結(jié):三者比較:比較的項目平均數(shù)中數(shù)眾數(shù)適用數(shù)據(jù)類型定距、定比定序、定距、定比定類、定序、定距、定比計算需要所有的數(shù)據(jù)只需中間數(shù)據(jù)計算迅速進一步運算特性可以不可以不可以受抽樣的影響較少較大較大受分組的影響不大較大最大受極端數(shù)據(jù)的影響最嚴重最少一般適用場合一般情況都用平均數(shù)①有極端數(shù)據(jù)時;
②當兩端數(shù)據(jù)或個別數(shù)據(jù)不清楚時;
③快速估計代表值時。①有極端數(shù)據(jù)時;
②數(shù)據(jù)不同質(zhì)找典型;
③快速估計代表值時;
④估計分布形態(tài)時。三者比較:比較的平均數(shù)中數(shù)眾數(shù)適用數(shù)據(jù)類型定距、定比定序、定示例3:“截至2011年8月,中國家庭資產(chǎn)平均為121.69萬元,城市家庭平均為247.60萬元,農(nóng)村家庭平均為37.70萬元?!薄袊彝ソ鹑谡{(diào)查與研究中心:《中國家庭金融調(diào)查報告》,2012年示例3:3.沒有披露的數(shù)據(jù)
Thelittlefiguresthatarenotthere示例1:經(jīng)科學驗證,高露潔360°牙膏能減少口腔細菌滋生,效果最高高出75%*,有效對抗八大口腔問題。*數(shù)據(jù)來自高露潔研究資料。與高露潔普通含氟牙膏相比?!呗稘嵐倬W(wǎng)3.沒有披露的數(shù)據(jù)
Thelittlefigu沒有披露的數(shù)據(jù):1.樣本容量:10個還是100個?2.實驗過程:測試對象選取、持續(xù)時間?沒有披露的數(shù)據(jù):來做一個小實驗:每人拿出一枚硬幣,連續(xù)拋10次,記錄正面(數(shù)字)朝上的次數(shù)。四種可能性:正面反面豎起來消失了來做一個小實驗:四種可能性:小結(jié):數(shù)量小的樣本存在偶然因素→不充分的樣本,必然導致偶然的、毫無指導意義的統(tǒng)計結(jié)論。任何由于機遇所產(chǎn)生的差異,在大樣本的使用中都是微不足道的(如2%的抑菌效果)。樣本究竟需要多大?取決于采用抽樣方式所研究的總體容量有多大、變動程度有多大。但有時樣本規(guī)模與看上去的并不一致(如小兒麻痹癥疫苗實驗,450名實驗組成員vs.680名對照組成員,所有人都沒患?。?。還有統(tǒng)計實驗的持續(xù)時間問題(如感冒藥盛行的邏輯)小結(jié):數(shù)據(jù)的顯著性檢驗:注意沒有披露的數(shù)據(jù)顯著性程度:10%、5%、1%另一種沒有披露的數(shù)據(jù):表明事物的變動范圍(全距)和給定平均數(shù)的偏離水平(標準差)“第六次全國人口普查顯示,我國平均每個家庭戶的人口為3.1人”→兩居室戶型重復建設,低估了更大或更小規(guī)模家庭的需求。昆明和北非撒哈拉沙漠地區(qū)的年平均氣溫都在15℃左右,但昆明的氣溫波動范圍是7~28℃,而沙漠的波動范圍是-9~40℃數(shù)據(jù)的顯著性檢驗:注意沒有披露的數(shù)據(jù)4.毫無意義的工作
Muchadoaboutpracticallynothing示例1:小紅和小明做了公認最好的智力測驗——斯坦福-比內(nèi)測驗(Stanford-Binetscale),結(jié)果是小紅的智商為101,小明的只有98。專家告訴我們智商的平均數(shù)是100,即100意味著“正?!薄S谑沁M一步推斷,小紅是比較聰明的孩子,小明是個笨孩子。任何類似的結(jié)論都是胡說!4.毫無意義的工作
Muchadoabout解讀:無論智力測驗的是什么,它與通常意義上的智商都不會是一回事。智力測試只是智力水平的一個抽樣,與其他抽樣一樣,智商值也具有統(tǒng)計誤差,誤差值將衡量該數(shù)值的準確度和可信度。假定測量的誤差是3%,這樣一個孩子的真正智商可能是98±3,也即95到101;而另一個孩子的真正智商可能是101±3,也即98到104,而且在此區(qū)間內(nèi)的分布是相同的。在這種情況下,其實還有不小的可能那個“智商低”的孩子的智商比那個“智商高”的孩子要高。解讀:第講+警惕統(tǒng)計陷阱課件小結(jié):對待智力測驗以及許多其他類似的抽樣結(jié)果都應該注意它的范圍。如平均智商不應該只是100這樣的一個數(shù)值,而應該是諸如90~110這樣的一個范圍。所有抽樣統(tǒng)計都存在誤差,忽略這些誤差將導致一些愚蠢的舉動。只有當差別有意義時,才能稱之為差別。小結(jié):示例2:10種香煙焦油含量比較圖示例2:5.令人驚奇的圖形
Thegee-whizgraph一張圖告訴你樸實的10%的增長,而另一張卻看起來是讓人振奮的100%的增長,別懷疑你的眼睛,截然不同的兩幅圖說的可是同一回事!5.令人驚奇的圖形
Thegee-whizgr第講+警惕統(tǒng)計陷阱課件第講+警惕統(tǒng)計陷阱課件小結(jié):最簡單的統(tǒng)計圖形是直線類圖形。在顯示趨勢時,直線圖形非常有用。數(shù)據(jù)是相同的,所以圖形也相同,除了圖形給人留下的印象不同之外,沒有進行任何的偽造。改變一下橫縱坐標的比例關(guān)系,就可改變圖形(沒有規(guī)定不可以這么做)。圖形比文字更有效,圖形更具有客觀性的幻覺。小結(jié):6.一維圖形的濫用
Theone-dimensionalpicture數(shù)字是2∶1,但視覺效果卻是8∶1。嘴上說的是1.5倍,看起來卻是3倍……或許你正在被這些圖形所振奮著。6.一維圖形的濫用
Theone-dimensi第講+警惕統(tǒng)計陷阱課件小結(jié):在比較兩種或兩種以上事物某個方面的具體數(shù)量時,柱狀圖是一種便捷常用的方法。柱狀圖也具有欺騙性!在描述單一物體時,柱體改變寬度的同時,長度也會發(fā)生變好;在描述三維物體時,物體的體積又不容易進行比較,因此不論何種情況,我們都應該對柱狀圖保留一些懷疑。使用錢袋的形象,雖然長寬高都是1:2,但給人的感覺是體積感,顯示數(shù)值的比例是遠遠大于1:2的。因此,在大多數(shù)時候,視覺效果起著決定性的作用。小結(jié):7.不完全匹配的資料
Thesemi-attachedfigure示例1:
火車和飛機哪個更安全?“2010年全國鐵路交通死亡人數(shù)1589人,航空運輸方面死亡42人。”——政府統(tǒng)計公報7.不完全匹配的資料
Thesemi-attac解讀:
統(tǒng)計基數(shù)不同:2010年全國鐵路共發(fā)送旅客16.76億人次,全國民航旅客運輸量則為2.68億人次。統(tǒng)計口徑不同:鐵路交通事故數(shù)據(jù)絕大多數(shù)都是路外事故和生產(chǎn)事故,而不是行車事故,即真正因行車事故死亡的車內(nèi)乘客只占一部分。而航空運輸只統(tǒng)計飛行事故,不包含地面事故和生產(chǎn)事故。直接比較各類交通工具的意外事故數(shù)量來判斷旅途安全情況是不正確的,應該通過詢問每100萬乘客里程的遇難人數(shù),并比較這些人數(shù)才能確定哪種出行方式的風險最大。解讀:小結(jié):當無法證明某件事時,通過證明別的事情,并假裝它們是一回事,因此產(chǎn)生混淆。不完全匹配的資料很容易糊弄人。許多不相匹配的數(shù)據(jù)不是故意欺騙,而是被報道故意歪曲(如:當兵更安全?)。通過照片對比也可以制造不匹配(如減肥效果對比)。小結(jié):第講+警惕統(tǒng)計陷阱課件8.相關(guān)關(guān)系的誤解
Posthocridesagain示例1:“目前吸煙大學生的學習成績差,與目前不吸煙大學生有顯著性差異。應重視吸煙行為對大學生健康的危害,積極開展健康教育以及對大學生吸煙的行為進行干預?!薄燮降龋骸洞髮W生吸煙狀況調(diào)查》,《中國實用醫(yī)藥》2007年第22期8.相關(guān)關(guān)系的誤解
Posthocrides解讀:樣本容量是否足夠大?抽樣過程是否科學合理?相關(guān)關(guān)系是否確實十分顯著?兩個事物之間的關(guān)聯(lián)關(guān)系并不能用于說明其中一個將引起另外一個的變化。謬誤:如果b緊跟著a出現(xiàn),那么a形成了b抽煙與低分同時出現(xiàn)→抽煙導致低分會不會是相反的作用關(guān)系?因為成績不理想促使學生變得愛抽煙,依
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國自行車擋泥板數(shù)據(jù)監(jiān)測研究報告
- 科技設備電力故障診斷的先進技術(shù)
- 二零二五年度室內(nèi)裝飾裝修工程施工與智能家居空氣凈化器合同
- 二零二五年度房屋租賃轉(zhuǎn)讓與裝修保證金合同
- 二零二五年度合同管理崗位職責與合同數(shù)據(jù)分析合同
- 社區(qū)供餐合同范本
- 2025至2030年中國線條彎角數(shù)據(jù)監(jiān)測研究報告
- 二零二五年度股東投資退出保障合同
- 二零二五年度個人健康管理與疾病預防顧問合同
- 二零二五年度城市公園運營代理合作協(xié)議
- 批評他人發(fā)言稿(通用12篇)
- DCF-現(xiàn)金流貼現(xiàn)模型-Excel模版(dcf-估值模型)
- 上海實驗學校幼升小測試題資料
- 一年級美術(shù)課后服務教案-1
- 重大疾病保險的疾病定義使用規(guī)范(2020年修訂版)-
- RB/T 040-2020病原微生物實驗室生物安全風險管理指南
- GB/T 8162-2018結(jié)構(gòu)用無縫鋼管
- 《傲慢與偏見》讀書匯報
- 上海專科層次自主招生考試習題集④(含答案)
- 房屋信息查詢情況表((2022年-2023年))
- (演唱)在葡萄架下教學設計
評論
0/150
提交評論