統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)_第1頁
統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)_第2頁
統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)_第3頁
統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)_第4頁
統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)_第5頁
已閱讀5頁,還剩52頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)分析

(方法與案例)

作者賈俊平統(tǒng)計學(xué)統(tǒng)

學(xué)

Statistics統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第1頁!12/12/2022統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第2頁!

統(tǒng)計思維總有一天會像讀與寫一樣成為一個有效率公民的必備能力。

——H.G.Wellsyyyy-M-統(tǒng)計名言統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第3頁!幾個例子米歇爾·蘭普爾(Michellelampl)是艾莫里大學(xué)的兒科專家和人類學(xué)家。她和朋友喝咖啡的時候,朋友談到她的孩子長得多么多么的快。實際上,這個初為人母的朋友幾乎是說她的兒子“像野草一樣瘋長”。蘭普爾博士十分的好奇(像所有的科學(xué)家對事物感到好奇一樣),她想她應(yīng)該實際測量這個孩子以及其他孩子在嬰兒期的生長速度。她著手測量一群孩子每天的生長,讓她非常吃驚的是她發(fā)現(xiàn)一些嬰兒差不多一個晚上就長一英寸!確實是爆發(fā)式生長。休-肯珀(SueKemper)是堪薩斯大學(xué)心理學(xué)教授,曾經(jīng)研究許多非常有趣的項目。她和其他的研究者正在研究修女群體,分析他們的早期經(jīng)驗、活動、人格特征和其他信息與他們中年以后的健康狀況之間的關(guān)系。最特別的是這個由不同科學(xué)家組成的小組(包括心理學(xué)家、語言學(xué)家和神經(jīng)學(xué)家,等等)想知道所有信息多大程度上可以預(yù)測老年癡呆病的發(fā)生。她發(fā)現(xiàn)修女在20多歲時寫作的復(fù)雜性和他們在50、60年或者70年后患上老年癡呆病的可能性有關(guān)。12/12/2022統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第4頁!統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第5頁!學(xué)習(xí)目標(biāo)統(tǒng)計學(xué)的含義統(tǒng)計學(xué)的研究內(nèi)容統(tǒng)計的應(yīng)用領(lǐng)域統(tǒng)計數(shù)據(jù)的類型獲得統(tǒng)計數(shù)據(jù)的途徑y(tǒng)yyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第6頁!1.1統(tǒng)計及其應(yīng)用領(lǐng)域

1.1.1統(tǒng)計學(xué)研究什么?

1.1.2統(tǒng)計的應(yīng)用第1章統(tǒng)計和統(tǒng)計數(shù)據(jù)統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第7頁!什么是統(tǒng)計學(xué)?

(statistics)1.收集數(shù)據(jù):取得數(shù)據(jù)2.處理數(shù)據(jù):圖表展示分析數(shù)據(jù):利用統(tǒng)計方法分析數(shù)據(jù)數(shù)據(jù)解釋:結(jié)果的說明得到結(jié)論:從數(shù)據(jù)分析中得出客觀結(jié)論yyyy-M-收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第8頁!描述統(tǒng)計(descriptivestatistics)研究數(shù)據(jù)收集、整理和描述的統(tǒng)計學(xué)方法內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律yyyy-M-02550Q1Q2Q3Q4¥x=30s2=105統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第9頁!統(tǒng)計學(xué)研究什么?物理學(xué)研究的是如熱、光、電、運(yùn)動規(guī)律那樣的自然現(xiàn)象化學(xué)家測定物質(zhì)的組成及化學(xué)元素之間的交互作用生物學(xué)家研究植物和動物的生活數(shù)學(xué)家則在給出的假定之下沉溺于他自己推演各種命題的游戲這些學(xué)科中的每一門都有它自己的問題,而且有解決這些問題的各自的方法,各學(xué)科為此而成為一門單獨的學(xué)科yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第10頁!統(tǒng)計學(xué)研究什么?統(tǒng)計學(xué)是一門科學(xué)統(tǒng)計學(xué)提供一套方法和技術(shù),這些方法和技術(shù)不能用于固定模式,使用者在給定的情況下必須根據(jù)所掌握的專門知識選擇使用的方法,而且,如果需要還要進(jìn)行必要的修正統(tǒng)計方法是通用的數(shù)據(jù)分析方法。這些方法不是為某個特定的問題領(lǐng)域而構(gòu)造的統(tǒng)計學(xué)是一種技術(shù)如同工業(yè)生產(chǎn)過程中的質(zhì)量控制程序一樣,統(tǒng)計方法是為保證產(chǎn)品達(dá)到所希望的質(zhì)量和保持其穩(wěn)定性的的管理系統(tǒng)中建立起來的統(tǒng)計方法也能用于控制、減少和考察不確定性統(tǒng)計學(xué)是一門藝術(shù)作為歸納推理的統(tǒng)計方法不是沒有爭議的。不同的人對同一組數(shù)據(jù)的分析可能得到不同的結(jié)論一本印度小說《紅色城堡》(TheRedFort)說:使用數(shù)字講故事取決于統(tǒng)計學(xué)家的技巧和他們的經(jīng)驗。在這個意義下,統(tǒng)計學(xué)也是一門藝術(shù)yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第11頁!統(tǒng)計方法體系統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第12頁!統(tǒng)計的應(yīng)用領(lǐng)域yyyy-M-【例1-1】用統(tǒng)計識別作者

1787—1788年,三位作者AlexanderHamilton,JohnJay和JamesMadison為了說服紐約人認(rèn)可憲法,匿名發(fā)表了著名的85篇論文。這些論文中的大多數(shù)作者已經(jīng)得到了識別,但是,其中的12篇論文的作者身份引起了爭議通過對不同單詞的頻數(shù)進(jìn)行統(tǒng)計分析,得出的結(jié)論是,JamesMadison最有可能是這12篇論文的作者?,F(xiàn)在,對于這些存在爭議的論文,認(rèn)為JamesMadison是原創(chuàng)作者的說法占主導(dǎo)地位,而且?guī)缀蹩梢钥隙ㄟ@種說法是正確統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第13頁!統(tǒng)計的應(yīng)用領(lǐng)域yyyy-M-【例1-3】挑戰(zhàn)者號航天飛機(jī)失事預(yù)測

1986年1月28日清晨,載有7名宇航員的挑戰(zhàn)者號進(jìn)入發(fā)射狀態(tài)。就在發(fā)射前,有冰片牢附在機(jī)殼上。幾分鐘后,正當(dāng)電視新聞報道它已進(jìn)入軌道時,航天飛機(jī)在毀滅性的爆炸聲中化成碎片,機(jī)上的宇航員片骨未存推動航天飛機(jī)進(jìn)入太空的兩個固體燃料發(fā)動機(jī)是由Thiokol公司制造的。失事前一天晚上,Thiokol公司的經(jīng)理們和國家航空航天局就如期發(fā)射還是推遲發(fā)射產(chǎn)生了爭執(zhí)。天氣預(yù)報發(fā)射時的氣溫為310F。爭執(zhí)的結(jié)果采納了Thiokol公司經(jīng)理們的建:按計劃發(fā)射航天飛機(jī)。因為他們覺得沒有確鑿證據(jù)表明低溫會對固體燃料火箭推進(jìn)器的性能產(chǎn)生影響統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第14頁!統(tǒng)計的誤用與濫用大約在一個世紀(jì)以前,政治家BenjaminDisraeli曾有一個著名的論斷:“有三類謊言:謊言、糟透的謊言和統(tǒng)計”

。他還說:“圖并沒有說謊,是說謊者在畫圖”歷史學(xué)家AndrewLang說,一些人使用統(tǒng)計“就像喝醉酒的人使用街燈柱—支撐的功能多于照明”統(tǒng)計濫用不好的樣本過小的樣本誤導(dǎo)性圖表局部描述故意曲解yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第15頁!1.2怎樣獲得統(tǒng)計數(shù)據(jù)

1.2.1變量與數(shù)據(jù)

1.2.2數(shù)據(jù)的來源第1章統(tǒng)計和統(tǒng)計數(shù)據(jù)統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第16頁!變量與數(shù)據(jù)變量(variable)從一次觀察到下一次觀察會出現(xiàn)不同結(jié)果的某種特征觀察一個企業(yè)的銷售額,這個月和上個月有所不同;觀察股票市場上漲股票的家數(shù),今天與昨天數(shù)量不一樣;觀察一個班學(xué)生的生活費(fèi)支出,一個人和另一個人不一樣;投擲一枚骰子觀察其出現(xiàn)的點數(shù),這次投擲的結(jié)果和下一次也不一樣“企業(yè)銷售額”、“上漲股票的家數(shù)”、“生活費(fèi)支出”、“投擲一枚骰子出現(xiàn)的點數(shù)”等就是變量數(shù)據(jù)(data)觀察到的變量的結(jié)果yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第17頁!1.2.2數(shù)據(jù)的來源1.2怎樣獲得統(tǒng)計數(shù)據(jù)統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第18頁!數(shù)據(jù)的來源——觀測研究(observationalstudy)觀察一些個體,并度量我們感興趣的變量,但并不試圖影響個體的回應(yīng)。抽樣調(diào)查(samplesurvey)普查(census)yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第19頁!以下是抽樣中的一些詞匯:1.總體(population):包含所研究的全部個體(數(shù)據(jù))的集合,我們求取信息的對象全體。2.樣本(sample):從總體中抽取的一部分元素的集合3.樣本量(samplesize):構(gòu)成樣本的元素的數(shù)目抽樣調(diào)查(samplesurvey)統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第20頁!簡單隨機(jī)抽樣

(simplerandomsampling)從總體N個單位(元素)中隨機(jī)地抽取n個單位作為樣本,使得總體中每一個元素都有相同的機(jī)會(概率)被抽中——帽子抽簽法抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣

可以使用隨機(jī)數(shù)表或電腦產(chǎn)生的隨機(jī)數(shù)字來實現(xiàn)特點簡單、直觀。用樣本統(tǒng)計量對目標(biāo)量進(jìn)行估計比較方便局限性抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其他輔助信息以提高估計的效率yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第21頁!簡單隨機(jī)樣本

(simplerandomsample)由簡單隨機(jī)抽樣形成的樣本從總體N個單位中隨機(jī)地抽取n個單位作為樣本,使得每一個容量為n樣本都有相同的機(jī)會(概率)被抽中參數(shù)估計和假設(shè)檢驗所依據(jù)的主要是簡單隨機(jī)樣本yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第22頁!系統(tǒng)抽樣

(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機(jī)抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第23頁!又稱“清點”。企圖把整個總體納入樣本的抽樣調(diào)查。中國法律規(guī)定每10年進(jìn)行一次人口普查。既費(fèi)錢又費(fèi)時。不是一般的個人或組織能承受。即使有政府的強(qiáng)大后盾,普查也不是一定做得到的。但一個糟糕的普查往往比不上一個設(shè)計和實施都比較好的抽樣調(diào)查。普查(census)統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第24頁!12/12/2022統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第25頁!【案例1】:對領(lǐng)取低保的人的觀測研究顯示,大部分人是有能力增加收入、脫離領(lǐng)低保的行列的。因為有些人會自愿參加工作技能培訓(xùn)(如家政服務(wù))。那么是不是應(yīng)該要求所有體格健全的低保領(lǐng)取者都參加工作技能培訓(xùn)和找工作的項目呢?觀測研究沒法告訴我們這項政策的效果。就算我們所研究的領(lǐng)取低保的人是從所有領(lǐng)低保的人當(dāng)中選取的樣本,但這些會參加培訓(xùn)項目及找工作的人,和不會的人之間可能原本就有許多差別。例如,找工作的這些人受的教育相對多些,但也可能這些人有不同的價值觀及動機(jī),而這些特征是沒法觀測到的。

所以,想要知道要求領(lǐng)低保的人參加工作技能培訓(xùn)是否能幫助他們自立,就必須做實驗。在這些人開始申請低保時,從中選兩組相似的人,要求其中一組參加培訓(xùn),另一種不培訓(xùn)。幾年后,比較兩組人的收入及工作記錄,就可以看出要求參加培訓(xùn)是否有預(yù)期的成效。觀測研究VS實驗統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第26頁!用計算機(jī)生成隨機(jī)數(shù)和

簡單隨機(jī)樣本軟件應(yīng)用統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第27頁!用Excel0~1之間均勻分布的隨機(jī)數(shù)生成位于0~1之間的均勻分布隨機(jī)數(shù)

(RAND函數(shù))第1步:在Excel表格界面中,直接點擊【fx】命令第2步:在“函數(shù)分類”中點擊【全部】選項,并在“函數(shù)名”中點擊【RAND】選項,然后【確定】,單擊【確定】即可得到一個隨機(jī)數(shù)(要得到多個隨機(jī)數(shù)向下復(fù)制即可)若要生成a與b之間的隨機(jī)實數(shù),請使用

RAND()*(b-a)+a若要對結(jié)果四舍五入為整數(shù),請使用ROUND(RAND()*(b-a)+a,0)如果要使用函數(shù)RAND生成一隨機(jī)數(shù),并且使之不隨單元格計算而改變,可以在編輯欄中輸入“=RAND()”,保持編輯狀態(tài),然后按F9,將公式永久性地改為隨機(jī)數(shù)yyyy-M-

生成均勻分布的隨機(jī)數(shù)Excel統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第28頁!用Excel抽取簡單隨機(jī)樣本第1步:將30個學(xué)生的名單錄入到Excel工作表中的一列第2步:給每個學(xué)生一個數(shù)字代碼,分別為1,2…,30,并按順序排列,將代碼錄入到Excel工作表中的一列,與學(xué)生名單相對應(yīng)(數(shù)值型數(shù)據(jù)直接抽取)第3步:選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】選項,然后在【數(shù)據(jù)分析】選項中選擇【抽樣】第4步:在【抽樣】對話框中的【輸入?yún)^(qū)域】中輸入學(xué)生代碼區(qū)域,在【抽樣方法】中單擊【隨機(jī)】

。在【樣本數(shù)】中輸入需要抽樣的學(xué)生個數(shù)。在【輸出區(qū)域】中選擇抽樣結(jié)果放置的區(qū)域?!敬_定】后即得到要抽取的樣本yyyy-M-抽取簡單隨機(jī)樣本Excel統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第29頁!本章小節(jié)統(tǒng)計學(xué)的含義統(tǒng)計學(xué)的研究內(nèi)容統(tǒng)計的應(yīng)用領(lǐng)域統(tǒng)計數(shù)據(jù)的類型獲得統(tǒng)計數(shù)據(jù)的途徑y(tǒng)yyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第30頁!幾個例子阿萊莎·休斯頓(AlethaHuston)是德州大學(xué)奧斯汀分校的研究者和教師,投入大量的研究來發(fā)現(xiàn)看電視對幼兒心理發(fā)展的作用。其中之一的工作是她和她后來的丈夫約翰·賴特(John.c.wright)調(diào)查入學(xué)前觀看一定量的電視教育節(jié)目對入學(xué)后學(xué)習(xí)的影響。他們發(fā)現(xiàn)了確實的證據(jù)可證明觀看教育節(jié)目如《羅杰斯先生》或《芝麻街》的兒童比沒有看的兒童在學(xué)校表現(xiàn)得更好。所有的研究者都有一個特別的問題,他們對這個問題有興趣并用他們的直覺、好奇心和學(xué)術(shù)訓(xùn)練來回答這個問題。作為調(diào)查的一部分,他們使用我們稱作統(tǒng)計學(xué)的工具分析所收集到的所有資料的意義。如果沒有這些工具,所有的資料就是不相關(guān)的資料的匯集。那么這些資料就不能在蘭普爾的研究中用于得出兒童生長的結(jié)論,不能在肯珀的研究中用于對老年癡呆病有更好的理解,也不能在休斯頓和賴特的研究中用于更好地理解看電視對幼兒學(xué)習(xí)和社會發(fā)展的影響。12/12/2022統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第31頁!1.1統(tǒng)計及其應(yīng)用領(lǐng)域1.2怎樣獲得統(tǒng)計數(shù)據(jù)?第1章統(tǒng)計和統(tǒng)計數(shù)據(jù)Statistics統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第32頁!你相信這樣的一些統(tǒng)計結(jié)論嗎?吸煙對健康是有害的,吸香煙的男性減少壽命2250天不結(jié)婚的男性會減少壽命3500天,不結(jié)婚的女性會減少壽命1600天身體超重30%會使壽命減少1300天每天攝取500毫升維生素C,生命可延長6年身材高的父親,其子女的身高也較高二個出生的子女沒有個聰明,第三個出生的子女沒有第二個聰明,依此類推學(xué)生們在聽了莫扎特鋼琴曲10分鐘后的推理測試會比他們聽10分鐘娛樂磁帶或其他曲目做得更好上課坐在前面的學(xué)生平均考試分?jǐn)?shù)比坐在后面的學(xué)生高漂亮的女性有損男性的智力。男性在看到漂亮女性時智力會下降,這就是為什么大學(xué)里的女孩子比男孩子學(xué)習(xí)好的原因yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第33頁!1.1.1統(tǒng)計學(xué)研究什么?1.1統(tǒng)計及其應(yīng)用領(lǐng)域統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第34頁!統(tǒng)計方法yyyy-M-統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計參數(shù)估計假設(shè)檢驗統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第35頁!推斷統(tǒng)計(inferentialstatistics)通常是描述統(tǒng)計的下一步。研究如何利用樣本(sample)數(shù)據(jù)(較小群體)來推斷總體(population)特征(較大群體)的統(tǒng)計學(xué)方法內(nèi)容參數(shù)估計假設(shè)檢驗?zāi)康模簩傮w特征作出推斷試舉例yyyy-M-樣本總體統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第36頁!統(tǒng)計學(xué)研究什么?統(tǒng)計學(xué)沒有任何固定的對象,是一門獨特的學(xué)問統(tǒng)計學(xué)研究的是來自各領(lǐng)域的數(shù)據(jù),由解決其他領(lǐng)域內(nèi)的問題而存在并興旺發(fā)達(dá)。按薩維奇(L.J.Savage)的說法:統(tǒng)計學(xué)基本上是寄生的??垦芯科渌I(lǐng)域內(nèi)的工作而生存。這不是對統(tǒng)計學(xué)的輕視,這是因為對很多寄主來說,如果沒有寄生蟲就會死。對有的動物來說,如果沒有寄生蟲就不能消化它們的食物。因此,人類奮斗的很多領(lǐng)域,如果沒有統(tǒng)計學(xué),雖然不會死亡,但一定會變得很弱yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第37頁!統(tǒng)計是一種思維方式統(tǒng)計思維總有一天會像讀與寫一樣成為一個有效率公民的必備能力(H.G.Wells)在終極的分析中,一切知識都是歷史;在抽象的意義下,一切科學(xué)都是數(shù)學(xué);在理性的基礎(chǔ)上,所有的判斷都是統(tǒng)計學(xué)(C.R.Rao)yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第38頁!1.1.2統(tǒng)計的應(yīng)用1.1統(tǒng)計及其應(yīng)用領(lǐng)域統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第39頁!統(tǒng)計的應(yīng)用領(lǐng)域yyyy-M-【例1-2】用簡單的描述統(tǒng)計量得到一個重要發(fā)現(xiàn)

費(fèi)舍(R.A.Fisher)在1952的一篇文章中舉了一個例子,說明如何由基本的描述統(tǒng)計量的知識引出一個重要的發(fā)現(xiàn)。20世紀(jì)早期,哥本哈根卡爾堡實驗室的施密特(J.Schmidt)發(fā)現(xiàn)不同地區(qū)所捕獲的同種魚類的脊椎骨和鰓線的數(shù)量有很大不同;甚至在同一海灣內(nèi)不同地點所捕獲的同種魚類,也發(fā)現(xiàn)這樣的傾向然而,鰻魚的脊椎骨的數(shù)量變化不大。施密特從歐洲各地、冰島、亞速爾群島以及尼羅河等幾乎分離的海域里所捕獲的鰻魚的樣本中,計算發(fā)現(xiàn)了幾乎一樣的均值和標(biāo)準(zhǔn)偏差值。由此,施密特推斷所有各個不同海域內(nèi)的鰻魚是由海洋中某公共場所繁殖的。后來名為“戴納(Dana)”的科學(xué)考察船在一次遠(yuǎn)征中發(fā)現(xiàn)了這個場所統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第40頁!統(tǒng)計的應(yīng)用領(lǐng)域yyyy-M-【例1-3】挑戰(zhàn)者號航天飛機(jī)失事預(yù)測

在此次失事前,該航天飛機(jī)24次發(fā)射成功。將航天飛機(jī)送入太空的兩個固體燃料推進(jìn)器由6只O型項圈密封。在幾次飛行中,曾發(fā)生過O型項圈被腐蝕或氣體泄漏事故。這樣的事故是及其危險的。前24次發(fā)射中有一次發(fā)動機(jī)遭到了永久性破壞。根據(jù)23次飛行中發(fā)生腐蝕或泄漏事故的次數(shù)(因變量)及火箭連接處的溫度(自變量)數(shù)據(jù),進(jìn)行線性回歸得到的回歸方程為當(dāng)溫度為310F時,O型項圈發(fā)生事故的預(yù)計次數(shù)為2.225次。結(jié)果顯示連接處的溫度與O型項圈事故之間有一定的相關(guān)性。如果當(dāng)時那些經(jīng)理們看到了回歸的預(yù)測結(jié)果,也許推遲發(fā)射會成為其謹(jǐn)慎的選擇統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第41頁!統(tǒng)計的誤用與濫用統(tǒng)計應(yīng)用上的兩個極端不用或幾乎不用統(tǒng)計簡單問題復(fù)雜化在統(tǒng)計應(yīng)用中,這兩個極端都是不可取的簡單的方法不一定沒用,復(fù)雜的方法也不一定有用。正如有的學(xué)者所說的,最簡單的模型往往是最有用的統(tǒng)計應(yīng)該恰當(dāng)?shù)貞?yīng)用到它能起作用的地方。不能把統(tǒng)計神秘化,更不能歪曲統(tǒng)計,把統(tǒng)計作為掩蓋實事的陷阱yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第42頁!1.2.1變量與數(shù)據(jù)1.2怎樣獲得統(tǒng)計數(shù)據(jù)統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第43頁!變量與數(shù)據(jù)定量變量(quantitativevariable)或數(shù)值變量(metricvariable)可以用阿拉伯?dāng)?shù)據(jù)來記錄其觀察結(jié)果如“企業(yè)銷售額”、“上漲股票的家數(shù)”、“生活費(fèi)支出”、“投擲一枚骰子出現(xiàn)的點數(shù)”定量變量的觀察結(jié)果稱為定量數(shù)據(jù)或數(shù)值型數(shù)據(jù)(metricdata)分類變量(categoricalvariable)表現(xiàn)為不同的類別如“性別”、“企業(yè)所屬的行業(yè)”、“學(xué)生所在的學(xué)院”等分類變量的觀察結(jié)果就是分類數(shù)據(jù)(categoricaldata)順序變量(rankvariable)或有序分類變量具有一定順序的類別變量如考試成績按等級,一個人對事物的態(tài)度順序變量的觀察結(jié)果就是順序數(shù)據(jù)或有序分類數(shù)據(jù)(rankdata)分類變量和順序變量統(tǒng)稱為定性變量(qualitativevariable)yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第44頁!數(shù)據(jù)的來源尋找二手?jǐn)?shù)據(jù)(間接來源)統(tǒng)計部門和政府部門公布的有關(guān)資料,如各類統(tǒng)計年鑒各類經(jīng)濟(jì)信息中心、信息咨詢機(jī)構(gòu)、專業(yè)調(diào)查機(jī)構(gòu)等提供的數(shù)據(jù)各類專業(yè)期刊、報紙、書籍所提供的資料各種會議,如博覽會、展銷會、交易會及專業(yè)性、學(xué)術(shù)性研討會上交流的有關(guān)資料從互聯(lián)網(wǎng)或圖書館查閱到的相關(guān)資料yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第45頁!有句諺語說:“你不必吃完整頭牛,才知道肉是老的。”這就是抽樣的精髓:從檢查一部分來得知全體。抽樣調(diào)查是一種很重要的觀測研究,選中這些人是因為他們具有代表性(representativeness)局限性:timeandcost抽樣調(diào)查(samplesurvey)統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第46頁!概率抽樣(probabilitysampling)根據(jù)一個已知的概率來抽取樣本單位,也稱隨機(jī)抽樣特點按一定的概率以隨機(jī)原則抽取樣本抽取樣本時使每個單位都有一定的機(jī)會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當(dāng)用樣本對總體目標(biāo)量進(jìn)行估計時,要考慮到每個樣本單位被抽中的概率yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第47頁!12/12/2022統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第48頁!分層抽樣

(stratifiedsampling)將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機(jī)地抽取樣本優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進(jìn)行估計,也可以對各層的目標(biāo)量進(jìn)行估計yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第49頁!整群抽樣

(clustersampling)將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實施缺點是估計的精度較差yyyy-M-統(tǒng)計和統(tǒng)計數(shù)據(jù)(2011年)共57頁,您現(xiàn)在瀏覽的是第50頁!取樣本的目的是要了解總體的真實情況,而且在搜集信息時要盡量不產(chǎn)生干擾。所以觀測研究都遵循同一原則“觀測,但不干擾”。如果研究黑猩猩行為的人在它們的居住地設(shè)立食物補(bǔ)給站。讓黑猩猩可以吃到香蕉,這樣有可能會改變猩猩的行為,這就不是觀測研究,而是實驗了。所以實驗的特點是:實驗者(調(diào)查者)存心要改變被實驗者的行為。在做實驗時,我們不只是觀察個體或問他們問題,而是刻意加上某些處理(treatment),以期能觀察其反應(yīng)。實驗(exper

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論