第1章-統(tǒng)計(jì)和數(shù)據(jù)_第1頁(yè)
第1章-統(tǒng)計(jì)和數(shù)據(jù)_第2頁(yè)
第1章-統(tǒng)計(jì)和數(shù)據(jù)_第3頁(yè)
第1章-統(tǒng)計(jì)和數(shù)據(jù)_第4頁(yè)
第1章-統(tǒng)計(jì)和數(shù)據(jù)_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)分析

(方法與案例)

作者賈俊平統(tǒng)計(jì)學(xué)基礎(chǔ)

FundamentalStatistics第1章統(tǒng)計(jì)和數(shù)據(jù)1.1

統(tǒng)計(jì)及其應(yīng)用領(lǐng)域1.2統(tǒng)計(jì)數(shù)據(jù)及其類(lèi)型1.3統(tǒng)計(jì)中的幾個(gè)基本概念

2011年學(xué)習(xí)目標(biāo)統(tǒng)計(jì)學(xué)的含義統(tǒng)計(jì)的應(yīng)用領(lǐng)域統(tǒng)計(jì)數(shù)據(jù)的類(lèi)型統(tǒng)計(jì)中的幾個(gè)基本概念1.1統(tǒng)計(jì)及其應(yīng)用領(lǐng)域

一、什么是統(tǒng)計(jì)學(xué)二、統(tǒng)計(jì)的應(yīng)用領(lǐng)域三、統(tǒng)計(jì)的誤用與濫用第1章統(tǒng)計(jì)和數(shù)據(jù)一、什么是統(tǒng)計(jì)學(xué)1.1統(tǒng)計(jì)及其應(yīng)用領(lǐng)域2011年什么是統(tǒng)計(jì)學(xué)?

(statistics)1.收集數(shù)據(jù):取得數(shù)據(jù)2.處理數(shù)據(jù):圖表展示分析數(shù)據(jù):利用統(tǒng)計(jì)方法分析數(shù)據(jù)數(shù)據(jù)解釋?zhuān)航Y(jié)果的說(shuō)明得到結(jié)論:從數(shù)據(jù)分析中得出客觀(guān)結(jié)論

收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)

2011年統(tǒng)計(jì)方法統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)2011年描述統(tǒng)計(jì)

(descriptivestatistics)研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)方法內(nèi)容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)描述性分析目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=1052011年推斷統(tǒng)計(jì)

(inferentialstatistics)研究如何利用樣本數(shù)據(jù)來(lái)推斷總體特征的統(tǒng)計(jì)學(xué)方法內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)?zāi)康膶?duì)總體特征作出推斷樣本總體二、統(tǒng)計(jì)的應(yīng)用領(lǐng)域1.1統(tǒng)計(jì)及其應(yīng)用領(lǐng)域2011年統(tǒng)計(jì)的應(yīng)用領(lǐng)域【例1.1】用統(tǒng)計(jì)識(shí)別作者

1787—1788年,三位作者AlexanderHamilton,JohnJay和JamesMadison為了說(shuō)服紐約人認(rèn)可憲法,匿名發(fā)表了著名的85篇論文。這些論文中的大多數(shù)作者已經(jīng)得到了識(shí)別,但是,其中的12篇論文的作者身份引起了爭(zhēng)議通過(guò)對(duì)不同單詞的頻數(shù)進(jìn)行統(tǒng)計(jì)分析,得出的結(jié)論是,JamesMadison最有可能是這12篇論文的作者?,F(xiàn)在,對(duì)于這些存在爭(zhēng)議的論文,認(rèn)為JamesMadison是原創(chuàng)作者的說(shuō)法占主導(dǎo)地位,而且?guī)缀蹩梢钥隙ㄟ@種說(shuō)法是正確2011年統(tǒng)計(jì)的應(yīng)用領(lǐng)域【例1.2】用簡(jiǎn)單的描述統(tǒng)計(jì)量得到一個(gè)重要發(fā)現(xiàn)

費(fèi)舍(R.A.Fisher)在1952的一篇文章中舉了一個(gè)例子,說(shuō)明如何由基本的描述統(tǒng)計(jì)量的知識(shí)引出一個(gè)重要的發(fā)現(xiàn)。20世紀(jì)早期,哥本哈根卡爾堡實(shí)驗(yàn)室的施密特(J.Schmidt)發(fā)現(xiàn)不同地區(qū)所捕獲的同種魚(yú)類(lèi)的脊椎骨和鰓線(xiàn)的數(shù)量有很大不同;甚至在同一海灣內(nèi)不同地點(diǎn)所捕獲的同種魚(yú)類(lèi),也發(fā)現(xiàn)這樣的傾向然而,鰻魚(yú)的脊椎骨的數(shù)量變化不大。施密特從歐洲各地、冰島、亞速爾群島以及尼羅河等幾乎分離的海域里所捕獲的鰻魚(yú)的樣本中,計(jì)算發(fā)現(xiàn)了幾乎一樣的均值和標(biāo)準(zhǔn)偏差值。由此,施密特推斷所有各個(gè)不同海域內(nèi)的鰻魚(yú)是由海洋中某公共場(chǎng)所繁殖的。后來(lái)名為“戴納(Dana)”的科學(xué)考察船在一次遠(yuǎn)征中發(fā)現(xiàn)了這個(gè)場(chǎng)所2011年統(tǒng)計(jì)的應(yīng)用領(lǐng)域【例1.3】挑戰(zhàn)者號(hào)航天飛機(jī)失事預(yù)測(cè)在此次失事前,該航天飛機(jī)24次發(fā)射成功。將航天飛機(jī)送入太空的兩個(gè)固體燃料推進(jìn)器由6只O型項(xiàng)圈密封。在幾次飛行中,曾發(fā)生過(guò)O型項(xiàng)圈被腐蝕或氣體泄漏事故。這樣的事故是及其危險(xiǎn)的。前24次發(fā)射中有一次發(fā)動(dòng)機(jī)遭到了永久性破壞。根據(jù)23次飛行中發(fā)生腐蝕或泄漏事故的次數(shù)(因變量)及火箭連接處的溫度(自變量)數(shù)據(jù),進(jìn)行線(xiàn)性回歸得到的回歸方程為當(dāng)溫度為310F時(shí),O型項(xiàng)圈發(fā)生事故的預(yù)計(jì)次數(shù)為2.225次。結(jié)果顯示連接處的溫度與O型項(xiàng)圈事故之間有一定的相關(guān)性。如果當(dāng)時(shí)那些經(jīng)理們看到了回歸的預(yù)測(cè)結(jié)果,也許推遲發(fā)射會(huì)成為其謹(jǐn)慎的選擇2011年統(tǒng)計(jì)的應(yīng)用領(lǐng)域【例1.3】挑戰(zhàn)者號(hào)航天飛機(jī)失事預(yù)測(cè)

1986年1月28日清晨,載有7名宇航員的挑戰(zhàn)者號(hào)進(jìn)入發(fā)射狀態(tài)。就在發(fā)射前,有冰片牢附在機(jī)殼上。幾分鐘后,正當(dāng)電視新聞報(bào)道它已進(jìn)入軌道時(shí),航天飛機(jī)在毀滅性的爆炸聲中化成碎片,機(jī)上的宇航員片骨未存推動(dòng)航天飛機(jī)進(jìn)入太空的兩個(gè)固體燃料發(fā)動(dòng)機(jī)是由Thiokol公司制造的。失事前一天晚上,Thiokol公司的經(jīng)理們和國(guó)家航空航天局就如期發(fā)射還是推遲發(fā)射產(chǎn)生了爭(zhēng)執(zhí)。天氣預(yù)報(bào)發(fā)射時(shí)的氣溫為310F。爭(zhēng)執(zhí)的結(jié)果采納了Thiokol公司經(jīng)理們的建:按計(jì)劃發(fā)射航天飛機(jī)。因?yàn)樗麄冇X(jué)得沒(méi)有確鑿證據(jù)表明低溫會(huì)對(duì)固體燃料火箭推進(jìn)器的性能產(chǎn)生影響三、統(tǒng)計(jì)的誤用與濫用1.1統(tǒng)計(jì)及其應(yīng)用領(lǐng)域2011年統(tǒng)計(jì)的誤用與濫用產(chǎn)生誤用和濫用的情形不好的樣本過(guò)小的樣本誤導(dǎo)性圖表局部描述故意曲解1.2統(tǒng)計(jì)數(shù)據(jù)及其類(lèi)型

一、分類(lèi)數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)二、觀(guān)測(cè)的數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)三、截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)第1章統(tǒng)計(jì)和數(shù)據(jù)2011年統(tǒng)計(jì)數(shù)據(jù)的分類(lèi)統(tǒng)計(jì)數(shù)據(jù)的分類(lèi)按計(jì)量層次分類(lèi)的數(shù)據(jù)順序的數(shù)據(jù)數(shù)值型數(shù)據(jù)按時(shí)間狀況截面的數(shù)據(jù)時(shí)序的數(shù)據(jù)按收集方法觀(guān)察的數(shù)據(jù)試驗(yàn)的數(shù)據(jù)2011年統(tǒng)計(jì)數(shù)據(jù)的分類(lèi)

(按計(jì)量尺度分)分類(lèi)數(shù)據(jù)(categoricaldata)

只能歸于某一類(lèi)別的非數(shù)字型數(shù)據(jù)對(duì)事物進(jìn)行分類(lèi)的結(jié)果,數(shù)據(jù)表現(xiàn)為類(lèi)別,用文字來(lái)表述例如,人口按性別分為男、女兩類(lèi)順序數(shù)據(jù)(rankdata)

只能歸于某一有序類(lèi)別的非數(shù)字型數(shù)據(jù)對(duì)事物類(lèi)別順序的測(cè)度,數(shù)據(jù)表現(xiàn)為類(lèi)別,用文字來(lái)表述例如,產(chǎn)品分為一等品、二等品、三等品、次品等數(shù)值型數(shù)據(jù)(metricdata)

按數(shù)字尺度測(cè)量的觀(guān)察值結(jié)果表現(xiàn)為具體的數(shù)值,對(duì)事物的精確測(cè)度例如:身高為175cm、168cm、183cm2011年統(tǒng)計(jì)數(shù)據(jù)的分類(lèi)

(按收集方法分)觀(guān)測(cè)數(shù)據(jù)(observationaldata)

通過(guò)調(diào)查或觀(guān)測(cè)而收集到的數(shù)據(jù)在沒(méi)有對(duì)事物人為控制的條件下而得到的有關(guān)社會(huì)經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)數(shù)據(jù)幾乎都是觀(guān)測(cè)數(shù)據(jù)試驗(yàn)數(shù)據(jù)(experimentaldata)

在試驗(yàn)中控制試驗(yàn)對(duì)象而收集到的數(shù)據(jù)比如,對(duì)一種新藥療效的試驗(yàn),對(duì)一種新的農(nóng)作物品種的試驗(yàn)等自然科學(xué)領(lǐng)域的數(shù)據(jù)大多數(shù)都為試驗(yàn)數(shù)據(jù)2011年統(tǒng)計(jì)數(shù)據(jù)的分類(lèi)

(按時(shí)間狀況分)截面數(shù)據(jù)(cross-sectionaldata)

在相同或近似相同的時(shí)間點(diǎn)上收集的數(shù)據(jù)描述現(xiàn)象在某一時(shí)刻的變化情況比如,2005年我國(guó)各地區(qū)的國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù)時(shí)間序列數(shù)據(jù)(timeseriesdata)

在不同時(shí)間上收集到的數(shù)據(jù)描述現(xiàn)象隨時(shí)間變化的情況比如,2000年至2005年國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù)1.3統(tǒng)計(jì)中的幾個(gè)基本概念

一、總體和樣本二、參數(shù)和統(tǒng)計(jì)量三、變量第1章統(tǒng)計(jì)和數(shù)據(jù)2011年總體和樣本總體(population)所研究的全部個(gè)體(數(shù)據(jù))的集合,其中的每一個(gè)個(gè)體也稱(chēng)為元素分為有限總體和無(wú)限總體有限總體的范圍能夠明確確定,且元素的數(shù)目是有限的無(wú)限總體所包括的元素是無(wú)限的,不可數(shù)的樣本(sample)從總體中抽取的一部分元素的集合構(gòu)成樣本的元素的數(shù)目稱(chēng)為樣本容量或樣本量(samplesize)

2011年參數(shù)和統(tǒng)計(jì)量參數(shù)(parameter)描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值所關(guān)心的參數(shù)主要有總體均值(

)、標(biāo)準(zhǔn)差(

)、總體比例(

)等總體參數(shù)通常用希臘字母表示統(tǒng)計(jì)量(statistic)用來(lái)描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的一些量,是樣本的函數(shù)所關(guān)心的樣本統(tǒng)計(jì)量有樣本均值(

x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等樣本統(tǒng)計(jì)量通常用小寫(xiě)英文字母來(lái)表示2011年統(tǒng)計(jì)中的幾個(gè)基本概念平均數(shù)標(biāo)準(zhǔn)差比例參數(shù)

統(tǒng)計(jì)量

xsp

總體

樣本2011年變量

(variable)

說(shuō)明現(xiàn)象某種特征的概念如商品銷(xiāo)售額、受教育程度、產(chǎn)品的質(zhì)量等級(jí)等變量的具體表現(xiàn)稱(chēng)為變量值,即數(shù)據(jù)變量可以分為分類(lèi)變量(categoricalvariable)

:說(shuō)明事物類(lèi)別的名稱(chēng)順序變量(rankvariable):說(shuō)明事物有序類(lèi)別的名稱(chēng)數(shù)值型變量(metricvariable)

:說(shuō)明事物數(shù)字特征的名

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論