《統(tǒng)計學-基于SPSS》(01)第1章-數(shù)據(jù)與統(tǒng)計學(S3)_第1頁
《統(tǒng)計學-基于SPSS》(01)第1章-數(shù)據(jù)與統(tǒng)計學(S3)_第2頁
《統(tǒng)計學-基于SPSS》(01)第1章-數(shù)據(jù)與統(tǒng)計學(S3)_第3頁
《統(tǒng)計學-基于SPSS》(01)第1章-數(shù)據(jù)與統(tǒng)計學(S3)_第4頁
《統(tǒng)計學-基于SPSS》(01)第1章-數(shù)據(jù)與統(tǒng)計學(S3)_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學—基于SPSS課程內(nèi)容描述統(tǒng)計、推斷統(tǒng)計、其他常用方法使用軟件SPSS學分與課時3學分,1~17周,每周3課時第1章數(shù)據(jù)與統(tǒng)計學1.1

統(tǒng)計學及其應(yīng)用1.2數(shù)據(jù)及其來源1.3統(tǒng)計學與統(tǒng)計軟件Statistics2019-5-5學習目標統(tǒng)計學的含義統(tǒng)計學的研究內(nèi)容統(tǒng)計的應(yīng)用領(lǐng)域統(tǒng)計數(shù)據(jù)的類型獲得統(tǒng)計數(shù)據(jù)的途徑常用統(tǒng)計軟件2019-5-5問題與思考

怎樣理解統(tǒng)計結(jié)論吸煙對健康是有害的,吸香煙的男性減少壽命2250天不結(jié)婚的男性會減少壽命3500天,不結(jié)婚的女性會減少壽命1600天身體超重30%會使壽命減少1300天每天攝取500毫升維生素C,生命可延長6年身材高的父親,其子女的身材也較高一項研究表明:杰出科學家做出重大貢獻的最佳年齡區(qū)在25~45歲之間,其最佳峰值年齡和首次貢獻的最佳成名年齡隨著時代的變化而逐漸增大上課坐在前面的學生平均考試分數(shù)比坐在后面的學生高中國科學院空間環(huán)境研究預報中心的專家稱,在神舟七號載人航天飛行期間,飛船遭遇空間碎片的概率在百萬分之一以下1.1統(tǒng)計學及其應(yīng)用

1.1.1什么是統(tǒng)計學

1.1.2統(tǒng)計學的應(yīng)用第1章數(shù)據(jù)與統(tǒng)計學1.1.1什么是統(tǒng)計學1.1統(tǒng)計學其應(yīng)用2019-5-5什么是統(tǒng)計學

(statistics)1.收集數(shù)據(jù):取得數(shù)據(jù)2.處理數(shù)據(jù):圖表展示分析數(shù)據(jù):利用統(tǒng)計方法分析數(shù)據(jù)數(shù)據(jù)解釋:結(jié)果的說明得到結(jié)論:從數(shù)據(jù)分析中得出客觀結(jié)論

收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學

2019-5-5描述性方法研究數(shù)據(jù)收集、整理和描述的統(tǒng)計學方法內(nèi)容數(shù)據(jù)收集、處理、展示、描述性分析目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律·推斷性方法研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學方法內(nèi)容參數(shù)估計假設(shè)檢驗?zāi)康膶傮w特征作出推斷描述統(tǒng)計與推斷統(tǒng)計

(descriptivestatistics&inferentialstatistics)2019-5-5統(tǒng)計學研究數(shù)據(jù)統(tǒng)計學沒有任何固定的對象,是一門獨特的學問統(tǒng)計學研究的是來自各領(lǐng)域的數(shù)據(jù),由解決其他領(lǐng)域內(nèi)的問題而存在并興旺發(fā)達。按薩維奇(L.J.Savage)的說法:統(tǒng)計學基本上是寄生的??垦芯科渌I(lǐng)域內(nèi)的工作而生存。這不是對統(tǒng)計學的輕視,這是因為對很多寄主來說,如果沒有寄生蟲就會死。對有的動物來說,如果沒有寄生蟲就不能消化它們的食物。因此,人類奮斗的很多領(lǐng)域,如果沒有統(tǒng)計學,雖然不會死亡,但一定會變得很弱1.1.2統(tǒng)計學的應(yīng)用1.1統(tǒng)計學及其應(yīng)用2019-5-5統(tǒng)計學的應(yīng)用領(lǐng)域【例1-1】用統(tǒng)計識別作者

1787—1788年,三位作者AlexanderHamilton,JohnJay和JamesMadison為了說服紐約人認可憲法,匿名發(fā)表了著名的85篇論文。這些論文中的大多數(shù)作者已經(jīng)得到了識別,但是,其中的12篇論文的作者身份引起了爭議通過對不同單詞的頻數(shù)進行統(tǒng)計分析,得出的結(jié)論是,JamesMadison最有可能是這12篇論文的作者?,F(xiàn)在,對于這些存在爭議的論文,認為JamesMadison是原創(chuàng)作者的說法占主導地位,而且?guī)缀蹩梢钥隙ㄟ@種說法是正確2019-5-5統(tǒng)計學的應(yīng)用領(lǐng)域【例1-2】用簡單的描述統(tǒng)計量得到一個重要發(fā)現(xiàn)

費舍(R.A.Fisher)在1952的一篇文章中舉了一個例子,說明如何由基本的描述統(tǒng)計量的知識引出一個重要的發(fā)現(xiàn)。20世紀早期,哥本哈根卡爾堡實驗室的施密特(J.Schmidt)發(fā)現(xiàn)不同地區(qū)所捕獲的同種魚類的脊椎骨和鰓線的數(shù)量有很大不同;甚至在同一海灣內(nèi)不同地點所捕獲的同種魚類,也發(fā)現(xiàn)這樣的傾向然而,鰻魚的脊椎骨的數(shù)量變化不大。施密特從歐洲各地、冰島、亞速爾群島以及尼羅河等幾乎分離的海域里所捕獲的鰻魚的樣本中,計算發(fā)現(xiàn)了幾乎一樣的均值和標準偏差值。由此,施密特推斷所有各個不同海域內(nèi)的鰻魚是由海洋中某公共場所繁殖的。后來名為“戴納(Dana)”的科學考察船在一次遠征中發(fā)現(xiàn)了這個場所2019-5-5統(tǒng)計學的應(yīng)用領(lǐng)域【例1-3】挑戰(zhàn)者號航天飛機失事預測

1986年1月28日清晨,載有7名宇航員的挑戰(zhàn)者號進入發(fā)射狀態(tài)。就在發(fā)射前,有冰片牢附在機殼上。幾分鐘后,正當電視新聞報道它已進入軌道時,航天飛機在毀滅性的爆炸聲中化成碎片,機上的宇航員片骨未存推動航天飛機進入太空的兩個固體燃料發(fā)動機是由Thiokol公司制造的。失事前一天晚上,Thiokol公司的經(jīng)理們和國家航空航天局就如期發(fā)射還是推遲發(fā)射產(chǎn)生了爭執(zhí)。天氣預報發(fā)射時的氣溫為310F。爭執(zhí)的結(jié)果采納了Thiokol公司經(jīng)理們的建:按計劃發(fā)射航天飛機。因為他們覺得沒有確鑿證據(jù)表明低溫會對固體燃料火箭推進器的性能產(chǎn)生影響2019-5-5統(tǒng)計學的應(yīng)用領(lǐng)域

2019-5-5統(tǒng)計學的誤用與濫用大約在一個世紀以前,政治家BenjaminDisraeli曾有一個著名的論斷:“有三類謊言:謊言、糟透的謊言和統(tǒng)計”。他還說:“圖并沒有說謊,是說謊者在畫圖”歷史學家AndrewLang說,一些人使用統(tǒng)計“就像喝醉酒的人使用街燈柱—支撐的功能多于照明”統(tǒng)計濫用不好的樣本過小的樣本誤導性圖表局部描述故意曲解2019-5-5統(tǒng)計學的誤用與濫用統(tǒng)計應(yīng)用上的兩個極端不用或幾乎不用統(tǒng)計簡單問題復雜化在統(tǒng)計應(yīng)用中,這兩個極端都是不可取的簡單的方法不一定沒用,復雜的方法也不一定有用。正如有的學者所說的,最簡單的模型往往是最有用的統(tǒng)計應(yīng)該恰當?shù)貞?yīng)用到它能起作用的地方。不能把統(tǒng)計神秘化,更不能歪曲統(tǒng)計,把統(tǒng)計作為掩蓋實事的陷阱1.2數(shù)據(jù)及其來源

1.2.1變量與數(shù)據(jù)

1.2.2數(shù)據(jù)的來源第1章數(shù)據(jù)與統(tǒng)計學1.2.1變量與數(shù)據(jù)1.2數(shù)據(jù)及其來源2019-5-5變量與數(shù)據(jù)變量(variable)描述所觀察對象某種特征的概念,其的特點是從一次觀察到下一次觀察可能會出現(xiàn)不同結(jié)果觀察一個企業(yè)的銷售額,這個月和上個月有所不同;觀察股票市場上漲股票的家數(shù),今天與昨天數(shù)量不一樣;觀察一個班學生的生活費支出,一個人和另一個人不一樣;投擲一枚骰子觀察其出現(xiàn)的點數(shù),這次投擲的結(jié)果和下一次也不一樣“企業(yè)銷售額”、“上漲股票的家數(shù)”、“生活費支出”、“投擲一枚骰子出現(xiàn)的點數(shù)”等就是變量數(shù)據(jù)(data)變量的觀測結(jié)果2019-5-5變量分類類別變量(categoricalvariable)取值為事物屬性或類別以及區(qū)間值的變量,也稱分類變量(classifiedvariable)或定性變量(qualitativevariable)比如,觀察人的性別、公司所屬的行業(yè)、用戶對商品的評價時,得到的結(jié)果就不是數(shù)字,而是事物的屬性此外,考慮學生月生活費支出的檔次可能分為1000以下、1000—1500、1500—2000、2000以上4檔,作為變量的“月生活費支出檔次”這4檔取值也不是普通的數(shù)值,而是數(shù)值區(qū)間,因而也稱為區(qū)間值類別變量類別變量根據(jù)取值是否有序分為兩種名義(nominal)值類別變量也稱無序類別變量,其取值是不可以排序的順序(ordinal)值類別變量也稱有序類別變量,其取值間可以排序當類別變量只取兩個值時也稱為二值(binary)類別變量,例如“性別”這一變量取值為男和女。二值變量可以看成名義變量,也可以看成有序變量2019-5-5變量分類數(shù)值變量(metricvariable)取值為數(shù)字的變量,也稱為定量變量(quantitativevariable)數(shù)值變量的觀察結(jié)果稱為數(shù)值數(shù)據(jù)(metricdata)或定量數(shù)據(jù)數(shù)值型變量根據(jù)其取值的不同,可以分為離散變量(discretevariable)和連續(xù)變量(continuousvariable)。離散型變量是只能取有限個值是變量,而且其取值可以一一列舉。連續(xù)型變量是可以在一個或多個區(qū)間中取任何值的變量,它的取值是連續(xù)不斷的,不能一一列舉,當離散變量的取值很多時,也可以將離散變量當作連續(xù)變量來處理2019-5-5變量分類1.2.2數(shù)據(jù)的來源1.2數(shù)據(jù)及其來源2019-5-5數(shù)據(jù)的來源尋找二手數(shù)據(jù)抽取樣本總體(population):包含所研究的全部個體(數(shù)據(jù))的集合樣本(sample):從總體中抽取的一部分元素的集合樣本量(samplesize):構(gòu)成樣本的元素的數(shù)目概率抽樣方法2019-5-5概率抽樣

(probabilitysampling)根據(jù)一個已知的概率來抽取樣本單位,也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率2019-5-5簡單隨機抽樣

(simplerandomsampling)從總體N個單位(元素)中隨機地抽取n個單位作為樣本,使得總體中每一個元素都有相同的機會(概率)被抽中抽取元素的具體方法有重復抽樣和不重復抽樣特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標量進行估計比較方便局限性當N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其他輔助信息以提高估計的效率2019-5-5簡單隨機樣本

(simplerandomsample)由簡單隨機抽樣形成的樣本從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個容量為n樣本都有相同的機會(概率)被抽中參數(shù)估計和假設(shè)檢驗所依據(jù)的主要是簡單隨機樣本2019-5-5分層抽樣

(stratifiedsampling)將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本優(yōu)點保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計的精度組織實施調(diào)查方便既可以對總體參數(shù)進行估計,也可以對各層的目標量進行估計2019-5-5系統(tǒng)抽樣

(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難2019-5-5整群抽樣

(clustersampling)將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調(diào)查特點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施缺點是估計的精度較差用SPSS抽取簡單隨機樣本軟件應(yīng)用2019-5-5用SPSS抽取簡單隨機樣本2019-5-5用SPSS抽取簡單隨機抽樣【例1—4】從一個班級50個學生的名單,采用簡單隨機抽樣抽出10個學生組成一個隨機樣本抽取隨機樣本SPSS2019-5-5用SPSS抽取簡單隨機樣本2019-5-5用SPSS抽取簡單隨機樣本1.3統(tǒng)計學與統(tǒng)計軟件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論