應(yīng)用統(tǒng)計學復習重點_第1頁
應(yīng)用統(tǒng)計學復習重點_第2頁
應(yīng)用統(tǒng)計學復習重點_第3頁
應(yīng)用統(tǒng)計學復習重點_第4頁
應(yīng)用統(tǒng)計學復習重點_第5頁
免費預(yù)覽已結(jié)束,剩余6頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、應(yīng)用統(tǒng)計學定義:統(tǒng)計學是研究數(shù)據(jù)收集、整理、顯示與分析方法(或公式)的科學。目的是探索數(shù)據(jù)內(nèi)在數(shù)量規(guī)律性,以達到對客觀事物總體的科學認識。1、參數(shù)(parameter):指用于說明總體的指標。均值一(1,標準差一(T,方差一(T2,率一 P2、統(tǒng)計量(statistics):指用于說明樣本的指標。均值一。標準差一 So 方差一 s2,率一 p數(shù)據(jù)的計量尺度1 列名尺度 nominalscale(1)定義:按事物的某種屬性對事物進行平行分類或分組。劃分的各類別之間無大小或優(yōu)劣之分,且次序可以改變。(2)適用:取值只能大體進行平行分類的品質(zhì)型標志(變量)。(3)記錄方式:變量名稱:類別名羅列或用無

2、意義數(shù)字表示。例:性別:男/女性別:(1)男(2)女2 順序尺度 ordinalscale(1)定義:按事物的某種屬性對事物進行分類或分組基礎(chǔ)上,再將類別等級由大到小或由小到大排序。(2)適用:取值可以進行分類且各類別具有等級差異的品質(zhì)型標志(變量)。(3)記錄方式:品質(zhì)變量名:類別名序號由大到小或由小到大排列。例:文化程度(1)文盲(2)小學(3)初中(4)高中以上3 間隔尺度 intervalscale(1)定義:選定一個測量單位,對數(shù)值變量在分類排序基礎(chǔ)上測量其間距(差距)。測量出的數(shù)值有加、減意義,無乘除意義。(2)適用:可用數(shù)值記錄其值而無比率意義的數(shù)值型標志。(3)記錄形式:數(shù)值變

3、量名:例:語文成績:*表述語:甲(60 分)比乙(30 分)高 30 分4 比例尺度 ratioscale(1)定義:選定一個測量單位,對數(shù)值型標志(變量)在測量間距基礎(chǔ)上,測量其比率。(2)適用:可用數(shù)值記錄其值且有比率意義的數(shù)值型變量。(3)記錄形式:數(shù)值變量名:例:家庭人口數(shù):*表述語:甲家庭(6 人)比乙家庭(3 人)多 3 人,甲家庭人口與乙家庭人口之比為 2:1問卷結(jié)構(gòu):表頭、表體和表外附加 3 部分。(一)表頭:調(diào)查表名稱。(二)表體:說明詞和調(diào)查項目。1、說明詞:包括問候語、調(diào)查目的說明、填表說明和問卷編號等。2、調(diào)查項目:分為品質(zhì)型變量與數(shù)值變量。(三)表外附加:包括調(diào)查人簽

4、名、調(diào)查日期、被調(diào)查人合作程度等。統(tǒng)計數(shù)據(jù)的收集、整理與描述描述統(tǒng)計學如果數(shù)據(jù)的獲得是通過抽樣法取得,就需要用樣本數(shù)據(jù)對總體進行估計、假設(shè)檢驗、預(yù)測等分析,推斷總體數(shù)量特征。1、參數(shù)(抽樣)估計:(第四、五章)用樣本統(tǒng)計量指標值(均值、標準差、率等)推斷總體(所有個體)統(tǒng)計指標值。(第六章)(第七章)(第八章),在大概率條件下進行推斷總體,推斷統(tǒng)計的結(jié)果是研究問條形圖(barcharts)適用資料類型:(1)同一總體,不同測量指標值(標準分數(shù))的比較;內(nèi)容包括:數(shù)據(jù)收集、整理、1、數(shù)據(jù)收集與整理:2、數(shù)據(jù)顯示:3、數(shù)據(jù)分布特征描述:*以正態(tài)分布為例一般水平(均值)變異情況(標準差)推斷統(tǒng)計學顯

5、示與分布特征描述。(第二章 1-4 節(jié))。(第二章 9 節(jié))(第二章 57 節(jié))集中趨勢離散趨勢2、假設(shè)檢驗:兩組差異性分析3、方差分析:多組差異性分析4、預(yù)測分析:相關(guān)與回歸分析描述統(tǒng)計與推斷統(tǒng)計的關(guān)系:由描述統(tǒng)計獲得樣本統(tǒng)計量指標值題的最終答案。例:同班同學不同課程考試成績比較。(2)不同總體,同質(zhì)性測量指標值間的比較。餅圖(pie)適用資料類型:(1)同一總體,不同部分所占比例的比較,用餅圖;(2)不同總體,同質(zhì)性部分所占比例的比較,用環(huán)形圖。線圖(line)適用資料類型:隨時間變化的數(shù)據(jù),發(fā)展趨勢分析。散點圖(scatterplots)適用資料類型:兩個變量相關(guān)關(guān)系趨勢分析。數(shù)據(jù)分布集

6、中趨勢測量指計算一組數(shù)據(jù)的一般水平或中心值。由最低組至最高組(向下)累積頻數(shù)計算公式眾數(shù)diMo=L+Xd1+d2公式中:L 一眾數(shù)組下限 di 一眾數(shù)組頻數(shù)與其下限相鄰一組頻數(shù)之差d2-眾數(shù)組頻數(shù)與其上限相鄰一組頻數(shù)之差nii 一眾數(shù)組組距MdL-Sm1一眾數(shù)組:指頻數(shù)最大的組2fm公式中:L 為中位數(shù)所在組的下限Sm-1 為小于中位數(shù)所在組下限各組的累積頻數(shù) n 為數(shù)據(jù)總和 fm 為中位數(shù)所在組的頻數(shù) i 為中位數(shù)組的組距中位數(shù)組:指由最低組向最高組累積,達到次數(shù)半值的組X可般、MO和均值的用X及應(yīng)iMdMOXMdMO(負)左偏分布對稱分布(正)右偏分布正態(tài)分布數(shù)據(jù)一一一般選用均值mean

7、作為平均指標,表示平均水平偏態(tài)分布數(shù)據(jù)一一極差太大時,選用中位數(shù)median作為平均指標,表示中等水平偏態(tài)分布數(shù)據(jù)一一極差較小時,選用眾數(shù)Mode作為平均指標,表示大多數(shù)個體的水平20XX 年,對某市 500 戶居民家庭月收入抽樣調(diào)查數(shù)據(jù)見下表。求:(1)本市居民家庭平均月收入(2)本市大多數(shù)居民家庭月收入(3)本市中等水平居民家庭月收入組別尸數(shù)500兀以卜40500-80090800-110011011001700701700-200050200以上35合計500解:(1)=(350*40+650*90+950*110+1250*105+1550*70+1850*5

8、0+2150*35)/500=984(元)(2)Mo=800+(110-90)/(110-90)+(110-105)*300=1040(元)(3)Me=1100+(500/2-240)/105*300=1128.57數(shù)據(jù)分布離散趨勢測量即:離散趨勢測量是描述一組數(shù)據(jù)中,每個觀察值偏離平均值的狀況,即數(shù)據(jù)的變異性。1極差(rang適用資料:R=max(xi)-min(xi)偏態(tài)分布數(shù)據(jù),即一般水平用Mo、Me表示時,其離差狀況用R表示。2方差(總體用2表示,樣本用s2表示)標準差(總體用6表示,樣本用s表示)適用:正態(tài)分布數(shù)據(jù),即一般水平用均值表示時,其離差狀況用S表示。數(shù)據(jù)分布特點描述指標的綜

9、合選擇標準差的值越大,表明這組數(shù)據(jù)的離散程度越大3離散曾適用:(1)對同一總體不量指標的離散程度進行比較。(2V對不同營體同一測量指“V離散固進行比較。xx離散系數(shù)越大,表明離散程度越大檢驗數(shù)據(jù)的分布形態(tài)檢驗數(shù)據(jù)分布的偏態(tài)偏斜系數(shù)(skewnesS2(xi-x)3fiSK=nS3SK=0,正態(tài)分布SK0,右偏分布2、檢驗數(shù)據(jù)分布的峰態(tài)峰度系數(shù)(kurtosis)2(xi-X)4fiK=-34正態(tài)分布平峰分布尖峰分布在分別掌握了集中趨勢(X、Mo、Me)、離散趨勢(R、S)、偏態(tài)(SK)及峰度(K)后,如何從計算機給出的多種指標值中選擇適合研究者所取數(shù)據(jù)的分布特點值呢?(1)當SK=0時,即正態(tài)

10、分布時,選取X、S分別作為集中與離散趨勢指標,表小為:xS(2)當SKW0,且K0,即偏態(tài)尖峰分布時,選取Mo、R分別作為集中與離散趨勢指標,表示為:M0R(或范圍minmax)概率與概率分布概率論與推斷統(tǒng)計的關(guān)系推斷統(tǒng)計是研究如何用樣本統(tǒng)計量推斷總體參數(shù)值,原則是在已知樣本又、S、P取值概率分布形式的基礎(chǔ)上,在大概率條件下進行推斷。nSK=0,K0,X、S、P的概率分布形式又稱為抽樣分布。經(jīng)大量研究表明:x大樣本下服從正態(tài)分布小樣本下服從t分布S單個樣本的S2服從x2分布,兩個樣本Si2/S22服從F分布P大樣本下近似服從正態(tài)分布小樣本下服從二項分布(大樣本指大于30的)2、大、小概率及臨界

11、值(1)一般的,將概率值在95%以上為大概率事件,概率值小于5%的稱為小概率事件。(2)臨界值指發(fā)生小概率事件的臨界點值。抽樣分布抽樣分布(samplingdistribution):根據(jù)所有可能的樣本觀察值計算出來的某一種統(tǒng)計量的觀察值的概率分布。抽樣分布是參數(shù)估計與假設(shè)檢驗的理論基礎(chǔ)樣本均值的抽樣分布形式:隨總體分布形式、抽樣方式以及樣本量大小的不同而不同。一般規(guī)律:大樣本下,樣本均值服從正態(tài)分布,小樣本下服從t分布。常用抽樣分布及參數(shù)估計公式通用公式:樣本統(tǒng)計量土極限誤差;極限誤差八=臨界值*抽樣誤差;抽樣誤差=樣本標準差/SQR(n)常用公式見課本參數(shù)估計Parameterestima

12、tion研究從樣本獲得一組數(shù)據(jù)后,如何通過這組信息,對總體特征進行估計,也就是如何從局部結(jié)果推論總體的情況。置信度與顯著性水平:1-a:稱為置信概率或置信水平、置信系數(shù),一般取95%、99%兩個值。民:稱為顯著性水平(或小概率),一般取0.05和0.01兩個水平。一參數(shù)估計的一般公式樣本統(tǒng)計量極限誤差A(yù)(1)樣本統(tǒng)計捕輸?shù)锉境鲰莶钜褬藴什?2)A=大小概率的臨界伍后抽樣誤差(3)例:抽取250名大學生,測得其平均IQ為115,已知人群中IQ標準差為15,試以95%的置信度推肉的串番堂生的梅疑羞Q?15解:a=0.05Ih5/2=1.96吊羊本均250*15代入上式有:下限115-1.96X0.

13、95=113.14上限115+1.96X0.95=116.86即在95%置信度下,估計中國大學生的平均IQ為113.14116.86常用區(qū)間估計公式及應(yīng)用樣本量計算公式假設(shè)檢驗本章應(yīng)重點掌握:1、假設(shè)檢驗的原理、三類假設(shè)及其H0成立的統(tǒng)計決策條件;2、均值檢驗中三類檢驗(單樣本、獨立樣本、配對樣本)適用的研究問題;3、均值檢驗中三類檢驗計算機輸出結(jié)果的讀取方法;4、兩類率檢驗適用的研究問題。兩類假設(shè)建立原則1、H0與H1必須成對出現(xiàn)2、通常先確定備擇假設(shè),再確定原假設(shè)3、假設(shè)中的等號“二”總是放在原假設(shè)中如何判斷原假設(shè)H0是否成立呢?原理小概率事件在一次試驗中基本上不會發(fā)生.如果在H0條件下發(fā)

14、生了小概率事件,則認為H0不正確過程說明實例分析某生產(chǎn)工藝零件規(guī)格為長度4cm,標準差為0.化勺,從某大生產(chǎn)的零件中抽取9件,測得平均長度為3.94cm,試在95%概率下檢驗者才產(chǎn)出陽帶?解:H0:N=4*正常H1:仙手43和正常4研究北陽E實的觀點)0.95由抽樣分布知,正態(tài)總體方為已知0寸1,91 1.逐當H0成立時,既在H0條件下發(fā)生了大概率事件,故H0成立,H1不成立。常用的值有0.01,0.05,0.10=0.05稱為“有顯著性差異”=0.01稱為“有極其顯著性差異”=0.10稱為“有明顯的差異趨勢”當Pa時,H0成立統(tǒng)計決策(1)臨界值比較法雙側(cè):如果統(tǒng)計量值(Z)界于左、右臨界值

15、問,則H0成立;如果大于右臨界值或小于左臨界值,H0不成立。左尾:如果統(tǒng)計量值(Z)界于大于左臨界值,則Ho成立;如果小于左臨界值,Ho不成立。右尾:如果統(tǒng)計量值(Z)界于小于右臨界值,則Ho成立;如果大于右臨界值,Ho不成立。(2)利用P值法P175P值是指統(tǒng)計量(Z)值在分布曲線上所截取的剩余面積值,可由計算機自動給出,因此:無論是雙側(cè)還是單側(cè)檢驗問題當Pa時,Ho成立三類假設(shè)的形式:以均值為例假設(shè)研究的問題雙側(cè)檢驗左側(cè)檢驗右偶檢驗HoP=PoHIP山單樣本均值檢驗(One-samplettest)研究問題用從1個總體中抽樣樣本的均值檢驗該總體均值是否等于某個值。對應(yīng)于管理學研究中“均值類

16、質(zhì)量檢驗”問題,必須有一個總體報告值或標準值。用sig.值與o.o5比較進行決策。雙獨立樣本均值之差檢驗(Independent-samplesttest)研究問題用從2個總體中獨立抽取兩個樣本的均值之差檢驗兩個總體的均值是否相等。對應(yīng)于管理學研究中“以均值作為指標的技改效果評價,前后人員不對應(yīng)”類問題。F與sig為兩個總體方差齊性檢驗結(jié)果,如果F的sig值小于0.05表示方差不齊;如果大于0.05表示方差齊性。雙匹配樣本均值之差檢驗(Paried-samplesttest)研究問題用2個匹配樣本的均值之差檢驗兩個總體的均值是否相等。對應(yīng)于管理學研究中“技改效果評價,前后人員對應(yīng)”類問題。用t

17、值后的sig.值與0.05比較進行決策。單樣本率的檢驗(一)研究問題用從1個總體中抽樣樣本的計算出的率檢驗該總體率是否等于某個值。對應(yīng)于管理學研究中“率類質(zhì)量檢驗”問題,必須有一個總體報告率值或標準率值。兩個樣本比率之差的檢驗(一)研究問題用兩個總體中抽樣樣本的計算出的率的差值檢驗兩個總體率是否相等。對應(yīng)于管理學研究中“率類技改效果評價”問題。例,對技改前、后廢品率改變情況的檢驗。方差分析方差分析的適用情況是檢驗多個總體均值是否相等的統(tǒng)計方法。通常是通過檢驗各總體均值是否相等來判斷某個或某幾個分類自變量對某個數(shù)值型因變量是否有顯著影響。單因素方差分析輸出結(jié)果讀取方法:依據(jù)sig值進行判斷,若大

18、于0.05,則無顯著性差異雙因素方差分析輸出結(jié)果讀取方法:若FAF,或P0.05,則拒絕原假設(shè)H0,表明均值之間的差異是顯著的,即所檢驗的因素(A)對觀察值有顯著影響若FBF,或P0.05,則拒絕原假設(shè)H0,表明均值之間有顯著差異,即所檢驗的因素(B)對觀察值有顯著影響相關(guān)與回歸分析簡單線性相關(guān)(積差相關(guān),Pearson皮爾遜相關(guān))的適用數(shù)據(jù):1、成對數(shù)據(jù),大樣本2、正態(tài)雙變量(總體)3、兩變量是連續(xù)數(shù)值變量4、兩變量為線性關(guān)系雙變量等級相關(guān)(Spearman皮爾曼相關(guān))相關(guān)適用數(shù)據(jù):1、雙變量,按定序尺度測量的品質(zhì)變量之間的相關(guān)性。2、雙數(shù)值型變量,分布未知,或樣本較小。回歸分析的基本概念將存在有相關(guān)性的兩個變量,一個作為自變量,另一個作為因變量,建立數(shù)學方程式,用該方程自變量的值來估計、預(yù)測因變量的估計值,這一過程稱為回歸分析。相關(guān)分析與回歸分析的關(guān)系(一)區(qū)別1、相關(guān)分析的任務(wù)是確定兩個變量之間相關(guān)的方向和密切程度,用相關(guān)系數(shù)來表示。回歸分析的任務(wù)是尋找自變量因自變量影響關(guān)系的數(shù)學表達式。用數(shù)學模型來表示2、相關(guān)分析不必確定兩變量中哪個是自變量,哪個是因變量,是兩個變量之間的雙向關(guān)系,沒

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論