版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Spss統(tǒng)計(jì)應(yīng)用實(shí)務(wù)-問(wèn)卷分析與應(yīng)用統(tǒng)計(jì),主要內(nèi)容,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 統(tǒng)計(jì)基本思想及基本概念 統(tǒng)計(jì)數(shù)據(jù)整理與顯示方法 統(tǒng)計(jì)描述 統(tǒng)計(jì)推斷-參數(shù)估計(jì)假設(shè)檢驗(yàn) 多變量關(guān)系研究-相關(guān)與回歸,單(雙)因素方差分析 常用的統(tǒng)計(jì)模型:因子分析、聚類(lèi)分析 定量研究與統(tǒng)計(jì)分析 量化研究的基本概念 量表分析步驟 數(shù)據(jù)的建立 量表項(xiàng)目分析 量表效度與信度 信度與效度的概念 信度與效度的檢驗(yàn)方法 統(tǒng)計(jì)應(yīng)用實(shí)例及EXCEL、Spss,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.1統(tǒng)計(jì)基本思想與基本概念,1.1.1 什么是統(tǒng)計(jì)學(xué)?統(tǒng)計(jì)學(xué)是用以(1)收集數(shù)據(jù)、(2)分析數(shù)據(jù)、(3)由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法。 1
2、.1.2 統(tǒng)計(jì)學(xué)的基本思想 隨機(jī)性和規(guī)律性:關(guān)系密切的孿生子 規(guī)律性中的隨機(jī)性 1.1.3 統(tǒng)計(jì)學(xué)的中幾個(gè)基本概念 變量、值和個(gè)體 定義: 分類(lèi):定類(lèi)變量、定序變量、定距變量、定比變量 隨機(jī)事件和隨機(jī)變量 總體、樣本 總體參數(shù)和樣本統(tǒng)計(jì)量 概率,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.1統(tǒng)計(jì)學(xué)的基本思想與基本概念,1.1.4 統(tǒng)計(jì)研究的基本過(guò)程 數(shù)據(jù)收集-數(shù)據(jù)整理-數(shù)據(jù)分析 1.1.5 數(shù)據(jù)收集 觀測(cè)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù) 變量的定義和變量的選擇 數(shù)據(jù)收集的方法:文獻(xiàn)資料法、調(diào)查法、測(cè)量等 選擇合適的樣本:簡(jiǎn)單的隨機(jī)抽樣、分層抽樣、整群抽樣 收集數(shù)據(jù)時(shí)的錯(cuò)誤和誤差 衡量某一調(diào)查的結(jié)果所要考查的因素: 樣本是否
3、是合適的樣本 響應(yīng)率(response rate) 提問(wèn)題時(shí)所用的實(shí)際措辭 在調(diào)查中該問(wèn)題被安排在什么地方? 訪問(wèn)員是誰(shuí) 抽樣誤差(sample error)、系統(tǒng)誤差、過(guò)失誤差、隨機(jī)誤差 未響應(yīng)誤差(nonresponse error) 響應(yīng)誤差(response error,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.2不同數(shù)據(jù)類(lèi)型整理與展示方法,1.2.1 數(shù)據(jù)的分類(lèi) 定類(lèi)變量-分類(lèi)數(shù)據(jù) 定序變量-順序數(shù)據(jù) 定距變量-數(shù)值型數(shù)據(jù) 時(shí)間序列數(shù)據(jù) 多變量數(shù)據(jù) 1.2.2分類(lèi)數(shù)據(jù)的整理與展示 頻數(shù)與頻數(shù)分布 圖示:條型圖、餅圖,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.2不同數(shù)據(jù)類(lèi)型整理與展示方法,1.2.3順序數(shù)
4、據(jù)的整理與展示 累積頻數(shù) 累積頻率,例】在一項(xiàng)城市住房問(wèn)題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問(wèn)題是:“您對(duì)您家庭目前的住房狀況是否滿意? 1非常不滿意;2不滿意;3一般;4滿意;5非常滿意,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.2不同數(shù)據(jù)類(lèi)型整理與展示方法,甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.2不同數(shù)據(jù)類(lèi)型整理與展示方法,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.2不同數(shù)據(jù)類(lèi)型整理與展示方法,1.2.4數(shù)值型數(shù)據(jù)整理與展示方法 數(shù)據(jù)的分組,分組方法,分組方法,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.2不同數(shù)據(jù)類(lèi)型整理與展示方法,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法
5、 1.2不同數(shù)據(jù)類(lèi)型整理與展示方法,組距分組 確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。 確定組距:組距(Class Width)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即 組距( 最大值 - 最小值) 組數(shù) 統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表,實(shí)例,用Excel制作頻數(shù)分布表,例】某電腦公司2002年前四個(gè)月各天的銷(xiāo)售量數(shù)據(jù)(單位:臺(tái))。試對(duì)數(shù)據(jù)進(jìn)行分組,直方圖,某電腦公司銷(xiāo)售量分布的直方圖,折線圖,折線圖與直方圖 下的面積相等,140,150,210,某電腦公司銷(xiāo)售量分布的折線圖,190,200,180,160,170,220,230,
6、240,莖葉圖,箱線圖,不同數(shù)據(jù)分布的箱線圖,不同分布的箱線圖,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.2不同數(shù)據(jù)類(lèi)型整理與展示方法,1.2.5時(shí)間序列數(shù)據(jù)-線圖,例】已知19912000年我國(guó)城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線圖,線圖,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.2不同數(shù)據(jù)類(lèi)型整理與展示方法,1.2.5多變量數(shù)據(jù)-雷達(dá)圖,例】2000年我國(guó)城鄉(xiāng)居民家庭平均每人各項(xiàng)生活消費(fèi)支出構(gòu)成數(shù)據(jù)如表。試?yán)L制雷達(dá)圖,今天的主食是面包,雷達(dá)圖,總結(jié),統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.3描述統(tǒng)計(jì),1.3.1數(shù)據(jù)集中趨勢(shì)測(cè)度指標(biāo) 眾數(shù)(Mode) 中位數(shù)(Median)、分位數(shù)(quartile) 平均數(shù)(Me
7、an) 1.3.2數(shù)據(jù)離散趨勢(shì)測(cè)度指標(biāo) 異眾比率 全距(Range) 四分位距(quartile deviation) 標(biāo)準(zhǔn)差(Std.deviation) 方差(Variance) 變異系數(shù)(離散系數(shù)) 1.3.4數(shù)據(jù)偏態(tài)與峰態(tài)測(cè)度指標(biāo) 偏態(tài)系數(shù)、峰態(tài)系數(shù) 1.3.5相對(duì)位置測(cè)量 標(biāo)準(zhǔn)分,眾數(shù)、中位數(shù)、平均數(shù)與分布,眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用,眾數(shù) 不受極端值影響 具有不惟一性 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用 中位數(shù) 不受極端值影響 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用 平均數(shù) 易受極端值影響 數(shù)學(xué)性質(zhì)優(yōu)良 數(shù)據(jù)對(duì)稱(chēng)分布或接近對(duì)稱(chēng)分布時(shí)應(yīng)用,相對(duì)位置-標(biāo)準(zhǔn)分,經(jīng)驗(yàn)法則表明:當(dāng)一組數(shù)據(jù)對(duì)稱(chēng)分布時(shí) 約有
8、68%的數(shù)據(jù)在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 約有95%的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 約有99%的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),應(yīng)用標(biāo)準(zhǔn)分制定評(píng)價(jià)標(biāo)準(zhǔn),偏態(tài)與峰態(tài)分布的形狀,偏態(tài),峰態(tài),EXCEL統(tǒng)計(jì)實(shí)例,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,1.4.1抽樣與抽樣分布 1.4.2參數(shù)估計(jì) 1.4.3假設(shè)檢驗(yàn),統(tǒng)計(jì)推斷的過(guò)程,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,1.4.1抽樣與抽樣分布 抽樣方式,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,1.4.1抽樣與抽樣分布 抽樣分布,在重復(fù)選取容量為n的樣本時(shí),由每一個(gè)樣本算出的該統(tǒng)計(jì)量數(shù)值的相對(duì)頻數(shù)分布或概率分布 是一種
9、理論分布 隨機(jī)變量是 樣本統(tǒng)計(jì)量 樣本均值, 樣本比例,樣本方差等 結(jié)果來(lái)自容量相同的所有可能樣本 提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)我們穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù),抽樣分布示意,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,1.4.1抽樣與抽樣分布 樣本均值的抽樣分布,現(xiàn)從總體中抽取n2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,1.4.1抽樣與抽樣分布 樣本均值的抽樣分布,計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,1.4.1抽樣與抽樣分布 樣
10、本均值的抽樣分布,= 2.5 2 =1.25,總體分布,中心極限定理,中心極限定理:設(shè)從均值為,方差為 2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為、方差為2/n的正態(tài)分布,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,1.4.2參數(shù)估計(jì) 根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱(chēng)為置信區(qū)間 統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為置信區(qū)間 用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無(wú)法知道這個(gè)樣本所產(chǎn)
11、生的區(qū)間是否包含總體參數(shù)的真值 我們只能是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè),均值的抽樣分布,1 - ) % 區(qū)間包含了 % 的區(qū)間未包含,置信區(qū)間實(shí)例,一個(gè)由大學(xué)四年級(jí)男生組成的樣本中,平均身高是71英寸,標(biāo)準(zhǔn)差是2.1英寸。用這組數(shù)據(jù)的構(gòu)造的總體平均身高的95%的置信區(qū)間是70.4英寸71.6英寸之間。美國(guó)成年男的身高的均值是69.1英寸,你如何理解這個(gè)置信區(qū)間?從這個(gè)置信區(qū)間來(lái)看,大學(xué)四年級(jí)男生的身高和所有男性身高是否有區(qū)別? 【例】某種零件的長(zhǎng)度服從正態(tài)分布,從某天生產(chǎn)一批零件中按重復(fù)抽樣方法隨機(jī)抽取9個(gè),測(cè)得其平均長(zhǎng)度為
12、21.4cm。已知總體標(biāo)準(zhǔn)差為=0.15cm。試估計(jì)該批零件平均長(zhǎng)度的置信區(qū)間,置信水平為95,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,解:已知:= 0.15cm,n=9,x=21.4,1-=95,即:21.40.098=(21.302,21.498),該批零件平均長(zhǎng)度的置信區(qū)間為21.302cm21.498cm之間,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,1.4.3假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)的基本原理 某種帶有概率性質(zhì)的反證法,即:小概率事件在一次觀察中實(shí)際上不可能發(fā)生的統(tǒng)計(jì)原則。 假設(shè) 備擇假設(shè)與原假設(shè) 所犯的兩種錯(cuò)誤及顯著性水平 1 “棄真”錯(cuò)誤 2 “取偽”錯(cuò)誤 統(tǒng)計(jì)量及拒絕域 基本步
13、驟 1 提出原假設(shè)H0 2 選擇計(jì)算統(tǒng)計(jì)量 3 取a=0.05或0.01并計(jì)算臨界值 4 比較判斷得出結(jié)論 單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn),什么是假設(shè)?(hypothesis,對(duì)總體參數(shù)的具體數(shù)值所作的陳述 總體參數(shù)包括總體均值、比例、方差等 分析之前必需陳述,我認(rèn)為這種新藥的療效比原有的藥物更有效,什么是假設(shè)檢驗(yàn)? (hypothesis test,先對(duì)總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過(guò)程 有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn) 邏輯上運(yùn)用反證法,統(tǒng)計(jì)上依據(jù)小概率原理,原假設(shè)(null hypothesis,研究者想收集證據(jù)予以反對(duì)的假設(shè) 又稱(chēng)“0假設(shè)” 總是有符號(hào) , 或 4.
14、表示為 H0 H0 : = 某一數(shù)值 指定為符號(hào) =, 或 例如, H0 : 10cm,研究者想收集證據(jù)予以支持的假設(shè) 也稱(chēng)“研究假設(shè)” 總是有符號(hào) , 或 表示為 H1 H1 : 某一數(shù)值,或 某一數(shù)值 例如, H1 : 10cm,或 10cm,備擇假設(shè) (alternative hypothesis,例】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對(duì)生產(chǎn)過(guò)程進(jìn)行控制,質(zhì)量監(jiān)測(cè)人員定期對(duì)一臺(tái)加工機(jī)床檢查,確定這臺(tái)機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過(guò)程不正常,必須進(jìn)行調(diào)整。試陳述用來(lái)檢驗(yàn)生產(chǎn)過(guò)程是否正常的原假設(shè)和備擇假設(shè),提出假設(shè) (例題分析,解:研究
15、者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過(guò)程不正常”。建立的原假設(shè)和備擇假設(shè)為 H0 : 10cm H1 : 10cm,例】某品牌洗滌劑在它的產(chǎn)品說(shuō)明書(shū)中聲稱(chēng):平均凈含量不少于500克。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過(guò)抽檢其中的一批產(chǎn)品來(lái)驗(yàn)證該產(chǎn)品制造商的說(shuō)明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè),提出假設(shè) (例題分析,解:研究者抽檢的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說(shuō)明書(shū)中的陳述 。建立的原假設(shè)和備擇假設(shè)為 H0 : 500 H1 : 500,500g,例】一家研究機(jī)構(gòu)估計(jì),某城市中家庭擁有汽車(chē)的比例超過(guò)30%。為驗(yàn)證這一估計(jì)是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢
16、驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè),提出假設(shè) (例題分析,解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車(chē)的比例超過(guò)30%”。建立的原假設(shè)和備擇假設(shè)為 H0 : 30% H1 : 30,原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,而且相互對(duì)立 在一項(xiàng)假設(shè)檢驗(yàn)中,原假設(shè)和備擇假設(shè)必有一個(gè)成立,而且只有一個(gè)成立 先確定備擇假設(shè),再確定原假設(shè) 等號(hào)“=”總是放在原假設(shè)上 因研究目的不同,對(duì)同一問(wèn)題可能提出不同的假設(shè)(也可能得出不同的結(jié)論,提出假設(shè) (結(jié)論與建議,備擇假設(shè)沒(méi)有特定的方向性,并含有符號(hào)“”的假設(shè)檢驗(yàn),稱(chēng)為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailed test) 備擇假設(shè)具有特定的方向性,并
17、含有符號(hào)“”或“”,稱(chēng)為右側(cè)檢驗(yàn),雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn),雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn) (假設(shè)的形式,兩類(lèi)錯(cuò)誤與顯著性水平,假設(shè)檢驗(yàn)中的兩類(lèi)錯(cuò)誤,1.第類(lèi)錯(cuò)誤(棄真錯(cuò)誤) 原假設(shè)為真時(shí)拒絕原假設(shè) 第類(lèi)錯(cuò)誤的概率記為 被稱(chēng)為顯著性水平 2.第類(lèi)錯(cuò)誤(取偽錯(cuò)誤) 原假設(shè)為假時(shí)未拒絕原假設(shè) 第類(lèi)錯(cuò)誤的概率記為(Beta,H0: 無(wú)罪,假設(shè)檢驗(yàn)中的兩類(lèi)錯(cuò)誤 (決策結(jié)果,假設(shè)檢驗(yàn)就好像一場(chǎng)審判過(guò)程,統(tǒng)計(jì)檢驗(yàn)過(guò)程,錯(cuò)誤和 錯(cuò)誤的關(guān)系,影響 錯(cuò)誤的因素,1.總體參數(shù)的真值 隨著假設(shè)的總體參數(shù)的減少而增大 2.顯著性水平 當(dāng) 減少時(shí)增大 3.總體標(biāo)準(zhǔn)差 當(dāng) 增大時(shí)增大 4.樣本容量 n 當(dāng) n 減少時(shí)增大,顯著性水平 (s
18、ignificant level,1.是一個(gè)概率值 2.原假設(shè)為真時(shí),拒絕原假設(shè)的概率 被稱(chēng)為抽樣分布的拒絕域 3.表示為 (alpha) 常用的 值有0.01, 0.05, 0.10 4.由研究者事先確定,假設(shè)檢驗(yàn)中的小概率原理,什么是小概率? 1.在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率 2.在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè) 3.小概率由研究者事先確定,統(tǒng)計(jì)量與拒絕域,根據(jù)樣本觀測(cè)結(jié)果計(jì)算得到的,并據(jù)以對(duì)原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量 對(duì)樣本估計(jì)量的標(biāo)準(zhǔn)化結(jié)果 原假設(shè)H0為真 點(diǎn)估計(jì)量的抽樣分布,檢驗(yàn)統(tǒng)計(jì)量 (test statistic,標(biāo)準(zhǔn)化的檢
19、驗(yàn)統(tǒng)計(jì)量,顯著性水平和拒絕域(雙側(cè)檢驗(yàn),抽樣分布,顯著性水平和拒絕域(雙側(cè)檢驗(yàn),顯著性水平和拒絕域(雙側(cè)檢驗(yàn),顯著性水平和拒絕域(雙側(cè)檢驗(yàn),顯著性水平和拒絕域(單側(cè)檢驗(yàn),顯著性水平和拒絕域(左側(cè)檢驗(yàn),顯著性水平和拒絕域(左側(cè)檢驗(yàn),顯著性水平和拒絕域(右側(cè)檢驗(yàn),顯著性水平和拒絕域(右側(cè)檢驗(yàn),決策規(guī)則,給定顯著性水平,查表得出相應(yīng)的臨界值z(mì)或z/2, t或t/2 將檢驗(yàn)統(tǒng)計(jì)量的值與 水平的臨界值進(jìn)行比較 作出決策 雙側(cè)檢驗(yàn):I統(tǒng)計(jì)量I 臨界值,拒絕H0 左側(cè)檢驗(yàn):統(tǒng)計(jì)量 臨界值,拒絕H0,利用 P 值 進(jìn)行決策,什么是P 值?(P-value,在原假設(shè)為真的條件下,檢驗(yàn)統(tǒng)計(jì)量的觀察值大于或等于其計(jì)
20、算值的概率 雙側(cè)檢驗(yàn)為分布中兩側(cè)面積的總和 反映實(shí)際觀測(cè)到的數(shù)據(jù)與原假設(shè)H0之間不一致的程度 被稱(chēng)為觀察到的(或?qū)崪y(cè)的)顯著性水平 決策規(guī)則:若p值, 拒絕 H0,雙側(cè)檢驗(yàn)的P 值,左側(cè)檢驗(yàn)的P 值,右側(cè)檢驗(yàn)的P 值,假設(shè)檢驗(yàn)步驟的總結(jié),陳述原假設(shè)和備擇假設(shè) 從所研究的總體中抽出一個(gè)隨機(jī)樣本 確定一個(gè)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并利用樣本數(shù)據(jù)算出其具體數(shù)值 確定一個(gè)適當(dāng)?shù)娘@著性水平,并計(jì)算出其臨界值,指定拒絕域 將統(tǒng)計(jì)量的值與臨界值進(jìn)行比較,作出決策 統(tǒng)計(jì)量的值落在拒絕域,拒絕H0,否則不拒絕H0 也可以直接利用P值作出決策,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,均值假設(shè)檢驗(yàn) 單樣本t檢驗(yàn) 檢驗(yàn)?zāi)?/p>
21、個(gè)變量的總體均值與指定的檢驗(yàn)值之間是否存在顯著差異。前提要求是樣本來(lái)自的總體應(yīng)服從正態(tài)分布。 例1:隨機(jī)抽樣得到若干個(gè)周歲兒童身高的樣本數(shù)據(jù)?,F(xiàn)在需要通過(guò)這些樣本數(shù)據(jù),分析周歲兒童的平均身高是否為75厘米? 例2:已知某運(yùn)動(dòng)飲料中,維生素C含量服從正態(tài)分布,按規(guī)定,維生素C的平均含量不得小于21毫克?,F(xiàn)從一批飲料中抽取17罐,平均C含量為23毫克,標(biāo)準(zhǔn)差為3.98毫克,問(wèn)該批飲料維生素C含量是否合格,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,均值假設(shè)檢驗(yàn) 獨(dú)立樣本t檢驗(yàn) 就是根據(jù)樣本數(shù)據(jù)對(duì)它們來(lái)自的兩獨(dú)立總體的均值是否有顯著差異進(jìn)行推斷。這個(gè)檢驗(yàn)的前提要求是:(1)兩樣本應(yīng)是相互獨(dú)立的。即從
22、一總體中抽取一批樣本對(duì)從另一總體中抽取一批樣本沒(méi)有任何影響。 (2)樣本來(lái)自兩總體應(yīng)服從正態(tài)分布。 例:從北京和上海兩個(gè)城市,分別隨機(jī)抽取若干個(gè)周歲兒童身高的樣本數(shù)據(jù),現(xiàn)在需要分析兩城市周歲兒童的平均身高是否存在顯著差異。 例:現(xiàn)將各方面條件及技術(shù)水平基本相似的12名跳遠(yuǎn)運(yùn)動(dòng)員隨機(jī)的分成兩組,分別實(shí)施不同的訓(xùn)練,半年后,每人增長(zhǎng)的成績(jī)?nèi)缦拢▎挝唬豪迕祝?17 12 16 11 13 8 9 9 10 8 7 試問(wèn)兩種訓(xùn)練的效果是否有顯著性差異?(=0.01,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.4統(tǒng)計(jì)推斷,均值假設(shè)檢驗(yàn) 配對(duì)樣本t檢驗(yàn) 是根據(jù)樣本數(shù)據(jù)對(duì)樣本來(lái)自的兩配對(duì)總體的均值是否有顯著差異進(jìn)行推斷
23、。 前提要求:一是,兩樣本應(yīng)是配對(duì)的。(兩樣本觀察值數(shù)目相同;其次,兩樣本的觀察值的順序不能隨意更改)二是,樣本來(lái)自的兩樣本總體應(yīng)服從正態(tài)分布,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.5多變量關(guān)系研究,1.5.1基本思路 問(wèn)題一:從數(shù)據(jù)看變量間有關(guān)系嗎? 問(wèn)題二:如果變量間有關(guān)系,這個(gè)關(guān)系有多強(qiáng)? 問(wèn)題三:是否不僅在樣本中,而且在總體 中也有這種關(guān)系? 問(wèn)題四:這個(gè)關(guān)系是不是因果關(guān)系,1.5.2兩分類(lèi)變量:列聯(lián)表 卡方檢驗(yàn) 例:不同的國(guó)家的人們用同樣的眼光來(lái)看待陌生人嗎?調(diào)查的問(wèn)題:“一般說(shuō)來(lái),你是同意大多數(shù)人都是可信賴(lài)的呢,還是認(rèn)為和人們相處時(shí)再怎么小心也不過(guò)分,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.5多
24、變量關(guān)系研究,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.5多變量關(guān)系研究,1.5.2兩分類(lèi)變量:列聯(lián)表 卡方檢驗(yàn),有沒(méi)有關(guān)系? 兩變量關(guān)系的強(qiáng)度? 總體中關(guān)系? 提出零假設(shè) 檢驗(yàn)零假設(shè) p-值判斷,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.5多變量關(guān)系研究,1.5.3一分類(lèi)變量(自變量)與數(shù)值型變量的方差分析 實(shí)例:下表匯總了兒童看護(hù)花費(fèi)的數(shù)據(jù)資料。請(qǐng)用方差分析的方法來(lái)判斷不同看護(hù)方式之間的收費(fèi)是否也不相同。 解:第一、看看兩變量之間的關(guān)系(作圖) 第二、具體分析兩變量之間的強(qiáng)度 第三、描述總體的這種關(guān)系,進(jìn)一步分析這種不同產(chǎn)生的原因,1,2,ANOVA 每小時(shí)費(fèi) SSdfMSFSig. 組間 10.03933.
25、3468.543.003 組內(nèi) 4.70112.392 Total 14.73915,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.5多變量關(guān)系研究,1.5.4兩數(shù)值型變量的相關(guān)與回歸分析,從右圖看數(shù)據(jù)關(guān)系? 如果一種食物如果含有兩倍于另一種食物的脂肪,其熱量是否也為另一食物的兩倍,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.5多變量關(guān)系研究,1)作散點(diǎn)圖看有沒(méi)有關(guān)系,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.5多變量關(guān)系研究,2)求關(guān)系強(qiáng)度-相關(guān)系數(shù) 相關(guān)系數(shù)r是在-1到1之間的描述兩數(shù)值變量間關(guān)系強(qiáng)度的一個(gè)指標(biāo)。我們把它稱(chēng)為線性相關(guān)系數(shù)(linear correlation coefficient)、(Pearsons co
26、rrelation coefficient)或乘積相關(guān)系數(shù)(product-moment correlation coefficient) 相關(guān)系數(shù)的性質(zhì)(正負(fù)及大?。?一般認(rèn)為:r(-.78,-1)很強(qiáng)的負(fù)相關(guān),r(.78,1)很強(qiáng)正相關(guān);r(-.30,-.78),r(.30,.78)表示一個(gè)適中的關(guān)系;r(-.25,.25)關(guān)系很弱。 散點(diǎn)圖與相關(guān)系數(shù) 由散點(diǎn)圖可以看出相關(guān)程度的強(qiáng)弱;另外可以發(fā)現(xiàn)異常值,所以在進(jìn)行相關(guān)分析和回歸分析之前,應(yīng)作一散點(diǎn)圖觀測(cè)一下數(shù)據(jù)。 對(duì)r相關(guān)系數(shù)的解釋 r 到底又有怎樣的含義,另外R的平方又代表了什么意義,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.5多變量關(guān)系研究,3
27、)進(jìn)一步研究?jī)勺兞筷P(guān)系形式-回歸分析,在使誤差值取得最小時(shí)即: 值取得最小時(shí),我們就可根據(jù)“最小二乘法原理”來(lái)確定a,b的值,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.5多變量關(guān)系研究,判定系數(shù)-方程擬合優(yōu)度指標(biāo) 總體相關(guān)性檢驗(yàn)-方差分析表 系數(shù)的假設(shè)檢驗(yàn)-T檢驗(yàn),自變量(脂肪含量,殘差變量,因變量(熱量,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法 1.6統(tǒng)計(jì)高級(jí)模型,1.6.1因子分析模型 多指標(biāo)設(shè)計(jì)的帶來(lái)的問(wèn)題: 1、增加收集的工作量,使分析工作變得煩瑣 2、耗費(fèi)大量的人力物力,但存在大量的信息重疊。 解決辦法: 采用因子分析減少指標(biāo),而不造成重要信息的丟失。它將眾多指標(biāo)綜合成幾個(gè)較少的幾個(gè)綜合指標(biāo),這些綜合指標(biāo)稱(chēng)為因子變量,統(tǒng)計(jì)基本原理與常用統(tǒng)計(jì)方法
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年農(nóng)用搬運(yùn)機(jī)械項(xiàng)目合作計(jì)劃書(shū)
- 冷庫(kù)裝卸合同范本
- 林地后補(bǔ)合同范本
- 卷紙銷(xiāo)售合同范本
- 2024年高線密度玻璃纖維直接無(wú)捻粗紗項(xiàng)目合作計(jì)劃書(shū)
- 中學(xué)國(guó)際交流與學(xué)習(xí)計(jì)劃
- 集體活動(dòng)的精彩時(shí)刻計(jì)劃
- 豐富社區(qū)科學(xué)普及活動(dòng)的個(gè)人方案計(jì)劃
- 臨時(shí)接電合同范本
- 成立品牌合同范本
- 裝修垃圾清運(yùn)單
- (部編)初中語(yǔ)文人教2011課標(biāo)版七年級(jí)下冊(cè)人教版七年級(jí)下冊(cè)第六單元22課《太空一日》第一課時(shí)教學(xué)設(shè)計(jì)
- (精心整理)整體認(rèn)讀音節(jié)練習(xí)
- 車(chē)位委托經(jīng)營(yíng)管理協(xié)議
- 3D打印解析(課堂PPT)
- 流動(dòng)資金貸款需求量測(cè)算參考計(jì)算表(XLS12)
- 三相步進(jìn)電機(jī)控制程序及電路
- 硬筆書(shū)法課教學(xué)(課堂PPT)
- 焊 接 與 切 割 安 全
- 焊接吊耳及設(shè)計(jì)計(jì)算及正確使用方法
- 改性活性炭吸附硫化氫性能研究_圖文
評(píng)論
0/150
提交評(píng)論