![心理與應(yīng)用統(tǒng)計(jì)學(xué)_第1頁(yè)](http://file4.renrendoc.com/view/584f9ee52a5cad117a474ba7951e2bc0/584f9ee52a5cad117a474ba7951e2bc01.gif)
![心理與應(yīng)用統(tǒng)計(jì)學(xué)_第2頁(yè)](http://file4.renrendoc.com/view/584f9ee52a5cad117a474ba7951e2bc0/584f9ee52a5cad117a474ba7951e2bc02.gif)
![心理與應(yīng)用統(tǒng)計(jì)學(xué)_第3頁(yè)](http://file4.renrendoc.com/view/584f9ee52a5cad117a474ba7951e2bc0/584f9ee52a5cad117a474ba7951e2bc03.gif)
![心理與應(yīng)用統(tǒng)計(jì)學(xué)_第4頁(yè)](http://file4.renrendoc.com/view/584f9ee52a5cad117a474ba7951e2bc0/584f9ee52a5cad117a474ba7951e2bc04.gif)
![心理與應(yīng)用統(tǒng)計(jì)學(xué)_第5頁(yè)](http://file4.renrendoc.com/view/584f9ee52a5cad117a474ba7951e2bc0/584f9ee52a5cad117a474ba7951e2bc05.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
心理統(tǒng)計(jì)學(xué)(紅色標(biāo)記??純?nèi)容)-51-第一章緒論第一節(jié)研究對(duì)象1統(tǒng)計(jì)學(xué)1.1統(tǒng)計(jì)學(xué)分為數(shù)理統(tǒng)計(jì)與應(yīng)用統(tǒng)計(jì),1.2應(yīng)用統(tǒng)計(jì)分為心理統(tǒng)計(jì)、生物統(tǒng)計(jì)、醫(yī)學(xué)統(tǒng)計(jì)、社會(huì)統(tǒng)計(jì)、經(jīng)濟(jì)統(tǒng)計(jì)等等…1.3心理統(tǒng)計(jì)分為描述統(tǒng)計(jì)、推論統(tǒng)計(jì)、研究設(shè)計(jì)。2.推論統(tǒng)計(jì)2.1推論統(tǒng)計(jì)常用于從局部數(shù)據(jù)估計(jì)總體情況。2.2心理與教育類(lèi)實(shí)證研究的結(jié)果,基本上都不能直接得出結(jié)論,而需要運(yùn)用推論統(tǒng)計(jì)。第二節(jié)為什么要學(xué)習(xí)統(tǒng)計(jì)學(xué)一、發(fā)現(xiàn)隨機(jī)現(xiàn)象的運(yùn)動(dòng)規(guī)律二、貫穿整個(gè)心理學(xué)研究過(guò)程的方法與技術(shù)三、心理學(xué)研究資料分析的技術(shù)四、“行話”——方便交流、閱讀與撰寫(xiě)五、心理學(xué)專(zhuān)業(yè)的應(yīng)用技術(shù)之一第三節(jié)基礎(chǔ)概念一、總體、樣本和個(gè)案二、統(tǒng)計(jì)量(特征量)和參數(shù)(一)總體的特性稱(chēng)為參數(shù),用希臘字母表示;樣本的特性稱(chēng)為統(tǒng)計(jì)量,用英文字母表示(二)統(tǒng)計(jì)量(特征量)和參數(shù)統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)量參數(shù)平均數(shù)標(biāo)準(zhǔn)差相關(guān)系數(shù)回歸系數(shù)
三、數(shù)據(jù)(變量)的類(lèi)型(1)根據(jù)數(shù)據(jù)反映的測(cè)量水平,可分為:“稱(chēng)名”,特點(diǎn):起名稱(chēng)作用,不同的數(shù)字沒(méi)有大小之分(不可比較),不能加減乘除。“順序”,特點(diǎn):可比較,不能加減乘除?!暗染唷保攸c(diǎn):可比較、可加減,不能乘除?!氨嚷省保攸c(diǎn):可比較、可加減乘除。四種類(lèi)型變量的數(shù)學(xué)關(guān)系比較數(shù)據(jù)類(lèi)型數(shù)學(xué)關(guān)系=or≠>or<+or-×or÷稱(chēng)名√順序√√等距√√√等比√√√√離散數(shù)據(jù)(又稱(chēng)間斷數(shù)據(jù))和連續(xù)數(shù)據(jù)A.離散數(shù)據(jù)的特點(diǎn):a.離散數(shù)據(jù),變量的數(shù)值在變化上是有限的,數(shù)值與數(shù)值之間無(wú)法找到跟小單位的數(shù)值(如人數(shù)、性別、國(guó)籍等)b.離散數(shù)據(jù)的所有取值在數(shù)學(xué)上是不連續(xù)的,所有取值的數(shù)目是有限的,可以一一列舉,相鄰的兩個(gè)取值之間不能再取中間值。c.離散數(shù)據(jù)往往只能取整數(shù),不能無(wú)限細(xì)分。B.連續(xù)數(shù)據(jù)的特點(diǎn):a..連續(xù)數(shù)據(jù),如果技術(shù)允許,數(shù)值可以無(wú)限分割(如身高、體重等)b.連續(xù)數(shù)據(jù)是指在一定范圍內(nèi)連續(xù)變化、取值無(wú)限多的變量,不能一一列舉。如人數(shù)是離散數(shù)據(jù)c.長(zhǎng)度、溫度、重量、時(shí)間等都是連續(xù)數(shù)據(jù)Q:心理測(cè)驗(yàn)或教育考試中五分制得分和百分制得分屬于哪一種數(shù)據(jù)(離散or連續(xù))?A:五分制是離散數(shù)據(jù)。一般將百分制近似地看作連續(xù)數(shù)據(jù)。Q:心理測(cè)驗(yàn)或教育考試中五分制得分和百分制得分分別屬于哪一種數(shù)據(jù)(稱(chēng)名、順序、等距、等比)?A:五分制是順序數(shù)據(jù)。一般將百分制近似地看作等距數(shù)據(jù)。通常將量表分?jǐn)?shù)也近似看作等距數(shù)據(jù)。通常來(lái)說(shuō):稱(chēng)名數(shù)據(jù)和順序數(shù)據(jù)是離散型數(shù)據(jù)(不可任何運(yùn)算)等距數(shù)據(jù)和比率數(shù)據(jù)是連續(xù)型數(shù)據(jù)(可加、減)注意事項(xiàng):數(shù)據(jù)類(lèi)型:是本門(mén)課程的基礎(chǔ),是心理學(xué)量化研究的基礎(chǔ),務(wù)必爛熟于心!!離散/連續(xù):正確區(qū)分連續(xù)變量(等距與比率)與離散變量(稱(chēng)名與順序),方能選用正確的統(tǒng)計(jì)方法。2統(tǒng)計(jì)圖表注意事項(xiàng):統(tǒng)計(jì)表的標(biāo)題位于上方統(tǒng)計(jì)圖的圖題位于下方常用統(tǒng)計(jì)圖(1)條形圖離散型data(2)圓形圖間斷性data(3)線性圖連續(xù)性data(4)散點(diǎn)圖兩列變量均為連續(xù)性data3集中量數(shù)集中量,用來(lái)表現(xiàn)數(shù)據(jù)資料的典型水平或集中趨勢(shì)(centraltendency)。常用的集中量包括算術(shù)平均數(shù)、加權(quán)平均數(shù)、調(diào)和平均數(shù)、中(位)數(shù)和眾數(shù)等等。3.1算術(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticaverage)一般簡(jiǎn)稱(chēng)為平均數(shù)(average)或均數(shù)、均值(mean)。一般用M,或者用表示。算術(shù)平均數(shù)是應(yīng)用最普遍的一種集中量。3.1.1算術(shù)平均數(shù)的計(jì)算公式注:3.1.2平均數(shù)的性質(zhì)(1)即:觀測(cè)值與平均數(shù)之差(稱(chēng)為離差)的總和為零。(2)每個(gè)觀測(cè)值都加上一個(gè)常數(shù)C后,計(jì)算得到的平均數(shù)等于原平均數(shù)加上這個(gè)常數(shù)。(3)每個(gè)觀測(cè)值都乘以一個(gè)常數(shù)C后,計(jì)算得到的平均數(shù)等于原平均數(shù)乘以這個(gè)常數(shù)。(4)一組數(shù)據(jù)中最小的是:即:各觀測(cè)值與算術(shù)平均數(shù)之差(離差)的平方和最小。3.1.3算術(shù)平均數(shù)的意義算術(shù)平均數(shù)是是“真值”(truescore)的最佳估計(jì)值。真值是反映某種現(xiàn)象的真實(shí)水平的分?jǐn)?shù)。由于測(cè)量過(guò)程中的各種偶然因素的影響,真值往往很難得到。在實(shí)際測(cè)量中,往往采用“多次測(cè)量,取平均數(shù)”的方法,用平均數(shù)去估計(jì)真值。3.1.4算術(shù)平均數(shù)的優(yōu)缺點(diǎn)算術(shù)平均數(shù)具備一個(gè)良好的集中量所應(yīng)具備的一些特點(diǎn):反應(yīng)靈敏;嚴(yán)密確定;簡(jiǎn)明易懂;適合進(jìn)一步代數(shù)運(yùn)算;與中位數(shù)、眾數(shù)相比,受抽樣變動(dòng)影響較小等等。主要不足:容易受兩極端數(shù)值的影響;如有模糊不清的數(shù)值時(shí),無(wú)法計(jì)算。3.1.5計(jì)算和應(yīng)用算術(shù)平均數(shù)的原則同質(zhì)性原則:算術(shù)平均數(shù)只能用于表示同類(lèi)數(shù)據(jù)的集中趨勢(shì)。平均數(shù)與個(gè)體數(shù)值相結(jié)合的原則:在解釋個(gè)體特征時(shí),既要看平均數(shù),也要結(jié)合個(gè)體的數(shù)據(jù)。平均數(shù)與標(biāo)準(zhǔn)差、方差相結(jié)合原則:描述一組數(shù)據(jù)時(shí)既要分析其集中趨勢(shì),也要分析離散程度。3.2中位數(shù)中位數(shù)(median)又稱(chēng)為中數(shù),是按順序排列的一組數(shù)據(jù)中位于中間位置的數(shù)。中位數(shù)是常用集中量的一種。一般用Md或Mdn表示。3.2.1中位數(shù)的計(jì)算方法首先將一組數(shù)據(jù)按順序排列:3.2.2中位數(shù)的優(yōu)缺點(diǎn)中位數(shù)的優(yōu)點(diǎn)中位數(shù)是根據(jù)全部數(shù)據(jù)的個(gè)數(shù)來(lái)確定其位置的,意義簡(jiǎn)明;對(duì)按順序排列的數(shù)據(jù)來(lái)講,計(jì)算中位數(shù)也比較容易;中位數(shù)不受兩端極端數(shù)據(jù)的影響中位數(shù)的缺點(diǎn)反應(yīng)不靈敏;不適合進(jìn)一步代數(shù)運(yùn)算的要求。3.2.3中位數(shù)的適用條件一組數(shù)據(jù)中有極端數(shù)據(jù)時(shí);一組數(shù)據(jù)中有個(gè)別數(shù)據(jù)不確切、不清楚時(shí);當(dāng)需要快速估計(jì)一組數(shù)據(jù)的代表值時(shí),也常用中數(shù)資料屬于等級(jí)性質(zhì)時(shí)。3.3眾數(shù)眾數(shù)(mode)用Mo表示,有兩種定義:理論眾數(shù)是指與頻數(shù)分布曲線最高點(diǎn)相對(duì)應(yīng)的橫坐標(biāo)上的一點(diǎn);粗略眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)數(shù)。眾數(shù)也是一種集中量,也可用來(lái)表示一組數(shù)據(jù)的集中趨勢(shì)。3.3.1眾數(shù)的計(jì)算方法觀察法尋找粗略眾數(shù):數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)即為眾數(shù)。公式法計(jì)算理論眾數(shù)的近似值:用公式計(jì)算的眾數(shù)稱(chēng)為理論眾數(shù)。一般在心理與教育統(tǒng)計(jì)中常用的公式有皮爾遜的經(jīng)驗(yàn)公式和金氏插補(bǔ)法公式。皮爾遜經(jīng)驗(yàn)公式:皮爾遜經(jīng)驗(yàn)公式只有當(dāng)數(shù)據(jù)分布呈正態(tài)或接近正態(tài)時(shí)才能使用。當(dāng)數(shù)據(jù)分布呈偏態(tài)時(shí),一般用金氏插補(bǔ)法計(jì)算眾數(shù)。第三節(jié)差異量數(shù)1.變異性(variability):反映數(shù)值與數(shù)值之間的不同。例如:第一組數(shù)據(jù)7,6,3,3,1第二組數(shù)據(jù)3,4,4,4,5具有與之相同的均值(4),但變異性呢?第三組數(shù)據(jù)4,4,4,4,4根本沒(méi)有變異性——數(shù)值之間無(wú)差異,但和前面兩組具有相同的均值。2.變異性(離散程度、離散度、離中趨勢(shì))可被視為:對(duì)不同數(shù)值之間的差異性的測(cè)量。2.1更精確地說(shuō):把變異性看作一組數(shù)據(jù)中每個(gè)數(shù)值與特定值的差異程度。通常來(lái)說(shuō),這個(gè)“特定值”就是均值。因此,變異性可看作一組數(shù)據(jù)中每一個(gè)數(shù)值與均值的差異性的量數(shù)。3.1集中量數(shù)(典型性/代表性),一組數(shù)據(jù)的代表數(shù)值3.2差異量數(shù)(變異性/離散度),不同數(shù)值和一個(gè)數(shù)值的差異性3.3集中、差異量數(shù)可共同用于描述數(shù)據(jù)分布的特征,并說(shuō)明數(shù)據(jù)分布的差異第二章數(shù)據(jù)的圖表描述與特征量引子某研究者得到以下兩組成績(jī):兩組分?jǐn)?shù)是否一樣?為什么?哪組均值的代表性更好?為什么?一、全距、平均差和四分位差(一)全距(range):(二)平均差(averagedeviation),平均差是總體所有單位與其算術(shù)平均數(shù)的離差絕對(duì)值的算術(shù)平均數(shù)。常用AD表示。普通平均差計(jì)算公式:加權(quán)平均差計(jì)算公式:負(fù)偏態(tài)和正偏態(tài)均數(shù)<中位數(shù)<眾數(shù)眾數(shù)<中位數(shù)<均數(shù)(三)四分(位)差又稱(chēng)四分位距,常用Q表示。剔除掉整組觀測(cè)值中最高的1/4和最低的1/4的數(shù)據(jù),然后計(jì)算中間的一半數(shù)據(jù)的全距,再除以2而得到。Q2正好是中位數(shù)Q1,Q2和Q3分別被稱(chēng)為第一、第二和第三四分位數(shù)。練習(xí):計(jì)算過(guò)程:二、方差與標(biāo)準(zhǔn)差(一)定義A.方差(又稱(chēng)為變異數(shù)、均方)。是表示一組數(shù)據(jù)離散程度的統(tǒng)計(jì)指標(biāo)。一般樣本的方差用表示,總體的方差用表示。B.標(biāo)準(zhǔn)差(standarddeviation)是方差的算術(shù)平方根。一般樣本的標(biāo)準(zhǔn)差用S表示,總體的標(biāo)準(zhǔn)差用表示。C.標(biāo)準(zhǔn)差和方差是描述數(shù)據(jù)離散程度的最常用的差異量。計(jì)算公式(考過(guò)選擇題):一般樣本的標(biāo)準(zhǔn)差另外,簡(jiǎn)便算法:一般樣本的標(biāo)準(zhǔn)差=總體的方差的平方根??傮w的標(biāo)準(zhǔn)差總體的方差?練習(xí):(應(yīng)用知識(shí)點(diǎn):一般樣本的標(biāo)準(zhǔn)差=總體的方差的平方根)為n個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量的平方和(卡方分布)這時(shí),總體的方差=卡方分布/n-1?練習(xí):試估計(jì)49、50、51的均數(shù)和標(biāo)準(zhǔn)差。(三)標(biāo)準(zhǔn)差的性質(zhì)性質(zhì)1:每個(gè)觀測(cè)值都加一個(gè)相同的常數(shù)C后,計(jì)算得到的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差性質(zhì)2:每個(gè)觀測(cè)值都乘以一個(gè)相同的常數(shù)C后,計(jì)算得到的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù)性質(zhì)3:每一個(gè)觀測(cè)值都乘以一個(gè)相同的常數(shù)C(C≠0),再加上一個(gè)常數(shù)d所得的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以一個(gè)常數(shù)比較:平均數(shù)與標(biāo)準(zhǔn)差的性質(zhì)(四)方差與標(biāo)準(zhǔn)差的意義標(biāo)準(zhǔn)差度量的是觀測(cè)值與平均數(shù)間的平均距離?!郤=0代表觀測(cè)值完全沒(méi)有散布(全都在同一點(diǎn)),否則必然有S﹥0。當(dāng)觀測(cè)值離平均數(shù)散布得越遠(yuǎn),S就越大。(五)標(biāo)準(zhǔn)差的應(yīng)用典例:一個(gè)班級(jí)男生身高的平均數(shù)是1.75米,標(biāo)準(zhǔn)差是0.10米;體重的平均數(shù)是60千克,體重的標(biāo)準(zhǔn)差是5千克,問(wèn)身高和體重哪個(gè)差異大?答:?jiǎn)挝徊煌荒鼙容^典例:同樣是跳遠(yuǎn),大學(xué)生的平均成績(jī)是4米,標(biāo)準(zhǔn)差為0.3米;一年級(jí)學(xué)生的平均成績(jī)是1米,標(biāo)準(zhǔn)差為0.3米,這兩個(gè)差異是一樣大小嗎?答:顯然也不是,因?yàn)榇髮W(xué)生成績(jī)的相對(duì)差異比較小,而小學(xué)生成績(jī)的相對(duì)差異比較大。1.差異系數(shù)(1)當(dāng)兩組或幾組數(shù)據(jù)資料單位不同時(shí),不能直接用標(biāo)準(zhǔn)差來(lái)比較離散程度的大??;(2)當(dāng)兩組或幾組數(shù)據(jù)資料單位相同時(shí),但它們的平均數(shù)相差較大時(shí),也不能直接根據(jù)標(biāo)準(zhǔn)差來(lái)比較它們的離散程度;差異系數(shù)的應(yīng)用:(1)比較測(cè)量單位不同事物的差異程度;一個(gè)班級(jí)男生身高的平均數(shù)是1.75米,標(biāo)準(zhǔn)差是0.10米;體重的平均數(shù)是60千克,體重的標(biāo)準(zhǔn)差是5千克,問(wèn)身高和體重哪個(gè)差異大?(2)比較單位相同,均數(shù)懸殊者例:初三甲乙兩班的數(shù)學(xué)平均成績(jī)分別為92和71,標(biāo)準(zhǔn)差分別為8.95和7.40。試問(wèn)兩班成績(jī)誰(shuí)的差異程度大一些?第四節(jié)地位量數(shù)百分位數(shù)百分等級(jí)數(shù)Q2正好是中位數(shù)Q1,Q2和Q3分別被稱(chēng)為第一、第二和第三四分位數(shù)。如果將數(shù)據(jù)分為100段,Q1,Q2和Q3分別被稱(chēng)為第25、第50和第75百分位數(shù)。一、百分位(分)數(shù)定義:團(tuán)體分?jǐn)?shù)高低排序,計(jì)算某個(gè)百分位數(shù)位置所對(duì)應(yīng)的數(shù)值(觀測(cè)值)。例:表示在該次數(shù)分布中,有20%的個(gè)案低于6060就是該組數(shù)據(jù)的第20個(gè)百分位數(shù)表示在該次數(shù)分布中,有75%的個(gè)案低于25表示在該次數(shù)分布中,有30%的個(gè)案低于55二、百分等級(jí)(分)數(shù)定義:是百分位數(shù)的逆運(yùn)算。符號(hào):例:小張某次考試成績(jī)?yōu)?5分,且PR=90含義是:此次考試有90%的人的成績(jī)低于85分或此次考試中有10%的人成績(jī)高于小張引子:概率Probability例:你買(mǎi)彩票中500萬(wàn)的機(jī)會(huì)很小(接近0),但有人中大獎(jiǎng)的概率幾乎為1你被流星擊中的概率很小(接近0),但每分鐘有流星擊中地球的概率為1今天你被汽車(chē)撞上的概率幾乎是0,但在地球每天發(fā)生車(chē)禍的概率是1第三章隨機(jī)事件與概率分布第一節(jié)隨機(jī)事件一、隨機(jī)現(xiàn)象和隨機(jī)事件(一)隨機(jī)現(xiàn)象1.什么是隨機(jī)現(xiàn)象2.隨機(jī)現(xiàn)象的特點(diǎn):偶然性、規(guī)律性偶然性VS.規(guī)律性——死亡的概率我們能預(yù)測(cè)特定的人明年會(huì)死亡嗎?如果我們觀察好幾百萬(wàn)人呢?據(jù)美國(guó)國(guó)家衛(wèi)生統(tǒng)計(jì)中心,20-24歲的男性當(dāng)中,在任一年中死亡的比例大約是0.0015。同年齡層的女性,死亡概率大約是0.0005。(正因?yàn)槟行岳碣r的比例要高一些,所以保險(xiǎn)費(fèi)會(huì)收得多一點(diǎn))(二)隨機(jī)事件(Randomevents)例:請(qǐng)判斷下列事件是屬于事件之和or事件之積:共8個(gè)題目,6個(gè)選擇,2個(gè)判斷,隨機(jī)從中抽出一個(gè)題從中抽出選擇題或判斷題是屬于事件之(和)計(jì)算從中抽出選擇題或判斷題的概率是屬于(互不相容)事件?練習(xí):請(qǐng)判斷下列事件是否屬于獨(dú)立事件拋一枚硬幣然后再擲一個(gè)骰子(獨(dú)立)起床太晚和準(zhǔn)時(shí)上課(非獨(dú)立)認(rèn)真學(xué)習(xí)和拿獎(jiǎng)學(xué)金(非獨(dú)立)例:假設(shè)從2223名登上泰坦尼克號(hào)的乘客中隨機(jī)選出1人,思考下列問(wèn)題:計(jì)算P(選出一個(gè)man或一個(gè)boy),是屬于事件之(和),是屬于(互不相容)事件提示:計(jì)算P:(1692+64)/2223=1756/2223?練習(xí):將一枚硬幣拋三次,得到的全部是國(guó)徽的概率是多少?如果從一組包含10名男性和15名女性的組中沒(méi)有放回地隨機(jī)選出3個(gè)不同的人,則選出3名男性的概率是多少?(提示:10/25*9/24*8/23)二、隨機(jī)事件的概率對(duì)隨機(jī)事件的觀測(cè)或試驗(yàn)可能有多種結(jié)果?不僅想知道有哪些可能的結(jié)果,還想知某些結(jié)果出現(xiàn)的可能性的大小。這一可能性用數(shù)字來(lái)表示就是概率(一)頻率與概率頻率是大量試驗(yàn)的結(jié)果,隨試驗(yàn)次數(shù)變化的值概率是一個(gè)確定值試驗(yàn)次數(shù)越多,頻率將無(wú)限接近于概率頻率是事件發(fā)生的外在表現(xiàn),概率體現(xiàn)事件發(fā)生的內(nèi)在實(shí)質(zhì)。頻率與概率間的關(guān)系:樣本頻率總是圍繞概率上下波動(dòng)樣本含量n越大,波動(dòng)幅度越小,頻率越接近概率。說(shuō)明:隨機(jī)變量例:每次拋兩個(gè)硬幣,記錄正、反面結(jié)果;結(jié)果可記錄為:硬幣1正面朝上,硬幣2正面朝上;2個(gè)正面硬幣1正面朝上,硬幣2反面朝上;1個(gè)正面硬幣1反面朝上,硬幣2正面朝上;1個(gè)正面硬幣1反面朝上,硬幣2反面朝上;0個(gè)正面正面出現(xiàn)的次數(shù)就是一個(gè)隨機(jī)變量,記為x,我們通常對(duì)x的每個(gè)取值的概率感興趣。對(duì)于本例,x的取值為0、1、2。說(shuō)明:離散型隨機(jī)變量與連續(xù)型隨機(jī)變量離散型隨機(jī)變量:數(shù)據(jù)間有縫隙,其取值可以列舉。例如:拋硬幣10次,正面的可能取值x為0、1、2、3、4、5、6、7、8、9、10連續(xù)型隨機(jī)變量(continousrandomvariable)數(shù)據(jù)間無(wú)縫隙,其取值充滿整個(gè)區(qū)間,無(wú)法一一列舉每一可能值。例如:身高、體重、百分制考試成績(jī)?nèi)?、概率分布(probabilitydistribution)概率分布:描述隨機(jī)變量值及這些值對(duì)應(yīng)概率的表格、公式或圖形。離散型隨機(jī)變量概率分布連續(xù)型隨機(jī)變量概率分布例:離散型隨機(jī)變量的概率分布:例:離散型隨機(jī)變量的概率分布:連續(xù)型隨機(jī)變量的概率分布變量的取值充滿整個(gè)數(shù)值區(qū)間,無(wú)法一一列出其每一個(gè)可能值。一般將連續(xù)型隨機(jī)變量整理成頻數(shù)表,對(duì)頻數(shù)作直方圖,直方圖的每個(gè)矩形頂端連接的階梯形曲線來(lái)描述連續(xù)型變量的頻數(shù)分布。如果樣本量很大,組段很多,矩形頂端組成的階梯型曲線可變成光滑的分布曲線。大多數(shù)情況下,可采用一個(gè)函數(shù)擬合這一光滑曲線。引子:常用的概率分布離散型隨機(jī)變量分布:二項(xiàng)分布、泊松分布連續(xù)型隨機(jī)變量分布:正態(tài)分布第二節(jié)(一)二項(xiàng)分布毒性試驗(yàn):白鼠死亡——生存臨床試驗(yàn):病人治愈——未愈回答題目:判斷題答對(duì)——答錯(cuò)事件成功(A)——失?。ǚ茿)這類(lèi)“成功─失敗型”試驗(yàn)稱(chēng)為Bernoulli試驗(yàn)例:一位心理學(xué)家想了解兒童對(duì)于某種材料的再認(rèn)能力。設(shè)計(jì)了10個(gè)記憶項(xiàng)目,先讓兒童識(shí)記,然后進(jìn)行再認(rèn)測(cè)驗(yàn)。結(jié)果兒童能正確再認(rèn)5個(gè)項(xiàng)目。請(qǐng)判斷:該兒童對(duì)這種材料究竟有沒(méi)有再認(rèn)能力。答:10個(gè)項(xiàng)目認(rèn)對(duì)了50%,完全可能是瞎猜的結(jié)果??梢哉J(rèn)為該兒童對(duì)于這種材料完全沒(méi)有什么再認(rèn)能力。作為研究者,不能憑感覺(jué)說(shuō)話。要研究類(lèi)似上述問(wèn)題有沒(méi)有數(shù)量規(guī)律性,以便找出一個(gè)數(shù)字標(biāo)準(zhǔn):超過(guò)這個(gè)標(biāo)準(zhǔn),就認(rèn)為有再認(rèn)能力,未達(dá)到這個(gè)標(biāo)準(zhǔn),就認(rèn)為沒(méi)有再認(rèn)能力。(二)二項(xiàng)試驗(yàn)二項(xiàng)試驗(yàn)必須滿足以下條件:這個(gè)過(guò)程包括一個(gè)固定次數(shù)的試驗(yàn)。每次試驗(yàn)的所有結(jié)果都可以分為兩類(lèi);各次試驗(yàn)相互獨(dú)立(即任何一次單獨(dú)試驗(yàn)的結(jié)果都不影響其他試驗(yàn)中結(jié)果的概率);各次試驗(yàn)中概率必須是常數(shù)(即成功的概率恒定,失敗的概率也恒定)。例:114查號(hào)臺(tái)聲稱(chēng),當(dāng)用戶查詢電話號(hào)碼時(shí),90%的情況下會(huì)得到正確的電話號(hào)碼。假設(shè)回答的正確率為90%,假如我們想在5次查詢中有3次回答正確的概率。(1)這個(gè)過(guò)程是一個(gè)二項(xiàng)分布嗎?(2)如果這個(gè)過(guò)程的結(jié)果是一個(gè)二項(xiàng)分布,請(qǐng)說(shuō)明n,x,p和q的值。解答:試驗(yàn)次數(shù)5是固定的;n=5,x=35次試驗(yàn)是獨(dú)立的,使用的是不同的電話號(hào)碼,接線員也不同;5次試驗(yàn)中的每個(gè)試驗(yàn)都有兩類(lèi)結(jié)果:要么對(duì),要么錯(cuò);p=q=1/25次試驗(yàn)中的每個(gè)試驗(yàn),概率0.9(90%)是常數(shù)。例:假設(shè)每年9月份的降水概率為0.4。假設(shè)30天的降水次數(shù)為X,20年中9月份降水的分布即為一個(gè)二項(xiàng)分布。p=0.4,q=0.6,n=30;X取值[0,30]如果20年的X值分別為:15,18,11,12,11,16,14,12,10,12,13,14,13,14,12,8,9,10,12,13降水次數(shù)時(shí)間(三)二項(xiàng)分布函數(shù)用n次方的二項(xiàng)展開(kāi)式來(lái)表達(dá)在n次二項(xiàng)試驗(yàn)中成功事件出現(xiàn)的不同次數(shù)(X=0,1…)的概率分布,叫做二項(xiàng)分布函數(shù)。1.二項(xiàng)式概率分布函數(shù):2.二項(xiàng)展開(kāi)式的要點(diǎn):項(xiàng)數(shù):二項(xiàng)展開(kāi)式中共有n+1項(xiàng)。方次:p的方次,從n→0為降冪;q的方次從0→n為升冪。每項(xiàng)p與q方次之和等于n。系數(shù):各項(xiàng)系數(shù)是成功事件次數(shù)的組合數(shù)。例:2道是非題的情況3道是非題的情況4道是非題的情況例:1、從男生占2/5的學(xué)校中隨機(jī)抽?。秱€(gè)學(xué)生,問(wèn)正好抽到4個(gè)男生的概率是多少?最多抽到2個(gè)男生的概率是多少?解:將n=6,p=2/5,q=3/5,X=4代入公式,則恰好抽到4個(gè)男生的概率為2、接上,最多抽到2個(gè)男生的概率,等于1個(gè)也沒(méi)有抽到、抽到1個(gè)和抽到兩個(gè)男生的概率之和,即3.二項(xiàng)分布曲線形成:以成功次數(shù)為X,組合數(shù)為Y繪制的多邊圖。特點(diǎn)(二項(xiàng)分布的性質(zhì)):當(dāng)時(shí),不論n有多大,二項(xiàng)分布曲線都總是對(duì)稱(chēng)的;當(dāng)時(shí),且n相當(dāng)小,圖形呈偏態(tài);當(dāng)相當(dāng)大(≥30)時(shí),圖形逐漸接近正態(tài)分布。4.二項(xiàng)分布的應(yīng)用(1)求成功事件恰好出現(xiàn)X次的概率(2)在教育與心理中主要用來(lái)判斷試驗(yàn)結(jié)果的機(jī)遇性與真實(shí)性的界限。5.二項(xiàng)分布的平均數(shù)和標(biāo)準(zhǔn)差如果二項(xiàng)分布滿足p>q且nq≥5(或者p<q且np≥5時(shí)),二項(xiàng)分布接近于正態(tài)分布。(應(yīng)用前提)可用下面的方法計(jì)算:注意——應(yīng)用前提:可信度水平:應(yīng)用——猜測(cè)性:例:某測(cè)驗(yàn)中有10道判斷題,試分析學(xué)生的掌握情況或猜測(cè)的可能性。①條件分析:②求均數(shù)和標(biāo)準(zhǔn)差:③確定一定可信度時(shí)的掌握程度:④結(jié)果解釋例:例:某測(cè)驗(yàn)有30個(gè)正誤題,試問(wèn)學(xué)生要做對(duì)多少題,才屬掌握了所學(xué)的內(nèi)容。例:一個(gè)教師對(duì)8個(gè)學(xué)生的作業(yè)成績(jī)進(jìn)行猜測(cè),如果教師猜對(duì)的可能性為1/3,問(wèn):假如規(guī)定猜對(duì)95%,才算這個(gè)教師有一定的評(píng)判能力,那么這個(gè)教師至少要猜對(duì)幾個(gè)學(xué)生?例:假設(shè)把一個(gè)質(zhì)地均勻的硬幣拋3次,這時(shí)你和朋友打賭:著地時(shí)出現(xiàn)“正面”會(huì)有2次,賭注為10元。如果這種結(jié)果出現(xiàn)了,你的朋友必須給你10元錢(qián)。誰(shuí)更有可能贏呢?例:有20道四擇一題,試問(wèn)學(xué)生要做對(duì)多少題,才屬掌握了所學(xué)的內(nèi)容??尚哦人?6.二項(xiàng)試驗(yàn)必須滿足的條件有:這個(gè)過(guò)程包括一個(gè)固定次數(shù)的試驗(yàn);每次試驗(yàn)的所有結(jié)果都可以分為兩類(lèi);各次試驗(yàn)相互獨(dú)立(即任何一次單獨(dú)試驗(yàn)的結(jié)果都不影響其他試驗(yàn)中結(jié)果的概率);各次試驗(yàn)中概率必須是常數(shù)(即成功的概率恒定,失敗的概率也恒定)。7.二項(xiàng)(式概率)分布函數(shù):例:從男生占2/5的學(xué)校中隨機(jī)抽?。秱€(gè)學(xué)生,問(wèn)正好抽到4個(gè)男生的概率是多少?最多抽到2個(gè)男生的概率是多少?解:將n=6,p=2/5,q=3/5,X=4代入公式,則恰好抽到4個(gè)男生的概率為最多抽到2個(gè)男生的概率:等于1個(gè)也沒(méi)有抽到、抽到1個(gè)和抽到兩個(gè)男生的概率之和例:一塊均勻的硬幣,A為正面朝上,B為反面朝上。假設(shè)n=2(拋兩次),有多少可能的結(jié)果?①兩次正面朝上的p?(1/4)②拋不到正面朝上的p?(1/4)③只有一次正面的p?(1/2)④至少一次正面的p(1/2+1/4=3/4)?什么條件下,二項(xiàng)分布可以近似為正態(tài)分布?n足夠大的時(shí)候8.二項(xiàng)分布曲線形成:以成功次數(shù)為X,組合數(shù)為Y繪制的多邊圖。特點(diǎn)(二項(xiàng)分布的性質(zhì)):當(dāng)時(shí),不論n有多大,二項(xiàng)分布曲線都總是對(duì)稱(chēng)的;當(dāng)時(shí),且n相當(dāng)小,圖形呈偏態(tài);當(dāng)相當(dāng)大(≥30)時(shí),圖形逐漸接近正態(tài)分布。9.二項(xiàng)分布的應(yīng)用(1)求成功事件恰好出現(xiàn)X次的概率?(2)在教育與心理中主要用來(lái)判斷試驗(yàn)結(jié)果的機(jī)遇性與真實(shí)性的界限。第三節(jié)正態(tài)分布(NormalD.)一、正態(tài)分布的特征二、標(biāo)準(zhǔn)正態(tài)分布表利用積分公式可求出正態(tài)曲線下任何區(qū)間的面積,但需要計(jì)算,非常麻煩。統(tǒng)計(jì)學(xué)家已編制好了標(biāo)準(zhǔn)正態(tài)分布表,使其使用非常方便。(見(jiàn)教材后的附表)1.正態(tài)分布表的使用(詳細(xì)看教材):Z→P,P→Z,P→Y或Z→Y①Z→P求某個(gè)Z值以上或以下的面積-1.2~2.4p=0.876730.6~1.5p=0.20744求某個(gè)Z值以上或以下的面積Z=2.4以上Pp=0.0082Z=-1.2以下Pp=0.1151②P→Z查表法:近似結(jié)果P=0.80,Z=?p=.29955,Z=.84p=.30234,Z=.85③P→Y查表法:P=0.80,Y=?P=.29955,Y=.28034P=.30234,Y=.27798④PR與Z的關(guān)系Z值的計(jì)算公式:例:在一正態(tài)分布中,若某人的標(biāo)準(zhǔn)分?jǐn)?shù)為1,則他在該團(tuán)體中的百分等級(jí)應(yīng)當(dāng)為a.34b.68c.84d.75三、標(biāo)準(zhǔn)分?jǐn)?shù)標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore)又稱(chēng)基分?jǐn)?shù)或Z分?jǐn)?shù)(Z-score)是相對(duì)位置量數(shù)。標(biāo)準(zhǔn)分?jǐn)?shù)從分?jǐn)?shù)對(duì)平均數(shù)的相對(duì)地位、該組分?jǐn)?shù)的離中趨勢(shì)兩個(gè)方面來(lái)表示原始分?jǐn)?shù)的地位。標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算公式:(1)標(biāo)準(zhǔn)分?jǐn)?shù)的實(shí)質(zhì):把單位不等距和缺乏明確參照點(diǎn)的分?jǐn)?shù)轉(zhuǎn)換成以標(biāo)準(zhǔn)差為單位,以均數(shù)為參照點(diǎn)的量表分?jǐn)?shù)。(2)標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)點(diǎn):可比性:標(biāo)準(zhǔn)分?jǐn)?shù)以團(tuán)體的平均數(shù)為基準(zhǔn)(參照點(diǎn)),以標(biāo)準(zhǔn)差為單位,因而具有可比性??杉有裕簶?biāo)準(zhǔn)分?jǐn)?shù)使不同的原始分?jǐn)?shù)具有相同的參照點(diǎn)。明確性:標(biāo)準(zhǔn)分?jǐn)?shù)較原始分?jǐn)?shù)的意義更為明確。合理性:標(biāo)準(zhǔn)分?jǐn)?shù)保證了不同性質(zhì)的分?jǐn)?shù)在總分?jǐn)?shù)中的權(quán)重相同,使分?jǐn)?shù)更合理地反映事實(shí)。(3)標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用:用于比較幾個(gè)分屬性質(zhì)不同的觀測(cè)值在各自數(shù)據(jù)分布中相對(duì)位置的高低。(比較測(cè)量單位不同的變量的位置)計(jì)算不同質(zhì)的觀測(cè)值的總和或平均值,以表示在團(tuán)體中的相對(duì)位置。表示測(cè)驗(yàn)分?jǐn)?shù)d)比較單位不同變量的位置例:例:已知該班的成績(jī)情況如下表例:某高考中兩生各科成績(jī)?nèi)缦卤?。異常值的取舍:在一個(gè)正態(tài)分布中,平均數(shù)上下一定的標(biāo)準(zhǔn)差處,包含有確定百分?jǐn)?shù)的數(shù)據(jù)個(gè)數(shù)。在平均數(shù)上下各三個(gè)標(biāo)準(zhǔn)差的范圍內(nèi),分布著全部數(shù)據(jù)的99.73%,反言之,在三個(gè)標(biāo)準(zhǔn)差之外的數(shù)據(jù)不足0.27%,因此常把“三個(gè)標(biāo)準(zhǔn)差”做為判斷可疑值取舍的依據(jù)。四、正態(tài)分布表及其應(yīng)用:①韋氏智商分?jǐn)?shù):②選拔性測(cè)驗(yàn):eq\o\ac(○,3)在能力分組或等級(jí)評(píng)定時(shí)確定人數(shù)eq\o\ac(○,4)測(cè)驗(yàn)分?jǐn)?shù)的正態(tài)化(太復(fù)雜,不深究)例:假設(shè)對(duì)100名報(bào)考大學(xué)的學(xué)生進(jìn)行分班考試,要按能力將這些學(xué)生分為A、B、C、D、E五個(gè)小組(或等級(jí)),每組能力組距相等,若考試成績(jī)所測(cè)得的分?jǐn)?shù)是正態(tài)的,問(wèn)A、B、C、D、E各組應(yīng)當(dāng)分布幾名學(xué)生?分析步驟:當(dāng)時(shí),不論n有多大,二項(xiàng)分布曲線都總是對(duì)稱(chēng)的標(biāo)準(zhǔn)分?jǐn)?shù)的計(jì)算公式:例題:確定錄取分?jǐn)?shù)線(要求p/z/y中的哪一個(gè)?)某區(qū)要在2500名初三學(xué)生中選50名學(xué)生參加全市初中物理競(jìng)賽。已知該區(qū)初三上學(xué)期物理考試成績(jī)近似正態(tài)分布,且平均數(shù)57分,標(biāo)準(zhǔn)差16分。若以這次考試為準(zhǔn)來(lái)選拔參加競(jìng)賽的學(xué)生,分?jǐn)?shù)線應(yīng)定為多少?分?jǐn)?shù)線是p、z還是y?分析:①求入選率:例:某次考試,學(xué)生成績(jī)正態(tài)分布,n=200人,μ=66.78,σ=9.19,若表?yè)P(yáng)前20名,分?jǐn)?shù)線應(yīng)該是多少?①求入選率:例:已知某年級(jí)200名學(xué)生考試成績(jī)呈正態(tài)分布,μ=85分,σ=10分,學(xué)生甲的成績(jī)?yōu)?0分,問(wèn)全年級(jí)成績(jī)比學(xué)生甲低的學(xué)生人數(shù)是多少?(學(xué)生人數(shù)是p、z還是y?)例:假設(shè)500名學(xué)生的數(shù)學(xué)成績(jī)分布符合正態(tài)分布。且已知平均分70,標(biāo)準(zhǔn)差5分。試問(wèn)60~80分學(xué)生的人數(shù)分布為多少?分析:已知:N=500,M=70,SD=5,(P←Z←M,SD,X)eq\o\ac(○,1)第四章抽樣分布與參數(shù)估計(jì)第一節(jié)抽樣分布總體分布(populationdistribution):總體內(nèi)個(gè)體觀察值的次數(shù)分布或概率分布。樣本分布(sampledistribution):樣本內(nèi)個(gè)體觀察值的次數(shù)分布或概率分布。抽樣分布(samplingdistribution):樣本統(tǒng)計(jì)量的概率分布。一、抽樣分布與抽樣誤差估計(jì)(一)抽樣分布的定義(二)抽樣誤差:由抽樣的隨機(jī)性引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異。.標(biāo)準(zhǔn)誤定義:統(tǒng)計(jì)量在抽樣分布上的標(biāo)準(zhǔn)差。符號(hào):SE(StandardError)解釋?zhuān)篠E越小,樣本統(tǒng)計(jì)量與總體參數(shù)越接近,樣本對(duì)總體的代表性越好,用樣本統(tǒng)計(jì)量推斷總體也越可靠。?練習(xí):請(qǐng)問(wèn)下列標(biāo)準(zhǔn)誤的含義是什么?思考:試比較標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的異同。同:都是離中趨勢(shì)的指標(biāo)。異:S:一般變量值(原始數(shù)據(jù))離中趨勢(shì)的指標(biāo)。SE:樣本統(tǒng)計(jì)量離中趨勢(shì)的指標(biāo)。二、樣本平均數(shù)的抽樣分布(一)抽樣分布形態(tài)的影響因素:總體的分布形態(tài)樣本容量的大小要計(jì)算的統(tǒng)計(jì)量(二)中心極限定律若總體正態(tài),則從中抽取容量為n的一切可能樣本的均數(shù)分布也呈正態(tài);無(wú)論總體是否正態(tài),只要n足夠大,樣本均數(shù)的分布接近正態(tài)分布。(三)自由度定義:推斷統(tǒng)計(jì)中,變量值獨(dú)立自由變動(dòng)數(shù)值的數(shù)目。符號(hào):df(degreeoffreedom)例如:現(xiàn)有一個(gè)n=5的樣本,其樣本均值為6,若前4個(gè)數(shù)據(jù)可以隨意確定為3,6,7,9則第五個(gè)數(shù)據(jù)必須為5,因?yàn)槭艿健芚=30的限制,即df=n-1其中的1表示只有一個(gè)限制因素∑X=30注意:統(tǒng)計(jì)方法不同,自由度算法不同(四)常用的抽樣分布正態(tài)分布及漸近正態(tài)分布:t分布、F分布、1.正態(tài)及漸近正態(tài)分布總體正態(tài),已知,樣本均數(shù)分布為正態(tài)。2.t分布(1)定義:由小樣本統(tǒng)計(jì)量形成的概率分布。(2)特點(diǎn):對(duì)稱(chēng)分布曲線易變,不是一條而是一簇。n→∞時(shí),t分布與標(biāo)準(zhǔn)正態(tài)分布完全吻合(3)t分布的使用總體正態(tài),,n≤30時(shí),樣本平均數(shù)分布為t分布??傮w非正態(tài),,n>30,樣本均數(shù)的分布為t分布或漸近正態(tài)分布。第二節(jié)參數(shù)估計(jì)的基本原理一、推論統(tǒng)計(jì)概述(一)推論統(tǒng)計(jì)的定義(二)推論統(tǒng)計(jì)的主要內(nèi)容(三)統(tǒng)計(jì)推斷的有關(guān)問(wèn)題:統(tǒng)計(jì)推斷的前提——隨機(jī)抽樣樣本——一定的規(guī)模及代表性推斷錯(cuò)誤——一定限度二、參數(shù)估計(jì)的概念從不同的樣本得到的結(jié)論也不會(huì)完全一樣。雖然真實(shí)的平均數(shù)在這種抽樣過(guò)程中永遠(yuǎn)也不知道;但可以知道估計(jì)的均數(shù)和真實(shí)的均數(shù)大致差多少。三、良好點(diǎn)估計(jì)量的特征(1)無(wú)偏性:是指每個(gè)樣本產(chǎn)生的估計(jì)量的取值不一定等于參數(shù),但當(dāng)抽取大量樣本時(shí),那些樣本產(chǎn)生的估計(jì)量的均值會(huì)接近真正要估計(jì)的參數(shù)。(2)有效性:找方差最小的估計(jì)量∵方差小,說(shuō)明反復(fù)抽樣產(chǎn)生的許多估計(jì)量差別不大,因此更加精確?!渌麡?biāo)準(zhǔn)涉及大樣本的極限性質(zhì)四、區(qū)間估計(jì)的原理(置信度、可信度)術(shù)語(yǔ):置信區(qū)間、置信度、顯著性水平、置信限1.置信區(qū)間置信度,即置信概率,是指作出某種推斷時(shí)正確的可能性(概率)。置信區(qū)間,也稱(chēng)置信間距(confidenceinterval,CI)是指在某一置信度時(shí),總體參數(shù)所在的區(qū)域距離或區(qū)域長(zhǎng)度。(置信區(qū)間是帶有置信概率的取值區(qū)間)定義:特定可靠性下,估計(jì)總體參數(shù)所在的區(qū)間范圍。置信區(qū)間公式:比較:可信度水平:2.置信度:定義:被估計(jì)參數(shù)落在置信區(qū)間內(nèi)的概率。別名:置信水平、置信系數(shù)、置信概率、可信系數(shù)…3.顯著性水平對(duì)總體平均數(shù)進(jìn)行區(qū)間估計(jì)時(shí),置信概率表示做出正確推斷的可能性,但這種估計(jì)還是會(huì)有犯錯(cuò)誤的可能。顯著性水平(significancelevel)就是指估計(jì)總體參數(shù)落在某一區(qū)間時(shí),可能犯錯(cuò)誤的概率,用符號(hào)α表示。4.置信限定義:被估計(jì)總體參數(shù)所在區(qū)間的上、下界限??偨Y(jié):(1.96為置信度或置信水平)置信度是人為給定的,心理統(tǒng)計(jì)中常用95%和99%置信水平為95%時(shí),置信水平為99%時(shí),?練習(xí):某大學(xué)大學(xué)生睡眠時(shí)間平均為6小時(shí)。有95%的把握說(shuō)這個(gè)大學(xué)的學(xué)生平均睡眠時(shí)間在5到7個(gè)小時(shí)之間。(1)這里的[5,7]是什么?(置信區(qū)間)(2)95%是什么?(置信度或置信水平)影響置信區(qū)間大小的因素:、、(三)置信度與置信區(qū)間簡(jiǎn)而言之:點(diǎn)估計(jì)給出一個(gè)數(shù)字,用起來(lái)很方便;區(qū)間估計(jì)給出一個(gè)區(qū)間,說(shuō)起來(lái)留有余地;不像點(diǎn)估計(jì)那么絕對(duì)。思考:置信區(qū)間與置信度的關(guān)系如何?如果選擇99%而不是95%的水平。提高了置信水平,則增加了置信區(qū)間的寬度,降低了估計(jì)的精確性。要求:區(qū)間適度、置信度較高推論統(tǒng)計(jì)的小概率原則:在一個(gè)已知假設(shè)下,如果一個(gè)特定觀測(cè)事件的概率格外小,我們就認(rèn)為,這個(gè)假設(shè)很可能是不對(duì)的。第五章平均數(shù)的差異性t檢驗(yàn)在不同條件下測(cè)得不同的數(shù)據(jù)樣本后,必須對(duì)樣本數(shù)據(jù)的差異來(lái)源作出判斷:該差異是否意味著他們各自所在的總體存在差異?平均數(shù)存在差異,則需要判斷該差異是偶然因素引起的還是實(shí)驗(yàn)條件引起的第一節(jié)假設(shè)檢驗(yàn)的原理一、(一)假設(shè)產(chǎn)生差異的情況:樣本統(tǒng)計(jì)量與相應(yīng)總體參數(shù)的差異;兩個(gè)樣本統(tǒng)計(jì)量之間的差異;差異性質(zhì):真實(shí)差異:實(shí)驗(yàn)條件(系統(tǒng)因素)引起的(抽樣)誤差:在統(tǒng)計(jì)上是忽略不計(jì)的,不被視為真正的差異,即偶然因素引起的注意:假設(shè)檢驗(yàn)并不是對(duì)假設(shè)的正確性做出正確的判斷,而是對(duì)一個(gè)不確定問(wèn)題的決策過(guò)程,其結(jié)果從概率上很有可能是正確的,但不排除錯(cuò)誤的可能性。零假設(shè)和備選假設(shè)哪一個(gè)正確,這是確定性的,沒(méi)有概率可言。而可能犯錯(cuò)誤的是人。<1>虛無(wú)假設(shè)(無(wú)差/零假設(shè))定義:根據(jù)檢驗(yàn)結(jié)果予以拒絕或接受的假設(shè)內(nèi)容:假設(shè)兩個(gè)均數(shù)之間差異是誤差。表示:<2>研究假設(shè)(備擇假設(shè))定義:研究者希望證實(shí)的假設(shè)。內(nèi)容:假設(shè)兩均數(shù)之間存在真實(shí)的差異。表示:零假設(shè)(H0):“正在研究的兩個(gè)變量無(wú)關(guān)”或“變量之間無(wú)差異”如:卡路里每天的攝入量與體重?zé)o關(guān)。反應(yīng)時(shí)間與問(wèn)題解決能力無(wú)關(guān)。1年級(jí)的CECT-4平均成績(jī)與4年級(jí)無(wú)差異。男生與女生的平均數(shù)學(xué)成績(jī)無(wú)差異。POPMusic與Classic組平均記憶成績(jī)無(wú)差異。例(??迹合肓私鈪⑴c入學(xué)準(zhǔn)備項(xiàng)目的兒童與沒(méi)有參與的兒童在學(xué)習(xí)成績(jī)上是否存在差異。零假設(shè):參與入學(xué)準(zhǔn)備的兒童與沒(méi)有參與的平均成績(jī)無(wú)差異研究假設(shè):參與入學(xué)準(zhǔn)備的兒童與沒(méi)參與的平均成績(jī)有差異作為優(yōu)秀的工作者,就應(yīng)盡最大可能地去解釋?zhuān)簝蓚€(gè)群體之間的差異僅僅是由于入學(xué)準(zhǔn)備項(xiàng)目(系統(tǒng)因素)引起的,而不是其他任何因素或者因素的組合(誤差,如如父母受教育程度、家庭孩子的數(shù)量等等)。一旦消除了其他潛在的解釋變量,唯一留下的對(duì)差異的解釋就是入學(xué)準(zhǔn)備的影響。可以完全消除其他潛在的解釋變量?不可以!為什么?不能確定樣本的代表性——即所研究的樣本是否很好地代表總體。即使樣本能很好地代表總體,也始終存在影響結(jié)論的其他因素,而且在實(shí)驗(yàn)設(shè)計(jì)的過(guò)程中總會(huì)遺漏這些因素。因此,研究中始終存在錯(cuò)誤的可能性。那么,如果推斷考試成績(jī)的不同是由于是否參與入學(xué)準(zhǔn)備項(xiàng)目,就得承受一定的風(fēng)險(xiǎn)。實(shí)際上風(fēng)險(xiǎn)水平就是愿意執(zhí)行的統(tǒng)計(jì)顯著性水平。?思考:比較一組籃球隊(duì)員和一組足球隊(duì)員的跑步速度可能有一些我們不知道的偶然因素導(dǎo)致了差異。籃球隊(duì)員更強(qiáng)壯?或足球隊(duì)員進(jìn)行了更多的跑步練習(xí)?或兩組都進(jìn)行了額外的訓(xùn)練?測(cè)定速度的方式就有很多偶然因素:秒表、測(cè)試當(dāng)天的天氣……作為好的研究者,應(yīng)該——觀察到差異時(shí)消除偶然性因素,并評(píng)價(jià)其他可能導(dǎo)致群體差異的因素。如有目的的訓(xùn)練或營(yíng)養(yǎng)計(jì)劃,并分析這些因素如何影響速度。注意:研究報(bào)告與畢業(yè)論文。通常來(lái)說(shuō):只報(bào)告研究假設(shè),不報(bào)告零假設(shè)??荚嚂r(shí)全寫(xiě)(二)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是一種帶有概率性質(zhì)的反證法。其具體過(guò)程是:顯著性的含義兩個(gè)(或多個(gè))變量之間的差異是由系統(tǒng)因素影響的,而不是偶然性因素。換句話:兩個(gè)(或多個(gè))變量之間的差異是穩(wěn)定存在的,而不是抽樣誤差引起的。注意:差異的顯著性不是指差異的大小。顯著性:舉例說(shuō)明假定:母親工作和不工作的大學(xué)生對(duì)就業(yè)的態(tài)存在顯著差異。這里所說(shuō)的顯著性,是指兩個(gè)群體態(tài)度之間的任何差異是由于系統(tǒng)因素的影響;而不是偶然因素。而本案例中的系統(tǒng)因素是母親是否工作。需要表明:即使很確信兩種大學(xué)生群體之間的差異是由于母親的就業(yè)狀態(tài)引起的,但始終不能100%、絕對(duì)地、肯定地、毫無(wú)疑問(wèn)地或毫不含糊地確信這一點(diǎn)。這個(gè)結(jié)論是錯(cuò)誤的可能性始終存在,不論這個(gè)可能性有多小,多么微不足道——但始終存在!顯著性水平含義:拒絕零假設(shè)的概率。常用水平值:解釋?zhuān)褐庇^分析法;理論分析——小概率事件直觀分析:直觀分析:?思考:為什么顯著性有.05.01還有.001?好比一個(gè)身高180厘米的男生,可能愿意被認(rèn)為高于或等于180厘米,而不愿意說(shuō)他高于或等于155厘米,雖然這第二種說(shuō)法數(shù)學(xué)上沒(méi)有絲毫錯(cuò)誤。(三)小概率原理小概率事件:一次試驗(yàn)中發(fā)生可能性很小,大量重復(fù)試驗(yàn)終究發(fā)生的事件。≤0.05的隨機(jī)事件為小概率事件。檢驗(yàn):隨機(jī)樣本統(tǒng)計(jì)量在抽樣分布上出現(xiàn)的p≤0.05(或0.01),則以小概率事件拒絕Ho。假設(shè)檢驗(yàn)中,H0總是作為直接被檢驗(yàn)的假設(shè)。二、誤差分析,95%為真實(shí)差異,5%為誤差(一)檢驗(yàn)方法1、雙側(cè)(尾)檢驗(yàn)定義:拒絕性概率置于理論分布兩尾。使用:結(jié)果或方向不確定時(shí)。意義:只推斷有無(wú)差異,不斷言方向。例:2、單側(cè)(尾)檢驗(yàn)定義:拒絕性概率置于理論分布一尾。使用:結(jié)果或方向確定時(shí)。意義:即推斷有無(wú)差異,又?jǐn)嘌苑较颉n?lèi)型:右尾檢驗(yàn)、左尾檢驗(yàn)a.右尾檢驗(yàn)定義:拒絕性概率置于理論分布的右尾。使用:能確定一個(gè)總體
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)保理念下的綠色能源技術(shù)創(chuàng)新研究
- 電商平臺(tái)的可持續(xù)發(fā)展策略探討
- 現(xiàn)代商業(yè)空間中的傳統(tǒng)裝飾藝術(shù)探索
- 現(xiàn)代辦公環(huán)境下的電子競(jìng)技技術(shù)分析
- 廣州廣東廣州市南沙區(qū)退役軍人事務(wù)局招聘編外人員筆試歷年參考題庫(kù)附帶答案詳解
- 班級(jí)藝術(shù)教育的實(shí)施策略與效果評(píng)估
- 云浮2024年廣東云浮市云安區(qū)高村鎮(zhèn)衛(wèi)生院招聘汽車(chē)駕駛員筆試歷年參考題庫(kù)附帶答案詳解
- 單板行業(yè)綠色制造考核試卷
- 建筑石材的養(yǎng)護(hù)產(chǎn)品與使用方法考核試卷
- 電商平臺(tái)中的消費(fèi)者行為分析與預(yù)測(cè)研究
- 2025年上半年?yáng)|莞望牛墩鎮(zhèn)事業(yè)單位招考(10人)易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年度茶葉品牌加盟店加盟合同及售后服務(wù)協(xié)議
- 氧氣、乙炔工安全操作規(guī)程(3篇)
- 建筑廢棄混凝土處置和再生建材利用措施計(jì)劃
- 集裝箱知識(shí)培訓(xùn)課件
- 某縣城區(qū)地下綜合管廊建設(shè)工程項(xiàng)目可行性實(shí)施報(bào)告
- JJF(京) 92-2022 激光標(biāo)線儀校準(zhǔn)規(guī)范
- 普惠金融政策解讀
- 2024年疾控中心支部工作計(jì)劃范本
- 羊水栓塞的應(yīng)急預(yù)案演練腳本
- 餐飲服務(wù)保障措施、食品衛(wèi)生安全保障方案
評(píng)論
0/150
提交評(píng)論