心理統(tǒng)計(jì)學(xué)課件_第1頁
心理統(tǒng)計(jì)學(xué)課件_第2頁
心理統(tǒng)計(jì)學(xué)課件_第3頁
心理統(tǒng)計(jì)學(xué)課件_第4頁
心理統(tǒng)計(jì)學(xué)課件_第5頁
已閱讀5頁,還剩457頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

心理統(tǒng)計(jì)

教學(xué)計(jì)劃1.緒論、統(tǒng)計(jì)圖表、統(tǒng)計(jì)量數(shù)2.相關(guān)分析、概率與分布3.抽樣與參數(shù)估計(jì)4.假設(shè)檢驗(yàn)5.方差分析、回歸分析6.卡方檢驗(yàn)、非參數(shù)檢驗(yàn)、復(fù)習(xí)和測驗(yàn)注意事項(xiàng)統(tǒng)計(jì)是一門不易理解的“數(shù)學(xué)”人為的規(guī)定抽象的術(shù)語繁多的公式如何學(xué)習(xí)聽課、看書、做題、多思考上課帶紙、筆、計(jì)算器(機(jī))盡可能地在工作中應(yīng)用學(xué)到的知識緒論什么是統(tǒng)計(jì)學(xué)為什么需要統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)的分類描述統(tǒng)計(jì)和推論統(tǒng)計(jì) 現(xiàn)代統(tǒng)計(jì)理論的發(fā)展預(yù)備知識變量、連續(xù)變量和離散變量、符號1.什么是統(tǒng)計(jì)統(tǒng)計(jì)是任何方面的專家們用以支持其論點(diǎn)的一大堆數(shù)據(jù)統(tǒng)計(jì)是計(jì)算用以代表和解釋一堆數(shù)據(jù)的量數(shù)(如平均數(shù)與標(biāo)準(zhǔn)差)的方法統(tǒng)計(jì)是依少量數(shù)據(jù)(樣本)所提供的資料以估計(jì)預(yù)測某研究對象(總體)的方法統(tǒng)計(jì)為面對不確定狀況制定決策提供方法的科學(xué)2.為什么需要統(tǒng)計(jì)學(xué)?數(shù)據(jù)不能說明一切,但是是某種事實(shí)InGodwetrust.Othersbringdata.績效評定、升級留級我們需要概率來理解抽獎,保險,醫(yī)學(xué)試驗(yàn),工業(yè)質(zhì)量控制,天氣預(yù)報,運(yùn)動創(chuàng)傷,基因和現(xiàn)代物理在面對不確定情況下,統(tǒng)計(jì)是一種能夠幫助我們做出聰明決策的科學(xué)方法2.1趣味統(tǒng)計(jì)問題父親高兒子一定高賭徒的謬論倉促的結(jié)論出租車問題估計(jì)野生動物的存量賭徒的謬論甲:我準(zhǔn)備可以買車了!乙:哦,你升職了嗎?甲:沒有,但你知道這些年我一直在買彩票。乙:是的,每次你都買。甲:但我每次都沒有中獎。乙:那你為什么覺得你這次會中獎呢?甲:以前都沒中過,這次該輪到我了!倉促的結(jié)論英格蘭的Smith到美國的俄亥俄州某大學(xué)讀研究生。他從來沒有到過美洲,很多東西對他來說都很新奇。有一天,他從學(xué)校禮堂回宿舍時看到了兩只松鼠,令人驚奇的是兩只松鼠都是白色的。晚上email的時候,他把這個發(fā)現(xiàn)告訴了他的父母,他興奮地寫道:“…美國的松鼠都是白色的…”出租車問題國外某地的出租車較少,一位統(tǒng)計(jì)學(xué)者在該地的某街角等候出租車,眼看來了幾部出租車都載客而過,這位統(tǒng)計(jì)學(xué)者開始懷疑這個城市到底有幾部出租車,以致于不夠用。于是他開始記下載客而過的出租車車號,依次如下:

405,280,73,440,179

接著來了一部空車,載走了統(tǒng)計(jì)學(xué)者。

假如該城市出租車的編號是從1號開始連續(xù)編排下來,而且空的出租車走在城里做隨機(jī)性的環(huán)繞,那么,你若是這位統(tǒng)計(jì)學(xué)者,你將如何從上述記錄的資料來推測該城市共有幾部出租車?估計(jì)野生動物的存量在報紙雜志上,我們經(jīng)??吹侥撤N動物已瀕臨滅絕邊緣的報導(dǎo)??茖W(xué)家如何知道那些野生動物的數(shù)量呢?例如:鯨漫游在占全球表面積約2/3強(qiáng)的海洋內(nèi),而且大部分的時間又都潛伏在水底,我們?nèi)绾蝸砉烙?jì)各類鯨的存量呢?2.2常見統(tǒng)計(jì)問題本批產(chǎn)品是否是合格品?吸煙與得癌癥有關(guān)嗎?張三會于下屆選舉中獲勝嗎?3.統(tǒng)計(jì)的分類

3.1描述統(tǒng)計(jì)和推論統(tǒng)計(jì)描述統(tǒng)計(jì)我們的興趣只限于手頭現(xiàn)有的數(shù)據(jù),而不準(zhǔn)備把結(jié)果用來推論總體則稱為描述統(tǒng)計(jì)。例:每年來京旅游的人數(shù),平均每人在京停留的日數(shù),平均每人每天在京的花費(fèi),十年內(nèi)那一年創(chuàng)最高記錄推論統(tǒng)計(jì)任何對數(shù)據(jù)(即樣本)的處理導(dǎo)致預(yù)測或推論總體的統(tǒng)計(jì)稱為推論統(tǒng)計(jì)例:根據(jù)歷年數(shù)據(jù)預(yù)測來年可能來京旅游的人數(shù)3.2推論統(tǒng)計(jì)的分類估計(jì)張三想競選香港某區(qū)議員,他想估計(jì)一下可能有多少人會投票給他,于是他以隨機(jī)抽樣的方式,詢問100位有投票權(quán)的市民的意見,而后根據(jù)所得結(jié)果推論可能全區(qū)有多少人會選他檢驗(yàn)?zāi)臣彝ブ鲖D想知道她心中懷疑潔王牌洗衣粉的洗凈力是否比愛王牌洗衣粉強(qiáng)分類與選擇新制造的三種藥品中那幾種比目前所用的這種藥品有效4.現(xiàn)代統(tǒng)計(jì)理論發(fā)展的四個階段

4.1高爾頓和皮爾遜1899年高爾頓(SirFrancisGalton,1822~1911)的《NatureInheritance》一書的出版所有知識都基于統(tǒng)計(jì)基礎(chǔ)引入中數(shù)、創(chuàng)立相關(guān)概念、把成績評分和正態(tài)分布聯(lián)系起來卡爾.皮爾遜(KarlPearson,1857~1936)眾數(shù)、標(biāo)準(zhǔn)差、相關(guān)系數(shù)我不記得那時是幾歲,但是我記得是坐在高椅子上吮吸著大拇指,有人告訴我最好停止吮它,不然被吮的大拇指會變小。我把兩手的大拇指并排看了很久,它們似乎是一樣的,我對自己說:我看不出被吸吮的大拇指比另一個小,我懷疑她是否在騙我4.2費(fèi)雪1915年,費(fèi)雪(RonaldAylmerFisher,1890~1962)發(fā)表關(guān)于樣本相關(guān)系數(shù)統(tǒng)計(jì)量的精確分布的論文小樣本統(tǒng)計(jì)、估計(jì)量的判定準(zhǔn)則、最大似然估計(jì)抽樣技巧和隨機(jī)程序《StatisticalMethodsforResearchWorkers》和《DesignofExperiments》分別于1925年和1935年出版,對于統(tǒng)計(jì)有重大的影響費(fèi)氏提到有一位女士聲稱她能分辨出她的茶中牛奶是在泡茶之前或之后加入的,而后他描述一種實(shí)驗(yàn)計(jì)劃來證明或否定該女士的聲稱據(jù)說費(fèi)雪是個早熟的孩子,在很小的時候就已精通如球面三角之類艱深的學(xué)問。他曾對物理科學(xué)深感興趣,1912年自劍橋大學(xué)得到天文學(xué)的學(xué)士學(xué)位。4.3聶曼和伊根·皮爾遜第三個時期以1928年聶曼(JerzyNeyman)和伊根·皮爾遜(EgonPearson,卡爾·皮爾遜之子)的共同論文多篇的發(fā)表為開端介紹和強(qiáng)調(diào)諸如假設(shè)檢驗(yàn)中的第二種錯誤,檢驗(yàn)的power和置信區(qū)間之類的觀念4.4華德1939年,華德(AbrahamWald,1902~1950)論文關(guān)于順序抽樣(sequentialsampling)的論文的發(fā)表最大的貢獻(xiàn)之一是他介紹一種對統(tǒng)計(jì)問題的新看法(1945),那就是以對局的觀點(diǎn)去處理統(tǒng)計(jì)方面的問題,這就是今日所稱的統(tǒng)計(jì)決策理論(statisticaldecisiontheory)統(tǒng)計(jì)被視為以自然為對手的對局的藝術(shù)5.預(yù)備知識

5.1幾個概念和術(shù)語(1)隨機(jī)變量(P6)在一定的條件下觀測結(jié)果不確定(2)隨機(jī)變量的分類稱名變量、順序變量、等距變量、比率變量因變量和自變量Y=f(X)連續(xù)變量和離散變量連續(xù)變量在任何兩個取值之間都還可以細(xì)分離散變量在任何兩個取值之間只有有限個可能的取值(3)總體、個體和樣本(P7)總體(population):指具有某種特征的一類事物的全體,又稱母體個體(unit):構(gòu)成總體的每個基本單元樣本(sample):從總體中抽取的一部分個體,即總體的一個子集(4)參數(shù)和統(tǒng)計(jì)量總體參數(shù)樣本統(tǒng)計(jì)量5.2符號變量:大寫英文字母變量的取值(觀測到的結(jié)果,數(shù)據(jù)):小寫英文字母如18周歲中國人的身高:X170,180,172,168,…x1,x2,x3,x4數(shù)據(jù)和圖表內(nèi)容基礎(chǔ)知識變量、尺度、數(shù)據(jù)數(shù)據(jù)類型與分析方法類別數(shù)據(jù)、順序數(shù)據(jù)、等距數(shù)據(jù)、比例數(shù)據(jù)數(shù)據(jù)的來源數(shù)據(jù)的整理和統(tǒng)計(jì)圖表次數(shù)分布表、條形圖、餅圖、線圖、直方圖1.基礎(chǔ)知識

1.1變量、尺度、數(shù)據(jù)身高高、矮、中等個頭180cm變量variable:事物的某種特征,這種特征在不同個體之間有差異

尺度scale:測量的標(biāo)準(zhǔn)

數(shù)據(jù)data:測量的結(jié)果對同一個研究對象,用不同的尺度進(jìn)行測量,也可以得到不同的結(jié)果變異variation研究對象中各觀察個體之間的差異1.2四種測量尺度(P6~7)類別尺度(NominalScale)順序尺度(OrdinalScale)等距尺度(IntervalScale)比例尺度(RatioScale)類別尺度(NominalScale)例子性別(男、女)、企業(yè)性質(zhì)、職業(yè)、地區(qū)檢驗(yàn)(陰性、陽性)、血型特性也叫稱名尺度或列名尺度只能按照事物的某種屬性對其進(jìn)行平行的分類或分組只能區(qū)分事物是同類或不同類(=和

)通常計(jì)算每一類別中各元素或個體出現(xiàn)的“次數(shù)”或“頻率”來進(jìn)行分析順序尺度(OrdinalScale)例子績效評定:優(yōu)、良、中、及格、不及格病情:輕、中、重特性對事物之間等級差別或順序差別的一種測度可以將事物分成不同的類別,還可以確定這些類別的優(yōu)劣或順序該尺度具有“>和<”、“=和≠”的數(shù)學(xué)特性,但不能進(jìn)行加、減、乘、除運(yùn)算等距尺度(IntervalScale)例子溫度特性測量結(jié)果表現(xiàn)為數(shù)值,有相等的單位,但沒有絕對零點(diǎn)等距尺度具有類別尺度、順序尺度的數(shù)學(xué)特性外,其結(jié)果還可以進(jìn)行加、減運(yùn)算比例尺度(RatioScale)例子長度、重量、收入、心率特性測量結(jié)果表現(xiàn)為數(shù)值,有相等的單位,且有絕對的零點(diǎn)比例尺度具有類別尺度、順序尺度和等距尺度的數(shù)學(xué)特性外,其結(jié)果還可以進(jìn)行乘、除運(yùn)算2.數(shù)據(jù)類型和分析方法

2.1數(shù)據(jù)的類型四分法類別數(shù)據(jù)、順序數(shù)據(jù)、等距數(shù)據(jù)、比例數(shù)據(jù)二分法定性數(shù)據(jù)(QualitativeData)類別數(shù)據(jù)、順序數(shù)據(jù)定量數(shù)據(jù)(QuantitativeData)等距數(shù)據(jù)、比例數(shù)據(jù)四類數(shù)據(jù)的比較有個從未管過自己孩子的統(tǒng)計(jì)學(xué)家,在一個星期六下午妻子要外出買東西時,勉強(qiáng)答應(yīng)照看一下四個年幼好動的孩子。當(dāng)妻子回家時,他交給妻子一張紙條,上面寫著:“擦眼淚11次;系鞋帶15次;給每個孩子吹玩具氣球各5次;每個氣球的平均壽命10秒鐘;警告孩子不要橫穿馬路26次;孩子堅(jiān)持要穿馬路26次;我還要再過這樣的星期六0次。”不同類型數(shù)據(jù)之間的變換一般的變化方向數(shù)值型等級(順序)類別偶爾順序數(shù)值2.2數(shù)據(jù)類型與統(tǒng)計(jì)方法統(tǒng)計(jì)量數(shù)統(tǒng)計(jì)檢驗(yàn)類別數(shù)據(jù)頻數(shù)、頻率,眾數(shù)、異眾比率列聯(lián)分析

2檢驗(yàn)順序數(shù)據(jù)中數(shù)、四分位差、等級相關(guān)系數(shù)非參數(shù)分析等距、比例數(shù)據(jù)平均數(shù)、方差、標(biāo)準(zhǔn)差、積差相關(guān)系數(shù)參數(shù)估計(jì)、參數(shù)檢驗(yàn)3.統(tǒng)計(jì)數(shù)據(jù)的來源直接來源調(diào)查普查、抽樣調(diào)查觀察與實(shí)驗(yàn)間接來源(二手?jǐn)?shù)據(jù))不是自己親自調(diào)查的,是別人的數(shù)據(jù)、公開出版或報道的數(shù)據(jù)統(tǒng)計(jì)年鑒;報刊、雜志、圖書、廣播、電視傳媒中的各種數(shù)據(jù)資料4.數(shù)據(jù)的整理和統(tǒng)計(jì)圖表

4.1數(shù)據(jù)的整理數(shù)據(jù)整理通過各種渠道搜集到統(tǒng)計(jì)數(shù)據(jù)之后,首先應(yīng)對其進(jìn)行加工整理,使之系統(tǒng)化、條理化,以符合分析的需要。整理可以大大簡化數(shù)據(jù),更容易理解和分析。數(shù)據(jù)整理的步驟數(shù)據(jù)的預(yù)處理數(shù)據(jù)的審核與篩選——檢查每個樣本點(diǎn)是否完整、準(zhǔn)確;將不符合要求的數(shù)據(jù)刪除,符合條件的選出來。數(shù)據(jù)的排序——便于發(fā)現(xiàn)數(shù)據(jù)特征或趨勢,也有助于檢查錯誤分類或分組匯總數(shù)據(jù)整理的原則對定性數(shù)據(jù)主要做分類整理對定量數(shù)據(jù)主要做分組整理4.2類別數(shù)據(jù)的整理與圖表展示整理列出事物的類別,計(jì)算出每一類別的次數(shù)、頻率或比例、比率圖表展示次數(shù)分布表列出不同類別所對應(yīng)的次數(shù)或比例條形圖、餅圖次數(shù)分布frequencydistribution條形圖bargraph(P28)餅圖piegraph(p30)4.3順序數(shù)據(jù)的整理與顯示類別數(shù)據(jù)的整理和顯示的內(nèi)容都適用于順序數(shù)據(jù)。除此之外順序數(shù)據(jù)還可以計(jì)算累積次數(shù),圖形顯示用到累積次數(shù)分布圖和環(huán)形圖累積次數(shù)(cumulativefrequencies)

將各類別的次數(shù)逐級累加起來向上累積:從類別順序開始一方向最后一方累加頻數(shù)向下累積:從類別順序最后一方向開始一方累加頻數(shù)累積百分比(cumulativepercentages)條形圖bargraph環(huán)形圖向上累加分布圖

cumulativedistribution向下累加分布圖4.4定量數(shù)據(jù)的整理和圖表顯示數(shù)據(jù)的分組定量數(shù)據(jù)包括等距數(shù)據(jù)和比例數(shù)據(jù),在整理時通常要進(jìn)行分組,然后再計(jì)算出各組中出現(xiàn)的次數(shù)。分組方法一般用組距分組法圖表顯示次數(shù)分布表直方圖、次數(shù)多邊形圖、累加直方圖4.4.1組距分組的步驟(P12)1.求全距R=Max-Min2.定組數(shù)組數(shù)過多過少都不合適經(jīng)驗(yàn)公式

組數(shù)k=1.87(N-1)0.4,

N為數(shù)據(jù)個數(shù)3.定組距組距是一個組的上限與下限之差

組距=(最大值-最小值)/組數(shù)

4.寫出組限建議用精確組限(P14表1-2)5.求組中值組中值=(精確上限+精確下限)÷26.歸類劃記7.登記次數(shù)4.4.2定量數(shù)據(jù)的圖表展示直方圖histogram次數(shù)多邊形累加直方圖cumulativehistogram(P23)頻數(shù)分布圖的形態(tài)

正態(tài)分布正偏態(tài)分布右偏分布(右尾巴比較長)負(fù)偏態(tài)分布(左尾巴比較長)左偏分布J型分布U型分布

反J型分布思考題在某小鎮(zhèn)對下面變量進(jìn)行調(diào)查父母雙方均小于25歲的家庭中所有成員的身高已婚夫婦的身高全體居民的身高所有汽車的高度把變量與其直方圖相匹配,并解釋理由205080(英寸)思考題1960和1980年,對美國婦女進(jìn)行調(diào)查:“你有幾個孩子?”結(jié)果如下所示。變量是離散的還是連續(xù)的?畫直方圖(“9或更多可以”可以取為9)從圖中能得出什么結(jié)論?思考題:不等距分組的直方圖繪制1973年美國家庭收入分布如下,請繪制直方圖。不等距分組時不能以絕對頻次/百分比繪制直方圖不等距分組時應(yīng)該采用密度尺度相關(guān)分析本節(jié)要點(diǎn)1.相關(guān)和相關(guān)系數(shù)的概念2.各種相關(guān)系數(shù)的計(jì)算(適用條件、計(jì)算方法)2.1積差相關(guān)2.2等級相關(guān)2.2.1斯皮爾曼相關(guān)2.2.2肯德爾和諧系數(shù)2.3質(zhì)量相關(guān)2.3.1點(diǎn)二列相關(guān)2.3.2二列相關(guān)思考題什么情況下我們對兩個變量之間的關(guān)系感興趣?1.什么是相關(guān)事物之間的關(guān)系因果關(guān)系、共變關(guān)系和相關(guān)關(guān)系因果:A→B下雨地上會濕共變:C→A,C→B

嚴(yán)格的說不叫相關(guān),只是A和B之間有某些共同點(diǎn)嬰兒身高和樹苗高度的關(guān)系相關(guān):指兩類現(xiàn)象在發(fā)展變化的方向和大小方面存在一定的關(guān)系,不能確定是否為因果關(guān)系,但不存在共變關(guān)系廣告費(fèi)支出與商品銷售額的關(guān)系相關(guān)系數(shù)相關(guān)系數(shù):兩列變量間相關(guān)程度的數(shù)量化指標(biāo)總體

(讀rou希臘字幕)樣本r|r|≤1相關(guān)數(shù)量的值總是小于等于1的。幾個概念完全相關(guān):-1.00或1.00不完全相關(guān):0<|r|<1不(零)相關(guān):r≈0正相關(guān):兩個變量的變化方向一致,0<r≤1負(fù)相關(guān):兩個變量的變化方向相反,-1≤

r<0(a)完全正相關(guān)(b)完全負(fù)相關(guān)(c)無相關(guān)關(guān)系(d)非線性關(guān)系(e)正相關(guān)(f)負(fù)相關(guān)計(jì)算相關(guān)系數(shù)時應(yīng)注意的問題相關(guān)系數(shù)受樣本容量n的影響如果n很小,可能完全沒有相關(guān)的兩事物,卻計(jì)算出較大的相關(guān)系數(shù)。一般以N大于30為宜相關(guān)系數(shù)不是等距數(shù)據(jù)也不是比例數(shù)據(jù)計(jì)算相關(guān)系數(shù)要求成對數(shù)據(jù)

沒有線性相關(guān),不一定沒有關(guān)系,可能是非線性的相關(guān)系數(shù)的計(jì)算不受以下因素影響互換兩個變量某一變量的所有值都增加同一數(shù)值某一變量的所有值都乘以同一正數(shù)散點(diǎn)圖scatterdiagram2.1積差相關(guān)也稱積矩相關(guān)、皮爾遜相關(guān)適用條件兩列變量為正態(tài)等距或等比,且具有線性關(guān)系。積差相關(guān)系數(shù)(P58)Sx為x的樣本標(biāo)準(zhǔn)差,SY為Y的樣本標(biāo)準(zhǔn)差P59例2-132.2等級相關(guān)斯皮爾曼等級相關(guān)肯德爾和諧系數(shù)2.2.1斯皮爾曼等級相關(guān)適用條件兩列變量是等距或比例變量,但不是正態(tài)分布兩列順序變量斯皮爾曼等級相關(guān)系數(shù)P61例2-14一家廣告代理商想了解一家公司產(chǎn)品質(zhì)量等級是否與其商場份額等級有關(guān)。斯皮爾曼等級相關(guān)系數(shù)的修正P63例2-152.2.2肯德爾和諧系數(shù)(肯德爾W系數(shù))ssRi表示Ri的平方和,Ri的離均差的平方和多列等級變量P65

例2-16肯德爾W系數(shù)的校正t表示相同等技數(shù)當(dāng)出現(xiàn)相同等級時(P65例2-17)2.3質(zhì)量相關(guān)P66一列變量為正態(tài)的等距或比例數(shù)據(jù),另一列變量為類別變量,求兩列變量的直線相關(guān),稱為質(zhì)量相關(guān)。點(diǎn)二列相關(guān)二列相關(guān)多系列相關(guān)2.3.1點(diǎn)二列相關(guān)縮寫PB

point-biserialcorrelation適用條件兩列變量中一列為等距或等比的測量數(shù)據(jù)而且總體分布為正態(tài),另一列變量為二分的類別變量。應(yīng)用點(diǎn)二列相關(guān)多用于編制是非測驗(yàn)題評價測驗(yàn)內(nèi)部一致性等問題。注:每個題目(二分類別變量)與總分(數(shù)值)變量的相關(guān),稱為每個題目的區(qū)分度。相關(guān)高說明該題答對答錯與總分的一致性高,即區(qū)分度高。點(diǎn)二列相關(guān)系數(shù)P67例2-182.3.2二列相關(guān)biserialcorrelation適用條件兩列變量都為正態(tài)等距(比例)變量,但其中一列變量被人為地劃分成兩類。應(yīng)用教育和心理測量中問答題的區(qū)分度指標(biāo)二列相關(guān)與點(diǎn)二列相關(guān)的主要區(qū)別在于二分變量是否正態(tài)。二列相關(guān)系數(shù)P68例2-19概率與分布本章主要內(nèi)容概率古典和統(tǒng)計(jì)定義、概率的性質(zhì)、加法和乘法定理二項(xiàng)分布適用條件正態(tài)分布性質(zhì)、查表、應(yīng)用標(biāo)準(zhǔn)正態(tài)分布、標(biāo)準(zhǔn)分?jǐn)?shù)1.概率probability

1.1幾個概念

確定性現(xiàn)象:一定條件下必然發(fā)生某種結(jié)果必然現(xiàn)象 沸騰乙肝,乙肝表面抗原一定為陽性不可能現(xiàn)象 隨機(jī)現(xiàn)象randomevent:一定條件下結(jié)果不定如:擲硬幣后哪面朝上?某患者服用某降壓新藥后:降?不變?生偶然性和必然性隨機(jī)試驗(yàn)和隨機(jī)事件隨機(jī)試驗(yàn)對隨機(jī)現(xiàn)象的一次觀察隨機(jī)事件簡稱事件,指隨機(jī)現(xiàn)象中出現(xiàn)的各種可能的結(jié)果必然事件:包含所有可能結(jié)果不可能事件:不包含任何結(jié)果試驗(yàn)

試驗(yàn)結(jié)果(事件)拋擲一枚硬幣 正面,反面對某一零件進(jìn)行檢驗(yàn) 合格,不合格投擲一顆骰子 1,2,3,4,5,6進(jìn)行一場足球比賽 獲勝,失利,平局頻率和概率頻率frequencyN次重復(fù)試驗(yàn)中A事件發(fā)生的次數(shù)為n,那么事件A發(fā)生的頻率概率probability當(dāng)N趨向于無窮大時,事件A發(fā)生的頻率趨向于一個固定值,這就是事件發(fā)生的概率P(A)實(shí)驗(yàn)者 N nH nH/N德·摩根 2048 1061 0.5181蒲豐 4040 2048 0.5069K·皮爾遜 12000 6019 0.5016K·皮爾遜 24000 12012 0.5005N為投擲硬幣的次數(shù),nH為正面朝上的次數(shù)1.2概率的定義

1.2.1概率的統(tǒng)計(jì)定義(P74)當(dāng)試驗(yàn)次數(shù)N無限增大時,事件A發(fā)生的頻率n/N穩(wěn)定在一個確定的常數(shù)附近,這就是事件A發(fā)生的概率注:試驗(yàn)滿足條件每次試驗(yàn)中某一事件發(fā)生的可能性不變試驗(yàn)?zāi)艽罅恐貜?fù),且每次試驗(yàn)相互獨(dú)立1.2.2概率的古典定義如果某一隨機(jī)試驗(yàn)的結(jié)果有限(注:任何一個可能的結(jié)果就是一個基本事件),且各個結(jié)果出現(xiàn)的可能性相等,則某一事件A發(fā)生的概率為注:概率的統(tǒng)計(jì)定義是后驗(yàn)概率,而古典定義為先驗(yàn)概率思考題:判斷以下哪些試驗(yàn)符合概率的古典定義的要求?試驗(yàn)

試驗(yàn)結(jié)果(事件)拋擲一枚硬幣 正面,反面對某一零件進(jìn)行檢驗(yàn) 合格,不合格投擲一顆骰子 1,2,3,4,5,6進(jìn)行一場足球比賽 獲勝,失利,平局求擲一顆骰子其點(diǎn)數(shù)小于5的概率是多少解:投擲骰子試驗(yàn)中,可能的點(diǎn)數(shù){1,2,3,4,5,6},試驗(yàn)結(jié)果有限,6個試驗(yàn)結(jié)果以均等的可能發(fā)生

事件A={1,2,3,4},P(A)=4/6=2/31.3概率的性質(zhì)對任意事件A,0≤P(A)≤1必然事件的概率為1,即P(W)=1

不可能事件的概率為0,P(

)=0逆事件的概率P(ā)=1-P(A)什么是逆事件?1.4概率的加法定理和乘法定理加法定理若A、B是兩個相互獨(dú)立的事件,則A和B至少有一個發(fā)生的概率是

P(A+B)=P(A)+P(B)推廣到n個獨(dú)立事件P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)例求擲一顆骰子其點(diǎn)數(shù)小于5的概率某一考生完全憑猜測答兩道是非題,求其答對一題的概率乘法定理若A、B是兩個相互獨(dú)立的事件,則A和B同時發(fā)生的概率是

P(A·B)=P(A)·P(B)推廣到n個獨(dú)立事件

P(A1A2…An)=P(A1)P(A2)…P(An)例求擲兩顆骰子其點(diǎn)數(shù)為12的概率和為11的概率求擲兩顆骰子其點(diǎn)數(shù)不等的概率憑猜測完全答對10題4選1選擇題的概率二戰(zhàn)中飛行員在每次轟炸任務(wù)中被擊中的機(jī)會是2%,那么執(zhí)行50次任務(wù)“在數(shù)學(xué)上”就一定被擊中嗎?因?yàn)?0×2%=100%N個人當(dāng)中至少有兩個人的生日是同一天的概率是多少?2.二項(xiàng)分布

2.1排列permutation從n個不同的元素中,任取m(m≤n)個不同的元素,按一定順序排成一列P78例3-6用四個數(shù)字1,2,3,4可以組成多少個沒有重復(fù)數(shù)字的二位數(shù)?多少個沒有重復(fù)數(shù)字的四位數(shù)?思考題:如果數(shù)字可以重復(fù),上題的答案又是多少?2.2組合combination從n個不同的元素中,任取m(m≤n)個不同的元素,不管順序并成一組組合的性質(zhì)(P79例3-6)從100個元素中每次取97個不同元素的組合數(shù)是多少?2.3隨機(jī)變量的期望和方差隨機(jī)變量的方差方差的性質(zhì)2.4二項(xiàng)分布

binominaldistribution離散型分布的一種每次隨機(jī)試驗(yàn)只有兩種可能的結(jié)果:A及ā,P(A)=p,P(ā)=1-p=q(0<p<1)。n次獨(dú)立試驗(yàn)下,事件A發(fā)生的次數(shù)為x的概率分布醫(yī)學(xué)中常見結(jié)果為兩種互斥的情況之一的例子陰性、陽性治愈、未愈傳染、未傳染致死、存活P82例3-9全憑猜測答10道是非題,問分別答對5、6、7、8、9、10題的概率各為多少?至少答對5題的概率又是多少?P83例3-10全憑猜測答10道4選1選擇題,問分別答對8、9、10題的概率各為多少?至少答對1題的概率又是多少?至少答對9題的概率是多少?馬丁服裝店問題商店經(jīng)理估計(jì)進(jìn)入該服裝店的任一顧客購買服裝的概率是0.30,那么三個顧客中有兩個購買的概率是多少?分析:試驗(yàn)包含了三個相同的試驗(yàn),進(jìn)入商店的三個顧客中的任一個即為一次試驗(yàn)每次試驗(yàn)都有兩個結(jié)果:顧客購買或不購買顧客購買的概率(0.30)或不購買的概率(0.70)被假設(shè)為對所有顧客都相等某個顧客的購買決定獨(dú)立于其他顧客的購買決定某保險公司有2500個同一年齡同一階層的人參加了壽命保險。已知1年內(nèi)這批人的死亡水平為0.002,每個參加保險的人需在年初支付保險費(fèi)12元,如果發(fā)生死亡,保險公司賠付2000元。保險公司虧本的概率是多少?保險公司獲利不少于10000元的概率是多少?解:設(shè)X為死亡人數(shù),如果12×2500<2000X,即X>15時,保險公司要賠本。p=0.002

獲利10000元,即12×2500-2000X≥10000,即X≤101.當(dāng)n趨向于無窮大時,二項(xiàng)分布趨向于正態(tài)分布

2.二項(xiàng)分布的均值、方差和標(biāo)準(zhǔn)差2.5其他離散型概率分布

2.5.1負(fù)二項(xiàng)分布某隨機(jī)試驗(yàn)結(jié)果只有兩種可能,出現(xiàn)某結(jié)果的概率為p,則不出現(xiàn)該結(jié)果的概率為q=1-p?,F(xiàn)在一直進(jìn)行試驗(yàn),直至這一結(jié)果出現(xiàn)r次為止,以X表示試驗(yàn)共需要進(jìn)行的次數(shù),則有一個市場調(diào)查員需要完成500份調(diào)查表的訪問任務(wù),隨機(jī)碰到的行人大約3/10的人樂意回答他的問題,每找到一個人需花6分鐘的時間。問該調(diào)查員完成500份問卷約需多長時間?2.5.2多項(xiàng)分布現(xiàn)有一批產(chǎn)品,已知合格品占11/18,次品占2/9,廢品占1/6,從中隨機(jī)抽取6件,問抽到3件合格品、2件次品和1件廢品的概率有多大?2.5.3幾何分布在一個伯努利試驗(yàn)中,某個時間出現(xiàn)的概率為p,現(xiàn)在一個一個地進(jìn)行試驗(yàn),直至出現(xiàn)該事件為止,如果X表示試驗(yàn)所需進(jìn)行的次數(shù),則X服從幾何分布,其概率分布函數(shù)

f(x)=qk-1p,k=1,2,…E(X)=1/p,Var(X)=q/p22.5.4超幾何分布在50個零件中,已知有5個不合格,如果隨機(jī)從中抽4個,問4個樣品中恰好有1個不合格的概率是多少?不超過2個不合格零件的概率是多少?超幾何分布的推廣一家商業(yè)零售集團(tuán)開設(shè)了100家分支商店,其經(jīng)營業(yè)績?nèi)缦拢?/p>

經(jīng)營業(yè)績 優(yōu) 良 中 差

分店數(shù) 24 38 28 10

從100家分店中隨機(jī)抽取20個,問其中有8個優(yōu)、7個良、3個中、2個差的概率是多少?2.5.5泊松分布泊松分布的醫(yī)學(xué)應(yīng)用舉例單位時間內(nèi)某事件發(fā)生次數(shù)的分布,如細(xì)菌、血細(xì)胞等單位面積(容積)內(nèi)計(jì)數(shù)結(jié)果的分布人群中某些發(fā)病率很低的傳染病,如某惡性腫瘤的患病數(shù)或死亡數(shù)的分析放射醫(yī)學(xué)中同位素計(jì)數(shù)的數(shù)據(jù)處理某些疾病的地區(qū)或家族集積性,某種基因突變而引起的遺傳性疾病的分布世界杯中的統(tǒng)計(jì)學(xué)

作者:陳峰2002年韓日世界杯64場比賽中,各隊(duì)進(jìn)球數(shù)有多有少。大部分是0,1,2個進(jìn)球,個別隊(duì)是5個以上進(jìn)球,最多的是8個進(jìn)球。宏觀上來說,各隊(duì)進(jìn)球數(shù)服從Poisson分布!下面是各隊(duì)進(jìn)球數(shù)(不包括點(diǎn)球),平均進(jìn)球數(shù)1.2578,擬合Poisson分布結(jié)果如下:每場各隊(duì)進(jìn)球數(shù) 場數(shù) 理論數(shù)

0 37 36.391 47 45.772 27 28.783 13 12.074 2 3.795 1 0.95≥6 1 0.25合計(jì) 128 128.00

如果包括點(diǎn)球數(shù),同樣服從Poisson分布。3.正態(tài)分布

3.1連續(xù)型隨機(jī)變量不可能一一列舉可能的取值取任一指定實(shí)數(shù)值的概率為0我們對落入某個區(qū)間內(nèi)的概率更感興趣3.2正態(tài)分布

3.2.1正態(tài)分布的概率密度函數(shù)設(shè)連續(xù)型隨機(jī)變量x具有概率密度

稱x服從參數(shù)為

,

的正態(tài)分布normaldistribution或高斯分布Gaussiandistribution,記為x~N(

,

2)

其中,

為隨機(jī)變量x的均值

為隨機(jī)變量x的標(biāo)準(zhǔn)差

為圓周率3.14159…

e為自然對數(shù)的底2.71828…3.2.2正態(tài)(概率密度)曲線的特點(diǎn)概率密度曲線和x軸之間的面積等于1概率P{x1<x≤x2}關(guān)于x=

對稱對任意h>0,有P{-h<x<

}=P{

<x<+h}當(dāng)x=

時有最大值

x離

越遠(yuǎn),f(x)的值越小并逐漸趨向0這表明對于同樣長度的區(qū)間,當(dāng)區(qū)間離

越遠(yuǎn),X落入?yún)^(qū)間上的概率越小如果固定

改變

的值,則圖形沿x軸平移,而不改變形狀如果固定

改變

,由于最大值

可知當(dāng)

越小時圖形就變得越尖,因而x落在

附件的概率就越大如何理解概率密度曲線假設(shè)有一根無限長的棍子,總的質(zhì)量為1。棍子的中心部分密度比較大,而兩端較輕如果把棍子切成同樣長度的一段一段,那么中間部分的一段比邊上的重3.2.3標(biāo)準(zhǔn)正態(tài)分布

=0,

=1時,有3.2.3.1標(biāo)準(zhǔn)分?jǐn)?shù)(P94)又稱為Z分?jǐn)?shù),以標(biāo)準(zhǔn)差為單位,反映了一個原始分?jǐn)?shù)在團(tuán)體中所處的位置Z分?jǐn)?shù)的性質(zhì)Z分?jǐn)?shù)的平均數(shù)為0Z分?jǐn)?shù)的標(biāo)準(zhǔn)差為1標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用比較分屬性質(zhì)不同的觀測值在各自數(shù)據(jù)分布中相對位置的高低.如:某人Z身高1.70=0.5,Z體重65=1.2,則該人在某團(tuán)體中身高稍偏高,而體重更偏重些當(dāng)已知各不同質(zhì)的觀測值的次數(shù)分布為正態(tài)時,可用Z分?jǐn)?shù)求不同的觀測值的總和或平均值,以表明在總體中的位置.3.2.3.2正態(tài)分布的標(biāo)準(zhǔn)化3.2.3.3標(biāo)準(zhǔn)正態(tài)分布表(P.466)僅給出Z為正值時的P和對應(yīng)的Y當(dāng)Z為負(fù)值時利用對稱性求相應(yīng)的P和Y對于X~N(

,

2)先化為標(biāo)準(zhǔn)正態(tài)分布再查表p(0<z<Z)=P例:X~N(0,1),求以下概率1)P(0<x<1)

2)P(x<1) 3)P(x<-1)4)P(1<x<2) 5)P(|x|

1) 6)P(x>-1)寫出以下區(qū)間如果X~N(

,

2)X~N(0,1)平均數(shù)左右1個標(biāo)準(zhǔn)差平均數(shù)左右z個標(biāo)準(zhǔn)差需要記住的一些Z值P96例3-17

在某年高考的平均分?jǐn)?shù)為500,標(biāo)準(zhǔn)差為100的正態(tài)總體中,某考生得到650分。設(shè)當(dāng)年高考錄取率為10%,問該生成績能否入圍?解:該生的標(biāo)準(zhǔn)分?jǐn)?shù)為

Z=(650-500)/100=1.5

查正態(tài)分布表,

當(dāng)Z=1.5時,p=0.433

從低分到高分的順序中他處于93.3%的位置

從高分到低分的順序中他處于6.7%的位置某市參加數(shù)學(xué)奧林匹克業(yè)余學(xué)校入學(xué)考試的人數(shù)為2800人,只錄取學(xué)生150人,該次考試的平均分為75分,標(biāo)準(zhǔn)差為8,問錄取分?jǐn)?shù)應(yīng)定為多少?解:考試成績服從正態(tài)分布,即

X~N(75,82),轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布Z~N(0,1)。

根據(jù)題意招生人數(shù)的概率為

P(Z≥Z0)=150/2800=0.05357

P(0<Z<Z0)=0.5-0.05357=0.44643

查正態(tài)分布表,得Z0=1.6112

X0=75+1.6112×8=87.8894≈88假設(shè)成人智商服從均數(shù)為100,標(biāo)準(zhǔn)差為15的正態(tài)分布。如果智商大于160的都是天才,那么請問100萬人里有幾個天才?3

準(zhǔn)則當(dāng)X~N(

,

2)時,有P(|x-

|

)=0.6826P(|x-

|2

)=0.9545P(|x-

|

3

)=0.9973當(dāng)X~N(0,1)時有P(|x|

1)=0.6826P(|x|

2)=0.9545P(|x|

3)=0.9973X的取值幾乎全部集中在[-3,3]區(qū)間內(nèi),超出這個范圍的可能性僅占不到0.3%

如果某個值在|x-

|3

之外,可以判定為異常值資料:例如根據(jù)我國國家體委、原教育部、衛(wèi)生部1978年至1980年對全國16個省市20余萬名青少年兒童進(jìn)行的“中國青少年兒童身體形態(tài)、機(jī)能、素質(zhì)調(diào)查研究”的資料,其中18~25歲男青年的平均身高是170.5厘米,標(biāo)準(zhǔn)差5.75厘米,這可以作為確定我國城市成年男性平均身高的重要依據(jù)。姚明的身高為224cm,求所對應(yīng)的Z,以及身高在224cm以上的成年男性所占的比例。姚明:如果上天再給我一次機(jī)會我不要2米24身高但除了打籃球,長得高還有什么好處呢?“上面的空氣新鮮一些?!边@是姚明的回答。醫(yī)學(xué)應(yīng)用確定醫(yī)學(xué)參考值范圍生理、生化指標(biāo)及其組織代謝產(chǎn)物含量中符合正態(tài)分布者如身高、體重、白細(xì)胞等其他3.2.4散點(diǎn)圖和分布2Sx2Sx

2SY2SY大部分點(diǎn)散布在均值左右2個標(biāo)準(zhǔn)差內(nèi)抽樣理論和參數(shù)估計(jì)本章基本內(nèi)容基本概念總體、個體、總體容量、樣本、樣本容量、抽樣、參數(shù)、統(tǒng)計(jì)量抽樣方法隨機(jī)、等距、分層抽樣分布樣本平均數(shù):Z分布、t分布樣本方差:卡方分布、F分布參數(shù)估計(jì)點(diǎn)估計(jì):充分性、無偏性、有效性、一致性區(qū)間估計(jì):顯著性水平、置信度、置信區(qū)間1.抽樣的基本概念總體(population):要研究的事物或現(xiàn)象的全體個體(unit):組成總體的每個元素(成員)總體容量(populationsize):一個總體中所含個體的數(shù)量樣本(sample):從總體中抽取的部分個體樣本容量(samplesize):樣本中所含個體的數(shù)量抽樣(sampling):為推斷總體的某些重要特征,需要從總體中按一定抽樣技術(shù)抽取若干個體的過程參數(shù)(parameter):反映總體數(shù)據(jù)特征的量數(shù)統(tǒng)計(jì)量(statistic):反映樣本數(shù)據(jù)特征的量數(shù)統(tǒng)計(jì)量是樣本的函數(shù),只依賴于樣本;樣本均值、樣本方差等都是統(tǒng)計(jì)量放回抽樣和不放回抽樣放回抽樣(重置抽樣)從總體N個單位中抽取n個單位作為樣本時,每次只從總體中抽取一個單位,進(jìn)行登記后再把它放回原來的總體中去某次被抽取的單位在下一次還有可能被抽到總體單位數(shù)每次抽樣都不變不放回抽樣(不重置抽樣)從總體N個單位中抽取n個單位作為樣本時,每次從總體中抽取一個單位后,被抽取單位不放回總體中,僅從余下部分進(jìn)行下一次抽取。相當(dāng)于一次從N個總體單位中抽取n個單位抽樣的實(shí)例血常規(guī):用一滴外周血的化驗(yàn)結(jié)果,代表一個人的全血成分2.抽樣方法

2.1簡單隨機(jī)抽樣

simplerandomsampling完全隨機(jī)地選取樣本,要求有總體中每一個個體的詳盡名單,給總體N個元素編號抽簽隨機(jī)數(shù)字表在農(nóng)村推行聯(lián)產(chǎn)承包責(zé)任制時,如何把地力、水利等各方面條件存有差異的田地分到各家各戶,確實(shí)難上加難。最終還是采用“抽簽”來確定挑選田地先后順序的辦法解決的。簽號排在后面的自然挑不到理想的田地。但人們都認(rèn)為“碰運(yùn)氣”的辦法是最“公平”的。沒有抽到好簽,只能怨自己“倒霉”。有意見也不好說。2.2等距抽樣又稱系統(tǒng)抽樣(systematicsampling)給總體N個元素編號抽樣間距k=N/n隨機(jī)確定起點(diǎn)a(1≤a≤k)a,a+k,a+2k,…,a+(n-1)k缺點(diǎn):受總體數(shù)據(jù)的周期性的影響電話號碼交通高峰期例:從N=800的總體中抽取50個樣本2.3分層抽樣stratifiedrandomsampling先將總體分成不同的“層”,然后在每一“層”內(nèi)進(jìn)行簡單隨機(jī)抽樣分層原則:層內(nèi)變異要小,層間的變異要大可防止簡單隨機(jī)抽樣造成的樣本構(gòu)成與總體構(gòu)成不成比例的現(xiàn)象。比例分層抽樣例:總體20人,其中男5,女15,抽樣4人

解:“男”在總體的比例為5/20=1/4

因此應(yīng)抽取“男”4×0.25=1人,抽取“女”3人2.4其他抽樣方法方便抽樣(Conveniencesampling)由調(diào)查人員自由、方便地選擇被調(diào)查者的非隨機(jī)選樣判斷抽樣(Judgementsampling)通過某些條件過濾選擇某些被調(diào)查者參與調(diào)查的判斷抽樣法如:focusgroup3.抽樣分布總體

3.1.1總體方差已知的樣本平均數(shù)分布

3.1.1.1總體分布正態(tài)3.1.1.2總體分布未知中心極限定理CentralLimitTheorem設(shè)從均值為,方差為

2(有限)的任意一個總體中抽取大小為n的樣本,當(dāng)n充分大時,樣本均值X的抽樣分布近似服從均值為,方差為

2/n的正態(tài)分布。注:什么叫n充分大呢?總體偏離正態(tài)越遠(yuǎn),則要求n就越大。在實(shí)際應(yīng)用中常要求n30或者n503.1.1.3標(biāo)準(zhǔn)誤standarderror樣本平均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤例:某電梯承受的最大拉力為1000千克,可乘坐13人。已知人群的平均體重為60千克,標(biāo)準(zhǔn)差為14千克,且服從正態(tài)分布。問電梯發(fā)生事故的概率是多少?例:某廠聲稱生產(chǎn)的電池

=54個月,=6個月的壽命分布。某消費(fèi)團(tuán)體為檢驗(yàn)該廠的說法是否準(zhǔn)確,購買了50個該廠生產(chǎn)的電池進(jìn)行試驗(yàn)。

⑴若廠商聲稱是正確的,描述50個電池壽命的抽樣分布;

⑵若廠商聲稱是正確的,則50個樣品組成的樣本的平均壽命不超過52個月的概率是多少?3.1.2總體方差未知的樣本平均數(shù)分布當(dāng)總體方差

2未知時,用S2作為

2的估計(jì)值3.2t分布3.2.1自由度degreeoffreedom可以自由取值的變量的個數(shù)任意說出三個整數(shù)任意說出三個和為100的整數(shù)3.2.2t分布的特點(diǎn)

student’stdistribution對稱:左側(cè)為負(fù),右側(cè)為正,均值為0-

<t<+

n→

時,t分布為正態(tài)分布,方差為1n>30時,t分布為接近正態(tài)分布,方差>1,n<30時,t分布與正態(tài)分布相差較大,隨n-1減小方差越大n>45時,t分布與正態(tài)分布沒有多大差異在小樣本n<30時,t分布具有重要作用3.2.3t分布的一些推論P(yáng)1123.3樣本方差的分布樣本方差的分布較復(fù)雜,它與總體分布有關(guān)。在這里只研究當(dāng)總體為正態(tài)分布時,樣本方差的分布。設(shè)x1,x2,…,xn為來自正態(tài)分布N(

,2)的樣本,則從數(shù)學(xué)上可以推導(dǎo)出正態(tài)總體下樣本方差S2的分布為:3.4

2分布Chi-squaredistribution3.4.1

2分布的特點(diǎn)正偏態(tài)分布當(dāng)df→∞時,

2分布為正態(tài)分布

2值都是正值可加性k個

2分布的和也是

2分布

2=df;22=2df(df>2)連續(xù)型分布3.4.2

2分布表P490例4-4P108

df=5,求

=0.05和

=0.01時的單側(cè)臨界值解:

3.5F分布Fdistribution3.5.1F分布的特點(diǎn)F(n1,n2)分布形態(tài)是正偏態(tài)分布,形式隨n1,n2不同而不同,當(dāng)n1,n2的增加而漸趨正態(tài)分布F為兩個方差比率,所以為正值n1=1,n2任意時,F(xiàn)值與自由度為n2的t值的平方相等,即F(1,n2)=t2(n2)F

(n1,n2)=1/F1-(n2,n1)(114)3.5.2F分布的應(yīng)用F分布是統(tǒng)計(jì)學(xué)家費(fèi)歇爾(R.A.Fisher)于1924年首先發(fā)現(xiàn)的假設(shè)檢驗(yàn)區(qū)間估計(jì)方差分析回歸分析4樣本容量的計(jì)算(115)根據(jù)最大允許誤差確定樣本容量樣本容量n,總體方差

2,允許誤差d,可靠性系數(shù)Z

/2的關(guān)系總體方差越大,需要的樣本容量越大;允許誤差越大,需要的樣本容量越小;可靠性系數(shù)越大,需要的樣本容量越大;例:要使95%置信區(qū)間的允許誤差為5,應(yīng)選取多大的樣本容量?假定總體的標(biāo)準(zhǔn)差為25。例:一家廣告公司想估計(jì)某類商店去年所花的平均廣告費(fèi)有多少。檢驗(yàn)表明,總體方差約為1800000。如置信度取95%,并要使估計(jì)值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?例:一家市場調(diào)研公司想估計(jì)某地區(qū)有彩色電視機(jī)的家庭所占的比例。該公司希望對p的估計(jì)誤差不超過0.05,要求的可靠程度為95%,應(yīng)取多大容量的樣本?例:一項(xiàng)調(diào)查中,總體比率的計(jì)劃值為0.35,則當(dāng)允許的最大絕對誤差為0.05時,在求其95%置信區(qū)間時應(yīng)采用多大的樣本容量?5參數(shù)估計(jì)設(shè)總體有待估參數(shù),自總體中抽取樣本x1,x2,…,xn點(diǎn)估計(jì)pointestimate用樣本的某一統(tǒng)計(jì)量估計(jì)

如用樣本均值估計(jì)總體均值區(qū)間估計(jì)intervalestimate求出一定概率下的取值范圍5.1點(diǎn)估計(jì)統(tǒng)計(jì)量作為估計(jì)量estimator充分性sufficiency用到樣本的所有數(shù)據(jù)無偏性unbiasedness估計(jì)值的平均值與真值一致有效性efficiency當(dāng)總體參數(shù)的無偏估計(jì)量有不止一個統(tǒng)計(jì)量時,無偏估計(jì)變異性最小者有效性高,變異大者有效性低一致性consistency當(dāng)樣本容量無限增大時,估計(jì)值越來越接近所估計(jì)的總體參數(shù)總體5.1.1有效性哪個是更好的估計(jì)量?算術(shù)平均數(shù)vs.中數(shù)5.1.2無偏估計(jì)量

unbiasedestimator5.2區(qū)間估計(jì)區(qū)間估計(jì)的原理樣本統(tǒng)計(jì)量的分布規(guī)律5.2.1幾個概念顯著性水平

significancelevel指估計(jì)總體參數(shù)可能落入某區(qū)間時允許犯錯誤的概率

通常有三個標(biāo)準(zhǔn):

:0.05,0.01,0.001

1-

:0.95,0.99,0.999置信水平、置信度confidencelevel1-

置信區(qū)間confidenceinterval指在某一置信水平時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度5.2.2總體平均數(shù)的估計(jì)

5.2.2.1總體正態(tài)、方差已知5.2.2.2

總體正態(tài)、方差未知5.2.2.3總體非正態(tài)、方差未知5.2.3總體方差的區(qū)間估計(jì)5.2.4方差差異的區(qū)間估計(jì)假設(shè)檢驗(yàn)本章基本內(nèi)容假設(shè)檢驗(yàn)的基本原理和步驟虛無假設(shè)和備擇假設(shè)錯誤和錯誤單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)差異的顯著性檢驗(yàn)均值方差比例、相關(guān)系數(shù)1.假設(shè)檢驗(yàn)的原理和步驟

1.1從一條聽到的新聞?wù)勂稹白蛱焱砩螦足球隊(duì)以26:13大敗了B隊(duì)”這是一場足球賽嗎?你的推理過程是怎樣的?可能的推理過程如果是足球賽,那么比分(基本上)不可能是26:13因此(很可能)不是足球賽對以上過程的分析反證法有犯錯誤的可能1.2假設(shè)檢驗(yàn)和參數(shù)估計(jì)

Hypothesistesting參數(shù)估計(jì)用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)假設(shè)檢驗(yàn)先對總體參數(shù)提出一個假設(shè),然后利用樣本信息檢驗(yàn)這個假設(shè)是否成立根據(jù)以往的比分(總體信息)推斷該比分是否足球賽比分從樣本的差異推論總體差異的過程1.3假設(shè)檢驗(yàn)的主要內(nèi)容:

差異檢驗(yàn)樣本統(tǒng)計(jì)量與總體參數(shù)的差異兩個樣本統(tǒng)計(jì)量之間的差異該樣本基本不屬于已知總體兩個總體的參數(shù)之間存在差異差異顯著差異顯著1.4假設(shè)檢驗(yàn)的基本原理小概率原理小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生小概率一般指p<0.051.5假設(shè)檢驗(yàn)的步驟P135建立虛無假設(shè)和備擇假設(shè)確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量指定檢驗(yàn)中的顯著性水平,計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,建立拒絕虛無假設(shè)的規(guī)則作出統(tǒng)計(jì)決策將檢驗(yàn)統(tǒng)計(jì)量的值與拒絕規(guī)則所指定的臨界值相比較,確定是否拒絕虛無假設(shè)(計(jì)算p值,利用p值確定是否拒絕虛無假設(shè))昨天晚上A足球隊(duì)以26:13大敗了B隊(duì)1.5.1假設(shè)檢驗(yàn)的一個例子某校一個班進(jìn)行比奈智力測驗(yàn),X=110,班級人數(shù)n=50,該測驗(yàn)常模

0=100,0=16。該班智力水平1(不是這一次測驗(yàn)結(jié)果)是否與常模水平有差異?研究假設(shè)和虛無假設(shè)

研究假設(shè)H1researchhypothesis

又叫備擇假設(shè)alternativehypothesis,指待驗(yàn)證的假設(shè),一般假設(shè)差異顯著虛無假設(shè)H0nullhypothesis又叫零假設(shè)zerohypothesis,原假設(shè),與研究假設(shè)對立的假設(shè),一般假設(shè)差異不顯著H1:1

0 H0:1=0Z檢驗(yàn)取

=0.05

1.5.2錯誤和錯誤

錯誤(I型錯誤)typeIerrorH0為真時卻被拒絕,棄真錯誤錯誤(II型錯誤)typeIIerrorH0為假時卻被接受,取偽錯誤

假設(shè)檢驗(yàn)中各種可能結(jié)果的概率

接受H0 拒絕H0,接受H1H0為真

1-

(正確決策) (棄真錯誤)H0為偽

(取偽錯誤) 1-(正確決策)

錯誤和錯誤的關(guān)系

+≠1對于固定的樣本容量n,與不能同時減小減少與的一個方法是增大樣本容量n1.5.3單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)問題的提法雙側(cè)檢驗(yàn):和已知常數(shù)0是否有顯著性差異?單側(cè)檢驗(yàn):是否顯著高(低)于已知常數(shù)0?建立的假設(shè)雙側(cè)檢驗(yàn):H0:

=0 H1:0單側(cè)檢驗(yàn):H0:

≤0 H1:>0

H0:

≥0 H1:<0拒絕域rejectionregion(相關(guān)概念:臨界值)雙側(cè)檢驗(yàn):Za/2單側(cè)檢驗(yàn):ZaP133例5-3某高校參加同專業(yè)的統(tǒng)一考試,隨機(jī)抽查64份試卷,由此求得平均成績?yōu)?9分,標(biāo)準(zhǔn)差為9.5分。已知該科全體考生成績服從正態(tài)分布,且總平均分為65分,問該高??忌钠骄煽兪欠耧@著高于全體考生的平均水平?用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)?做題根據(jù)題意做研究事先確定一般傾向于用雙側(cè)檢驗(yàn)思考題某人懷疑他得了某種疾病,到醫(yī)院檢查待驗(yàn)證的假設(shè)是“有病”還是“沒病”?醫(yī)生什么時候犯錯誤?什么時候犯錯誤?認(rèn)定實(shí)際沒病的他“有病”認(rèn)定實(shí)際有病的他“沒病”取多大?能不能直接驗(yàn)證一個假設(shè)?所有天鵝都是白的如果檢驗(yàn)結(jié)果接受了H0,我們可以說H0得到了證明嗎有一只天鵝是黑的2.總體均值的顯著性檢驗(yàn)

2.1總體正態(tài)且總體方差己知P137例5-4全市統(tǒng)一考試的數(shù)學(xué)平均分

0=62分,標(biāo)準(zhǔn)差0=10.2,一個學(xué)校的90名學(xué)生該次考試的平均成績?yōu)?8分,問該校成績與全市平均差異是否顯著。(?。?.05)P137例5-4解答例:有人調(diào)查早期教育對兒童智力發(fā)展的影響,從受過良好教育的兒童中隨機(jī)抽取70人進(jìn)行韋氏兒童智力測驗(yàn)(

0=100,0=15)結(jié)果X=103.3,能否認(rèn)為受過良好早期教育的兒童智力高于一般水平。2.2總體正態(tài)但總體方差未知P139例5-6學(xué)生的學(xué)習(xí)成績與教師的教學(xué)方法有關(guān)。某校一教師采用了一種他認(rèn)為新式有效的教學(xué)方法。經(jīng)過一學(xué)年的教學(xué)后,從該教師所教班級中隨機(jī)抽取了6名學(xué)生的考試成績,分別為48.5,49.0,53.5,49.5,56.0,52.5,而在該學(xué)年考試中,全年級的總平均分?jǐn)?shù)為52.0,試分析采用這種教學(xué)方法與未采用新教學(xué)方法的學(xué)生成績有無顯著的差異(已知考試成績服從正態(tài)分布,取

=0.05)例:一個汽車制造商聲稱,某一等級的輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000公里,對一個120個輪胎的隨機(jī)樣本作了試驗(yàn),測得平均值和標(biāo)準(zhǔn)差為X=41000,S=5000。已知輪胎壽命的公里數(shù)近似服從正態(tài)分布。該制造商的產(chǎn)品同他所說的標(biāo)準(zhǔn)相符嗎?(=0.05)2.3總體非正態(tài)P140例5-7某省進(jìn)行數(shù)學(xué)競賽,結(jié)果分?jǐn)?shù)的分布不是正態(tài),總平均分43.5。其中某縣參加競賽的學(xué)生168人,X=45.1,S=18.7,該縣平均分與全省平均分有否顯著差異?(=0.05)Z檢驗(yàn)和t檢驗(yàn)兩種檢驗(yàn)的前提之一總體正態(tài)分布當(dāng)n≥50時,兩種檢驗(yàn)的臨界值差不多相等,即Za/2≈ta/2(n)

(Z0.05/2=1.960,Z0.01/2=2.576)小結(jié)P141思考題1、某市場研究有限公司假定電話調(diào)查可在15分鐘以內(nèi)結(jié)束。如果調(diào)查所需時間超過該值,則需要加收額外費(fèi)用。假定由35個電話調(diào)查所組成的一個樣本表明,其樣本均值為17分鐘,樣本標(biāo)準(zhǔn)差為4分鐘。取顯著性水平=0.01,問是否需要額外收費(fèi)?思考題2、據(jù)美國商業(yè)部的經(jīng)濟(jì)分析局報道,北加利福尼亞居民年收入的均值為18688美元。一名研究者想對南加利福尼亞州檢驗(yàn)H0:=18688,H1

:18688,其中

為南加利福尼亞州居民年收入的均值。假定由400名南加利福尼亞州居民所組成的樣本表明,其年收入的樣本均值16868美元,樣本標(biāo)準(zhǔn)差為14624美元,則假設(shè)檢驗(yàn)的結(jié)論是什么?取顯著性水平為0.05。3.兩總體均值差異的顯著性檢驗(yàn)

3.1兩總體方差已知3.1.1總體方差已知,獨(dú)立樣本附:例:某地區(qū)的六歲兒童中隨機(jī)抽取男生30人,其平均身高為114cm,抽取女生27人,平均身高112.5cm。根據(jù)以往資料,該區(qū)六歲男女兒童身高的標(biāo)準(zhǔn)差男童為5cm,女童為6.5cm,問該區(qū)六歲男女兒童身高有無顯著差異?(=0.05)3.1.2總體方差已知,相關(guān)樣本例:某幼兒園在兒童入園時對49名兒童進(jìn)行了比奈智力測驗(yàn)(=16),結(jié)果平均智商X1=106,一年后再對同組被試施測,結(jié)果X2=110,已知兩次測驗(yàn)結(jié)果的相關(guān)系數(shù)r=0.74,問能否說隨著年齡增長與一年的教育,兒童智商有了顯著提高。(=0.01)3.2兩總體方差未知

3.2.1兩總體方差相等獨(dú)立樣本P144例5-9:某校進(jìn)行一項(xiàng)智力速度測驗(yàn),共有19名學(xué)生參加,其中男生12人,女生7人。測驗(yàn)共200道題目,在規(guī)定時間里,答對一題記1分,測驗(yàn)結(jié)束后,得到以下的測驗(yàn)成績男生12人:83、146、119、104、120、161、134、115、129、99、123女生7人:70、118、101、85、107、132、94試確定男、女生的平均成績有無顯著的差異(?。?.05)3.2.2兩總體方差不等,獨(dú)立樣本3.2.3兩總體方差未知,相關(guān)樣本,相關(guān)系數(shù)未知(p.148)3.2.4兩總體方差未知,相關(guān)樣本,相關(guān)系數(shù)已知3.3兩個非正態(tài)總體

n>30或n>50時用Z’檢驗(yàn)4方差的差異檢驗(yàn)4.1樣本方差與總體方差的差異檢驗(yàn)4.2兩個樣本方差差異檢驗(yàn)4.1樣本方差與總體方差的差異檢驗(yàn)P154例5-16全區(qū)統(tǒng)考中,全體學(xué)生的總方差為182,而某校51名學(xué)生成績的方差為122,問該校學(xué)生成績的方差與全區(qū)方差有無顯著差異?(?。?.05)4.2兩個樣本方差的差異檢驗(yàn)

4.2.1獨(dú)立樣本P156例5-17某次教改試驗(yàn)后,從施行兩種不同教學(xué)方法的班級中隨機(jī)各抽取10份和9份試卷,得到如下的成績數(shù)據(jù):

試驗(yàn)班:85,76,83,93,78,75,80,79,90,88

對比班:75,86,96,90,62,83,95,70,58

擬比較試驗(yàn)的效果,請先檢驗(yàn)方差是否齊性,以便于選取恰當(dāng)?shù)臋z驗(yàn)方法(=0.05)P156例5-18隨機(jī)抽取男生41人,女生31人進(jìn)行測驗(yàn),男女的樣本標(biāo)準(zhǔn)差分別是7和6。問男女生測驗(yàn)結(jié)果的方差是否有顯著差異?(=0.05)兩個樣本方差的差異檢驗(yàn)

4.2.2相關(guān)樣本5其他的假設(shè)檢驗(yàn)5.1總體比例差異的假設(shè)檢驗(yàn)5.2兩總體比例差異的假設(shè)檢驗(yàn)5.3總體相關(guān)系數(shù)的假設(shè)檢驗(yàn)5.4兩總體相關(guān)系數(shù)差異的假設(shè)檢驗(yàn)5.1總體比例差異的假設(shè)檢驗(yàn)例:一項(xiàng)調(diào)查結(jié)果表明某市老年人口比重為14.7%,該市老年人口研究會為了檢查該項(xiàng)調(diào)查是否可靠,隨機(jī)抽取了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上。調(diào)查結(jié)果是否支持該市老年人口比重為14.7%的看法?(

=0.05)5.2兩總體比例差異的假設(shè)檢驗(yàn)P159例5-20

分別在初一40人和初二45人中征求對學(xué)科興趣的意見,對外語表示愛好的比例分別為0.457和0.543。能否說明對外語的愛好同年級高低有關(guān)?5.3總體相關(guān)系數(shù)的假設(shè)檢驗(yàn)

假設(shè)總體相關(guān)

=0時P160例5-21某年級25名學(xué)生進(jìn)行了兩門課程的測驗(yàn),結(jié)果r=0.25,問該年級這兩種課程是否存在相關(guān)?(

=0.05)實(shí)際應(yīng)用查相關(guān)系數(shù)檢驗(yàn)表P486df=23,

=0.05

0.396假設(shè)總體相關(guān)

≠0時r的樣本分布不是正態(tài),不能用t檢驗(yàn),這時將r轉(zhuǎn)換成費(fèi)舍Zr(P487),而

例:對于10歲兒童而言,比奈智力測驗(yàn)與韋氏兒童智力測驗(yàn)的相關(guān)為0.70。隨機(jī)取出10歲兒童50名進(jìn)行上述兩種智力測驗(yàn),結(jié)果相關(guān)系數(shù)r=0.54。問實(shí)測結(jié)果是否和總體相符。(

=0.05)5.4積差相關(guān)系數(shù)差異的顯著性檢驗(yàn)P161例5-22從某市的重點(diǎn)中學(xué)和一般中學(xué)各抽取50名和60名考生,分別計(jì)算其數(shù)學(xué)成績和瑞文推理測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)為r1=0.79,r2=0.49,問兩相關(guān)系數(shù)差異是否顯著。(

=0.01)方差分析1.方差分析的原理估算誤差方差平方和分解2.單因素方差分析完全隨機(jī)隨機(jī)區(qū)組3.多重比較4.多因素方差分析1.方差分析的原理

1.1什么是方差分析AnalysisofVariance簡稱ANOVA,檢驗(yàn)多個總體均值是否相等分析實(shí)驗(yàn)數(shù)據(jù)中不同來源的變異對總體變異的貢獻(xiàn)大小,從而確定實(shí)驗(yàn)中的自變量是否對因變量有重要影響(見P167第二段)比較兩個以上的樣本平均數(shù)可以把方差分析看成是t檢驗(yàn)的擴(kuò)展分析兩個以上的自變量的效應(yīng)及其變量之間的交互作用1.2從一個例子看方差分析的原理Craik&Lockhart(1972)記憶效果和加工方式有關(guān)Eysenck(1974)50名55~65歲的被試隨機(jī)分組Counting計(jì)算字母的數(shù)目Rhyming想出押韻的詞Adjective想出一個修飾詞Imagery把詞想象成畫Intentional告知有記憶測驗(yàn)(前4組都不知道要測驗(yàn))過程:包含27個詞的表過3遍后要求被試寫下記住的詞1.2.1幾個概念因素:自變量independentvariable,處理treatment

如:加工方式因素的水平:一個因素的不同情況或取值,不同的實(shí)驗(yàn)處理如:Counting,Rhyming,Adjective,Imagery,Intentional因變量:自變量影響的結(jié)果如:記憶效果單因素方差分析one-wayANOVA只有一個因素,一個因變量多因素方差分析two,three,…-wayANOVA多個因素,一個因變量1.2.2虛無假設(shè)、前提假設(shè)虛無假設(shè)H0:m1=m2=m3=m4=m5方差分析的前提假設(shè)正態(tài)normality方差齊性homogeneityofvariance誤差方差errorvariance:和實(shí)驗(yàn)處理無關(guān)的方差某種實(shí)驗(yàn)處理的效果相當(dāng)于在每個人的分?jǐn)?shù)的基礎(chǔ)上加一個常數(shù)獨(dú)立independenceofobservations1.2.3估計(jì)總體方差的兩種方法

方法一方法二方差分析的邏輯用兩個方法來估計(jì)總體方差一種方法與虛無假設(shè)是否成立無關(guān)另一種方法以虛無假設(shè)成立為前提如果兩種方法算出來的結(jié)果一致,接受H0,否則拒絕H0處理效應(yīng)treatmenteffect1.2.4平方和的分解sumofsquares平方和的優(yōu)越性在于其可加性均方和方差只有在自由度相等時才可加變異的分解均方如果當(dāng)F≤1,數(shù)據(jù)的總變異中大部分是由實(shí)驗(yàn)誤差或個體差異造成的,不同的實(shí)驗(yàn)處理之間差異不大,即實(shí)驗(yàn)處理基本無效如果F>1且落入F分布的臨界區(qū)外,實(shí)驗(yàn)處理的作用顯著大于組內(nèi)變異的作用,可以確認(rèn)實(shí)驗(yàn)處理的有效作用,至少有兩個處理之間的差異顯著方差分析就是檢驗(yàn)組間變異在統(tǒng)計(jì)上是否顯著地大于組內(nèi)變異用原始數(shù)值計(jì)算方差分析表1.2.5方差分析的基本過程建立假設(shè)H0:無處理效應(yīng)H1:有處理效應(yīng)求平方和確定自由度求均方進(jìn)行F檢驗(yàn),單側(cè)列出方差分析表1.2.6方差齊性檢驗(yàn)

哈特萊Hartley法1.2.7方差分析和實(shí)驗(yàn)設(shè)計(jì)因素單因素多因素設(shè)計(jì)完全隨機(jī)設(shè)計(jì)隨機(jī)區(qū)組設(shè)計(jì)1.2.7.1完全隨機(jī)設(shè)計(jì)

Completerandomizeddesign把被試隨機(jī)分成若干組,每個組隨機(jī)指派一種實(shí)驗(yàn)處理。完全隨機(jī)分組后,各實(shí)驗(yàn)組的被試之間是相互獨(dú)立的,因而這種設(shè)計(jì)又稱“獨(dú)立組設(shè)計(jì)”或“被試間設(shè)計(jì)”不足之處誤差項(xiàng)包括實(shí)驗(yàn)本身的誤差又包括個體差異引起的誤差1.2.7.2隨機(jī)區(qū)組設(shè)計(jì)

randomizedblockdesign原則:同一組內(nèi)的被試應(yīng)盡量“同質(zhì)”一個被試作為一個區(qū)組,不同的被試(區(qū)組)均需接受全部k個實(shí)驗(yàn)處理每一區(qū)組內(nèi)被試的人數(shù)是實(shí)驗(yàn)處理的整數(shù)倍區(qū)組內(nèi)的基本單元標(biāo)識是以一個團(tuán)體為單元同一區(qū)組接受所有實(shí)驗(yàn)處理,實(shí)驗(yàn)處理之間有相關(guān),所以也稱為“相關(guān)組設(shè)計(jì)”或“被試內(nèi)設(shè)計(jì)”區(qū)組效應(yīng)和誤差變異的分離總平方和=組間平方和+區(qū)組平方和+誤差平方和2.單因素方差分析

2.1單因素完全隨機(jī)設(shè)計(jì)等重復(fù)設(shè)計(jì)各實(shí)驗(yàn)處理組的樣本容量相同不等重復(fù)設(shè)計(jì)各實(shí)驗(yàn)處理組樣本容量不同有各組均值、方差、樣本容量而無原始數(shù)據(jù)2.1.1等重復(fù)設(shè)計(jì)各實(shí)驗(yàn)處理組的樣本容量相同k個處理組,每個組樣本容量均為n例為研究不同科目的教師當(dāng)班主任,對學(xué)生某一學(xué)科的學(xué)習(xí)是否有影響。把40名學(xué)生隨機(jī)分派到5名教不同科目的班主任負(fù)責(zé)的班級中,經(jīng)過一段時間以后對這40名學(xué)生進(jìn)行數(shù)學(xué)考試,結(jié)果見下表。請檢驗(yàn)5組不同班主任的學(xué)生數(shù)學(xué)成績是否有顯著差異。2.1.2不等重復(fù)設(shè)計(jì)各實(shí)驗(yàn)處理組樣本容量不同計(jì)算組間平方和時,注意公式中的各組的nj不同2.1.3有樣本統(tǒng)計(jì)量無原始值(p.173)例:把20名被試隨機(jī)分成4組,每組(5人)接受一種教學(xué)方法,問四種教學(xué)方法是否有顯著差異? 教學(xué)方法:ABCD

每組人數(shù):5555

每組平均數(shù):55.487.2

每組方差:1.991.041.20 1.762.2單因素隨機(jī)區(qū)組設(shè)計(jì)方差分析有四種小學(xué)語文實(shí)驗(yàn)教材,分別代號為A、B、C、D。為比較其教學(xué)效果,按隨機(jī)區(qū)組設(shè)計(jì)原則,將小學(xué)分為城鎮(zhèn)重點(diǎn)小學(xué)、城鎮(zhèn)一般小學(xué)和鄉(xiāng)村小學(xué)三個區(qū)組,分別代號為I、II、III,并分別在每個區(qū)組中隨機(jī)地抽取4所小學(xué),它們分別被隨機(jī)地指派實(shí)驗(yàn)一種教材。經(jīng)一年教學(xué)后通過統(tǒng)一考試得到各校的平均成績?nèi)缦卤?。問四種教材的教學(xué)效果是否一致?隨機(jī)區(qū)組設(shè)計(jì)-平方和分解隨機(jī)區(qū)組設(shè)計(jì)方差分析的步驟隨機(jī)區(qū)組設(shè)計(jì)的方差分析表3.多重比較multiplecomparison如果方差分析的結(jié)果表明差異顯著,只能說明多個平均數(shù)之間至少有兩個之間的差異顯著,但沒有指出哪些平均數(shù)之間的差異顯著是否可以用t檢驗(yàn)對平均數(shù)兩兩比較來尋找哪些有顯著差異的平均數(shù)對呢?

不行!因?yàn)榉竌錯誤的概率增加若H0為真,一次比較犯錯誤的概率是a若一次實(shí)驗(yàn)中做了n次獨(dú)立的比較,那么這n次比較中犯錯誤的次數(shù)是na這n次比較中至少有一次犯a錯誤的概率是

1-(1-a)nN-K法Newman-KeulP184例6-52×2肥料:A、B土壤:紅、黑4多因素方差分析4.1幾個基本概念析因設(shè)計(jì)factorialdesign實(shí)驗(yàn)處理包括所有自變量的所有水平之間的兩兩組合,如5×2,3×3×3,2×2×2×2因素和水平主效應(yīng)maineffect單個自變量和單個因變量之間的基本關(guān)系交互作用interaction兩個或多個自變量的效應(yīng)是彼此依賴的4.2多因素方差分析總平方和分解在兩因素的完全隨機(jī)設(shè)計(jì)中SSt=SSA+SSB+SSAB+SSe在兩因素的隨機(jī)區(qū)組設(shè)計(jì)中

SSt=SSbk+SSA+SSB+SSAB+SSe4.3二因素完全隨機(jī)設(shè)計(jì)方差分析例:研究不同的教學(xué)態(tài)度(因素A)和不同的教學(xué)方法(因素B)對兒童識字量的作用,將20名被試隨機(jī)分成四組(每組5人),每組接受一種實(shí)驗(yàn)處理,結(jié)果見下表A因素:A1為“嚴(yán)肅”,A2為“輕松”B因素:B1

為集中識字,B2為分散識字因變量為“識字量”二因素完全隨機(jī)設(shè)計(jì)方差分析表4.4交互作用和主效應(yīng)兩因素之間的交互作用非常顯著,表明集中識字與分散識字效果的不同是受不同教學(xué)態(tài)度影響的。同樣,不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論