概率論及數(shù)理統(tǒng)計方差分析與回歸分析課件

上傳人：小*** IP屬地：江蘇上傳時間：2022-12-13 格式：PPT 頁數(shù)：240 大?。?.48MB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩235頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

時間反復(fù)無常，鼓著翅膀飛逝概率論及數(shù)理統(tǒng)計方差分析與回歸分析概率論及數(shù)理統(tǒng)計方差分析與回歸分析時間反復(fù)無常，鼓著翅膀飛逝概率論及數(shù)理統(tǒng)計方差分析與回歸分析第八章方差分析與回歸分析§8.1方差分析§8.2多重比較§8.3方差齊性分析§8.4一元線性回歸§8.5一元非線性回歸§8.1方差分析8.1.1問題的提出實際工作中我們經(jīng)常碰到多個正態(tài)總體均值的比較問題，處理這類問題通常采用所謂的方差分析方法。英語作為世界通用語言是一門基礎(chǔ)性學(xué)科，其口語交際能力更是一個人綜合素質(zhì)的體現(xiàn)。然而，在廣大農(nóng)村地區(qū)，初中英語教育并沒有得到良好的重視，并且由于缺乏相應(yīng)的教學(xué)資金和教育人才，農(nóng)村初中英語口語交際教學(xué)一直很薄弱。這極大影響了初中生們的升學(xué)和未來的發(fā)展。1農(nóng)村初中英語口語交際教學(xué)出現(xiàn)的問題1.1缺乏語言環(huán)境農(nóng)村人連普通話都不一定能講，更何況是英語。初中的學(xué)生不管是在學(xué)校還是在家里都缺乏英語口語交際的語言環(huán)境。在學(xué)校也只是英語課的時候朗讀一下英語單詞，背誦英語課文。其他時候并沒有機(jī)會接觸到英語，更何況是用英語和別人交流。由于缺乏一定的語言環(huán)境，導(dǎo)致學(xué)生不敢也不善于用英語與別人交際，英語口語也是比城市的小孩差。1.2英語教師的口語水平低廣大農(nóng)村地區(qū)，由于教師工資比城市低，交通又不方便等等，很多優(yōu)秀的外語教育工作者并不會選擇去農(nóng)村教書。很多農(nóng)村的英語老師就是當(dāng)?shù)氐囊恍┱莆樟艘稽c英語基礎(chǔ)的人擔(dān)任的。大部分經(jīng)過專業(yè)訓(xùn)練的外語教師很少留在農(nóng)村教學(xué)。這樣一來，就導(dǎo)致英語教師的口語水平低。老師的口語水平低，那學(xué)生的口語水平自然不高。因此，和城市的小孩比起來，農(nóng)村的小孩受到的外語教育缺失，外語教育資源極度匱乏。1.3注重應(yīng)試技巧少口語培訓(xùn)對于大山里的小孩來說，最大的夢想大概就是飛出大山，然后成為一個城市人，能夠用知識改變命運。因此，大部分的農(nóng)村還是以應(yīng)試教育為主，素質(zhì)教育還沒有延伸到廣大農(nóng)村地區(qū)。英語考試不考口語，對于農(nóng)村的小孩來說就不會多練口語，因為在他們看來練了也沒用，還不如多做幾道題，熟悉做題的規(guī)則。也正是因為注重應(yīng)試技巧缺少口語培訓(xùn)，因此，農(nóng)村的初中口語交際能力很差，也必須從源頭上進(jìn)行改進(jìn)。1.4聽英語機(jī)會少對于城市的小孩來說，聽英語的機(jī)會還是很多的。一方面可能家長就會在家里看美劇英劇等等，因此從小就有一定的聽力基礎(chǔ)。另一方面，在街上可能就能碰到老外在講英文。但是在農(nóng)村，這種機(jī)會非常之少，父母大部分沒文化，只會看國產(chǎn)劇，在街上也碰不到老外。唯一聽英語的機(jī)會估計就是聽英語磁帶，更何況英語磁帶是一種機(jī)械性的播放，特別的無聊，根本不能引起小孩學(xué)英語的興趣。因此，農(nóng)村的小孩對于英語應(yīng)該是比較陌生而機(jī)械的。1.5心理障礙農(nóng)村的小孩普遍比較害羞，讓他們在公眾場合講英語，他們可能都能臉紅。一方面是因為缺乏這種大場面的培養(yǎng)，另一方面也是由于自身的心理障礙?？傆X得自己講不好很丟臉，也覺得自己為什么要開口講英文。正是由于心理障礙問題的存在，英語口語交際才會出現(xiàn)這樣或者那樣的問題?？梢姡瑢τ诔踔猩男睦锝ㄔO(shè)是多么重要。2農(nóng)村初中英語口語交際教學(xué)策略2.1創(chuàng)造一定的口語環(huán)境口語環(huán)境對于一個初中生的口語訓(xùn)練來講是非常的。只有一個良好的口語環(huán)境才能培養(yǎng)出一個優(yōu)秀的英語口語學(xué)生。對于一個外語來講，需要創(chuàng)造出一定的口語環(huán)境。比如，在英語課堂上，不要只是念課文，講題目，還需要和學(xué)生互動，讓學(xué)生念課文，讓學(xué)生組團(tuán)模仿課文的對話等等。還可以創(chuàng)造一些英語場景，讓學(xué)生自己組織并表演出來。就這樣的在各種外語環(huán)境的熏陶下，學(xué)生的口語交際能力才能提高。2.2引進(jìn)優(yōu)秀的外語教師外語教師會影響一個學(xué)生的英語基礎(chǔ)，甚至影響其整個英語生涯。優(yōu)秀的外語教師能夠帶領(lǐng)學(xué)生往正確的方向發(fā)展，能夠糾正學(xué)生的發(fā)音，能夠啟蒙學(xué)生的英語感覺，甚至能夠讓學(xué)生對外語產(chǎn)生興趣。因此，對于初中學(xué)生來說，一個優(yōu)秀的外語教師實在是太重要了。農(nóng)村雖然落后，但是相關(guān)教育部門可以投入一部分資金引進(jìn)一些比較優(yōu)秀的教師，把優(yōu)秀的人才吸引過來。只有這樣才能真正提高學(xué)生的英語口語交際能力。2.3多加強(qiáng)口語培訓(xùn)外語口語能力和其他能力一樣也是需要多練的，只不過口語交際能力是用嘴巴講，其他的考試能力是用筆練。加強(qiáng)口語培訓(xùn)，一方面需要外語老師創(chuàng)造一定的外語環(huán)境，除了在課堂上多與學(xué)生互動，同時還應(yīng)當(dāng)布置一些課后的口語作業(yè)，在課堂上呈現(xiàn)。另一方面，除了課文的教育，外語教師還可以將國外的時事新聞和一些精彩的脫口秀節(jié)目播放給學(xué)生看，并叫他們學(xué)習(xí)模仿和跟讀等等。通過這一系列的培訓(xùn)，學(xué)生的口語交際能力也能得到很大的提高，同時還開闊了學(xué)生的視野。2.4加強(qiáng)學(xué)生的心理建設(shè)農(nóng)村的小孩，比不上城市的小孩生活條件好，同時也沒有那么豐富的課外活動，交際活動也參加得少。在講英語時，自身的心理障礙也比較難以克服，因此，很難讓他們開口講英語。作為一個英語老師，學(xué)生的心理需要時時關(guān)注，并且在必要的時刻做一些心理建設(shè)。比如講述自己學(xué)英語的經(jīng)歷，以及讓學(xué)生和自己用英語對話，接著擴(kuò)展到班級。只要把學(xué)生的心理障礙克服了，那么練習(xí)英語口語就變得簡單很多。作為一個優(yōu)秀的英語老師，應(yīng)當(dāng)首先從心理方面去了解自己的學(xué)生。只有這樣才能從根源上教好書。信息技術(shù)已經(jīng)廣泛應(yīng)用到生活、工作、學(xué)習(xí)中，培養(yǎng)學(xué)生的信息處理能力成為學(xué)校教育發(fā)展的必然要求。無論制訂教學(xué)計劃的出發(fā)點是信息技術(shù)文化觀，還是信息技術(shù)工具論，都把信息技術(shù)學(xué)科教學(xué)作為進(jìn)行信息技術(shù)教育的主要途徑，都強(qiáng)調(diào)通過在中學(xué)開設(shè)信息技術(shù)學(xué)科課程培養(yǎng)學(xué)生的信息技術(shù)意識和應(yīng)用能力。根據(jù)信息技術(shù)本身的特點，信息技術(shù)教學(xué)的思想、方法、模式應(yīng)是先進(jìn)、富有生命力和富有創(chuàng)意的。那么，如何在教學(xué)實踐中提高信息技術(shù)教學(xué)質(zhì)效呢？一、加強(qiáng)課前預(yù)習(xí)設(shè)計預(yù)習(xí)是重要的學(xué)習(xí)環(huán)節(jié)，可以了解本節(jié)課的重點難點。很多信息技術(shù)教師不重視學(xué)生課前的預(yù)習(xí)，再加上學(xué)校的硬件設(shè)備不同，有的學(xué)校有投影設(shè)備，教師可以演示；有的學(xué)校沒有投影設(shè)備，只能靠教師講。在學(xué)習(xí)過程中，學(xué)生會遇到問題，在教材中尋找答案可以培養(yǎng)學(xué)生自主學(xué)習(xí)的能力，也可以相互討論，互相學(xué)習(xí)。這些都需要通過預(yù)習(xí)熟悉教材。1.布置預(yù)習(xí)任務(wù)。學(xué)生很少有預(yù)習(xí)的習(xí)慣，需要教師在上課前一天布置預(yù)習(xí)任務(wù)。內(nèi)容不要太難，讓學(xué)生通讀兩遍教材，了解講課順序。如果教材知識點較多，譬如在“運用函數(shù)”、“絕對引用”、“相對引用”等內(nèi)容時，可以自己編寫預(yù)習(xí)題，讓學(xué)生總結(jié)概念。2.課前預(yù)習(xí)。信息技術(shù)課容量較大，在教學(xué)過程中要讓學(xué)生嘗試學(xué)習(xí)，還要有充足的時間練習(xí)，課堂教學(xué)時間比較緊張。為了充分利用時間，可以在學(xué)生進(jìn)機(jī)房前用三五分鐘預(yù)習(xí)。這種預(yù)習(xí)不需要通篇都看，教師提出教學(xué)重點難點，學(xué)生重點閱讀教材。如在《資源管理器窗口》這一節(jié)中“節(jié)點”的概念是本節(jié)的突破口，可布置學(xué)生閱讀教材，了解節(jié)點的概念、節(jié)點符號的含義。3.預(yù)習(xí)效果的檢查。（1）上課提問。在上課時有目的地提問學(xué)生，檢查預(yù)習(xí)效果。好處：教師可以選擇檢查不同的學(xué)生，直接了解預(yù)習(xí)效果，掌握學(xué)生對于教材的理解程度，調(diào)整教學(xué)進(jìn)度。壞處：檢查面較窄；（2）小組討論。分小組討論本節(jié)課教學(xué)內(nèi)容，由小組成員總結(jié)重難點，以及解決方法。好處：調(diào)動學(xué)學(xué)生學(xué)習(xí)的積極性，培養(yǎng)學(xué)生交流合作的能力。壞處：不好控制進(jìn)度，容易浪費時間；（3）落實到紙上。布置學(xué)生將預(yù)習(xí)到重點難點，寫到紙上，由教師批閱。好處：檢查面大；壞處：容易抄襲。二、有效選擇課堂教學(xué)方法教學(xué)方法的選擇不僅要考慮當(dāng)前的教序任務(wù)、教學(xué)內(nèi)容特點和學(xué)生的特點，還要考慮教學(xué)手段、教學(xué)環(huán)境、教師特點等因素。總結(jié)起來，選擇教學(xué)方法的依據(jù)主要有以下幾個方面：1.教學(xué)目的。每節(jié)課都有每節(jié)課的教學(xué)目的，目的不同，就需選擇不同的教學(xué)方法，要選擇與教學(xué)目的相適應(yīng)的能夠達(dá)到教學(xué)目的的教學(xué)方法。例如教師在向?qū)W生傳授新知識時，采用講授法或演示法；學(xué)生在掌握動作技能技巧時，采用練習(xí)法等。2.教學(xué)內(nèi)容。教學(xué)目的是通過學(xué)生在教學(xué)過程中掌握特定的教學(xué)內(nèi)容實現(xiàn)的，各門學(xué)科都需要根據(jù)該學(xué)科中教學(xué)內(nèi)容的特點，采取相應(yīng)的教學(xué)方法，即使某門學(xué)科教學(xué)進(jìn)程中的某一階段，隨其所教的具體內(nèi)容不同，也要采取不同的具體教學(xué)方法與之相適應(yīng)。例如中學(xué)信息技術(shù)課程常常采取講授與演示相結(jié)合的方法及上機(jī)實驗法，但對于其中的網(wǎng)絡(luò)基礎(chǔ)及其應(yīng)用部分就要根據(jù)具體內(nèi)容，決定采取哪種教學(xué)方法，像網(wǎng)絡(luò)的基本概念，就會偏重于講授法，對于因特網(wǎng)所提供的各種信息服務(wù)，則偏重于上機(jī)實驗。3.學(xué)生情況。教師的教是為了學(xué)生的學(xué)，教學(xué)方法要適應(yīng)學(xué)生的基礎(chǔ)條件和個性特征。有些學(xué)生對某種事物有大量的感性知識，教師一講某一現(xiàn)象，學(xué)生就可以理解，不必都用直觀教具進(jìn)行演示，有些學(xué)生缺乏感性認(rèn)識基礎(chǔ)，必須采取直觀演示的方法；對已有自主學(xué)習(xí)能力的學(xué)生，可以在學(xué)生自學(xué)的基礎(chǔ)上，針對學(xué)生學(xué)習(xí)中可能遇到的疑難問題，運用講解法，而對于尚無自主學(xué)習(xí)能力的學(xué)生，則需要一個時期的自學(xué)輔導(dǎo)訓(xùn)練，待學(xué)生具有一定自學(xué)能力時再采取在自主學(xué)習(xí)基礎(chǔ)上的有針對性地講解的方法。4.教師素養(yǎng)。教學(xué)方法的選用，只有適應(yīng)教師的素養(yǎng)條件，能為教師所掌握，才能發(fā)揮作用。有的教學(xué)方法雖好，但教師缺乏必要的素養(yǎng)條件，自己駕馭不了，不能在教學(xué)實踐中取得良好的效果。例如運用啟發(fā)式教學(xué)法，教師對教學(xué)內(nèi)容的理解必須是有一定深度的，能隨著具體情況，從不同的角度，機(jī)動靈活地用不同的語言表述對問題的理解，針對學(xué)生問題的矛盾焦點，幾句話就啟迪學(xué)生，使學(xué)生豁然開朗；如果教師對教學(xué)內(nèi)容的理解很膚淺，不能融會貫通，透徹掌握，只能教條地記住、背熟，那么，利用啟發(fā)談話法時，遇到學(xué)生從各種不同角度提出各種不同的看法，就不會隨機(jī)應(yīng)變地抓住要點。教學(xué)方法是師生為達(dá)到教學(xué)目的而相互結(jié)合的活動方式，包括教師教的方法和學(xué)生學(xué)的方法。教學(xué)中采用什么樣的教學(xué)方法教學(xué)生，對于把學(xué)生培養(yǎng)成什么樣的人，具有重要作用。這是因為教師的教法往往制約著學(xué)生的學(xué)法，同時給學(xué)生的智力和個性以重要的影響。總之，在初中實施信息技術(shù)課程教育，需要教師不斷更新教學(xué)理念，積極實踐探索，以飽滿的熱情投入信息技術(shù)教學(xué)，大膽創(chuàng)新，為信息技術(shù)課教學(xué)闖出一片新天地，切實提高教學(xué)質(zhì)效。時間反復(fù)無常，鼓著翅膀飛逝概率論及數(shù)理統(tǒng)計方差分析與回歸分析1第八章方差分析與回歸分析

§8.1

方差分析§8.2

多重比較§8.3

方差齊性分析§8.4

一元線性回歸§8.5

一元非線性回歸

第八章方差分析與回歸分析§8.1方差分析概率論及數(shù)理統(tǒng)計方差分析與回歸分析課件概率論及數(shù)理統(tǒng)計方差分析與回歸分析課件概率論及數(shù)理統(tǒng)計方差分析與回歸分析課件概率論及數(shù)理統(tǒng)計方差分析與回歸分析課件8.1.2

單因子方差分析的統(tǒng)計模型

在例8.1.1中我們只考察了一個因子，稱其為單因子試驗。

通常，在單因子試驗中，記因子為A,設(shè)其有r個水平，記為A1,A2,…,Ar，在每一水平下考察的指標(biāo)可以看成一個總體，現(xiàn)有r個水平，故有r個總體，

假定：8.1.2單因子方差分析的統(tǒng)計模型在例8.每一總體均為正態(tài)總體，記為N(i,

i2)，i＝1,2,…,r；各總體的方差相同:1

2=22=…=

r2=

2；從每一總體中抽取的樣本是相互獨立的，即所有的試驗結(jié)果yij都相互獨立。

每一總體均為正態(tài)總體，記為N(i,i2)，我們要比較各水平下的均值是否相同,即要對如下的一個假設(shè)進(jìn)行檢驗:H0

：1

=2=…=r（8.1.1）備擇假設(shè)為H1

：1,2,…,r不全相等在不會引起誤解的情況下，H1通?？墒÷圆粚憽Ｈ绻鸋0成立，因子A的r個水平均值相同，稱因子A的r個水平間沒有顯著差異，簡稱因子A不顯著；反之，當(dāng)H0不成立時，因子A的r個水平均值不全相同，這時稱因子A的不同水平間有顯著差異，簡稱因子A顯著。

我們要比較各水平下的均值是否相同,為對假設(shè)（8.1.1）進(jìn)行檢驗，需要從每一水平下的總體抽取樣本，設(shè)從第i個水平下的總體獲得m個試驗結(jié)果，記yij表示第i個總體的第j次重復(fù)試驗結(jié)果。共得如下n=rm個試驗結(jié)果：yij，i＝1,2,…,r，j＝1,2,…,m,

其中r為水平數(shù)，m為重復(fù)數(shù)，i為水平編號，j為重復(fù)編號。

為對假設(shè)（8.1.1）進(jìn)行檢驗，需要從每一水平下的總

在水平Ai下的試驗結(jié)果yij與該水平下的指標(biāo)均值i一般總是有差距的，記ij=yiji，

ij稱為隨機(jī)誤差。于是有yij=

i+ij

（8.1.2）（8.1.2）式稱為試驗結(jié)果yij的數(shù)據(jù)結(jié)構(gòu)式。

在水平Ai下的試驗結(jié)果yij與該水平下的指標(biāo)均值i

單因子方差分析的統(tǒng)計模型：（8.1.3）

總均值與效應(yīng):稱諸i的平均為總均值.稱第i水平下的均值i與總均值

的差:

ai=i-為Ai的效應(yīng)。

單因子方差分析的統(tǒng)計模型：模型（8.1.3）可以改寫為

(8.1.8)

假設(shè)（8.1.1）可改寫為

：a1

=a2=…=ar=0（8.1.9）

模型（8.1.3）可以改寫為8.1.3平方和分解

一、試驗數(shù)據(jù)通常在單因子方差分析中可將試驗數(shù)據(jù)列成如下頁表格形式。表8.1.2中的最后二列的和與平均的含義如下：8.1.3平方和分解一、試驗數(shù)據(jù)表8.1.2中的最后表8.1.2

單因子方差分析試驗數(shù)據(jù)

因子水平

試驗數(shù)據(jù)

和

平均

A1y11

y12

…y1mT1A2y21

y22

…y2mT2┆┆┆┆Aryr1

yr2

…yrmTrT表8.1.2單因子方差分析試驗數(shù)據(jù)因子水平試驗數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均間的偏差可用yij

表示，它可分解為二個偏差之和（8.1.10）記二、組內(nèi)偏差與組間偏差數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均間的偏差由于（8.1.11）所以yij-僅反映組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機(jī)誤差，稱為組內(nèi)偏差；而（8.1.12）除了反映隨機(jī)誤差外，還反映了第i個水平的效應(yīng)，稱為組間偏差。由于在統(tǒng)計學(xué)中，把k個數(shù)據(jù)y1,y2,…,yk分別對其均值=(y1+…+yk)/k的偏差平方和稱為k個數(shù)據(jù)的偏差平方和，它常用來度量若干個數(shù)據(jù)分散的程度。三、偏差平方和及其自由度在統(tǒng)計學(xué)中，把k個數(shù)據(jù)y1,y2,…,yk分別對其在構(gòu)成偏差平方和Q的k個偏差y1

,…,yk

間有一個恒等式，這說明在Q中獨立的偏差只有k1個。在統(tǒng)計學(xué)中把平方和中獨立偏差個數(shù)稱為該平方和的自由度，常記為f，如Q的自由度為fQ=k1。自由度是偏差平方和的一個重要參數(shù)。

在構(gòu)成偏差平方和Q的k個偏差y1,…,yk各yij間總的差異大小可用總偏差平方和

表示，其自由度為fT=n1；四、總平方和分解公式僅由隨機(jī)誤差引起的數(shù)據(jù)間的差異可以用組內(nèi)偏差平方和表示，也稱為誤差偏差平方和，其自由度為fe=nr；各yij間總的差異大小可用總偏差平方和四、總平方和分解公式由于組間差異除了隨機(jī)誤差外，還反映了效應(yīng)間的差異，故由效應(yīng)不同引起的數(shù)據(jù)差異可用組間偏差平方和表示，也稱為因子A的偏差平方和，其自由度為fA=r1；

由于組間差異除了隨機(jī)誤差外，還反映了效應(yīng)間的差異，故由效應(yīng)不定理8.1.1在上述符號下，總平方和ST可以分解為因子平方和SA與誤差平方和Se之和，其自由度也有相應(yīng)分解公式，具體為：ST=SA+Se,fT=fA+fe（8.1.16）（8.1.16）式通常稱為總平方和分解式。

定理8.1.1在上述符號下，總平方和ST可以分解偏差平方和Q的大小與自由度有關(guān)，為了便于在偏差平方和間進(jìn)行比較，統(tǒng)計上引入了均方和的概念，它定義為MS=Q/fQ，其意為平均每個自由度上有多少平方和，它比較好地度量了一組數(shù)據(jù)的離散程度。如今要對因子平方和SA與誤差平方和Se之間進(jìn)行比較，用其均方和MSA=SA

/fA，MSe=Se

/fe進(jìn)行比較更為合理，故可用作為檢驗H0的統(tǒng)計量。8.1.4檢驗方法偏差平方和Q的大小與自由度有關(guān)，為了便于在偏差平方和定理8.1.2在單因子方差分析模型(8.1.8)及前述符號下，有(1)Se/

2(nr)，從而E(Se)

＝(nr)

2，進(jìn)一步，若H0成立，則有SA/

2(r1)(2)SA與Se獨立。

定理8.1.2在單因子方差分析模型(8.1.8)及由定理8.1.2，若H0成立，則檢驗統(tǒng)計量F服從自由度為fA和fe的F分布，因此拒絕域為W={FF1(fA,fe)}，通常將上述計算過程列成一張表格，稱為方差分析表。表8.1.3

單因子方差分析表來源平方和自由度均方和F比因子SAfA=r1MSA=SA/fAF＝MSA/MSe誤差Sefe=nrMSe=Se/fe總和STfT=n1由定理8.1.2，若H0成立，則檢驗統(tǒng)計量F服從自由度為fA對給定的，可作如下判斷：若F

F1(fA,fe)，則說明因子A不顯著。該檢驗的p值也可利用統(tǒng)計軟件求出，若以Y記服從F(fA,fe)的隨機(jī)變量，則檢驗的

p值為p=P(YF)。如果F>F1(fA,fe)，則認(rèn)為因子A顯著；對給定的，可作如下判斷：若FF1(fA,fe常用的各偏差平方和的計算公式如下：

（8.1.19）

一般可將計算過程列表進(jìn)行。

常用的各偏差平方和的計算公式如下：例8.1.2采用例8.1.1的數(shù)據(jù)，將原始數(shù)據(jù)減去1000，列表給出計算過程：表8.1.4例8.1.2的計算表水平數(shù)據(jù)（原始數(shù)據(jù)-1000）TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363例8.1.2采用例8.1.1的數(shù)據(jù)，將原始數(shù)據(jù)減去10利用(8.1.19)，可算得各偏差平方和為：把上述諸平方和及其自由度填入方差分析表利用(8.1.19)，可算得各偏差平方和為：表8.1.5例8.1.2的方差分析表

來源平方和自由度均方和F比因子9660.083324830.04173.5948

誤差28215.9584211343.6171總和37876.041723若取=0.05，則F0.95

,21)=3.47，由于F=3.5948>3.47，故認(rèn)為因子A（飼料）是顯著的，即三種飼料對雞的增肥作用有明顯的差別。

表8.1.5例8.1.2的方差分析表來源平方和自由度8.1.5參數(shù)估計

在檢驗結(jié)果為顯著時，我們可進(jìn)一步求出總均值、各主效應(yīng)ai和誤差方差2的估計。

8.1.5參數(shù)估計在檢驗結(jié)果為顯著時，我們可一、點估計由模型(8.1.8)知諸yij相互獨立，且yij~N(+ai,2)，因此，可使用極大似然方法求出一般平均、各主效應(yīng)ai和誤差方差2的估計:由極大似然估計的不變性，各水平均值i的極大似然估計為，由于不是2的無偏估計，可修偏：

一、點估計由于，可給出Ai的水平均值i的1-的置信區(qū)間為

其中。

二、置信區(qū)間由于例8.1.3繼續(xù)例8.1.2，此處我們給出諸水平均值的估計。因子A的三個水平均值的估計分別為從點估計來看，水平2（以槐樹粉為主的飼料）是最優(yōu)的。

例8.1.3繼續(xù)例8.1.2，此處我們給出諸水平均值的估誤差方差的無偏估計為利用(8.1.23)可以給出諸水平均值的置信區(qū)間。此處，，若取＝0.05，則t1-

/2(fe)=t0.95(21

)=2.0796，，于是三個水平均值的0.95置信區(qū)間分別為誤差方差的無偏估計為在單因子試驗的數(shù)據(jù)分析中可得到如下三個結(jié)果：

因子是否顯著；

試驗的誤差方差2的估計；

諸水平均值i的點估計與區(qū)間估計。

在因子A顯著時，通常只需對較優(yōu)的水平均值作參數(shù)估計，在因子A不顯著場合，參數(shù)估計無需進(jìn)行。在單因子試驗的數(shù)據(jù)分析中可得到如下三個結(jié)果：因子8.1.6重復(fù)數(shù)不等情形單因子方差分析并不要求每個水平下重復(fù)試驗次數(shù)全相等，在重復(fù)數(shù)不等場合的方差分析與重復(fù)數(shù)相等情況下的方差分析極為相似，只在幾處略有差別。

數(shù)據(jù)：設(shè)從第i個水平下的總體獲得mi個試驗結(jié)果，記為yi1

,yi2…,yim，i=1,2,…r，統(tǒng)計模型為：

（8.1.24）

8.1.6重復(fù)數(shù)不等情形數(shù)據(jù)：設(shè)從第i個水平下的總體獲總均值：諸i的加權(quán)平均（所有試驗結(jié)果的均值的平均）（8.1.25）稱為總均值或一般平均。

效應(yīng)約束條件：

各平方和的計算：SA的計算公式略有不同

總均值：諸i的加權(quán)平均（所有試驗結(jié)果的均值的平均）效應(yīng)約例8.1.4

某食品公司對一種食品設(shè)計了四種新包裝。為考察哪種包裝最受顧客歡迎，選了10個地段繁華程度相似、規(guī)模相近的商店做試驗，其中二種包裝各指定兩個商店銷售，另二個包裝各指定三個商店銷售。在試驗期內(nèi)各店貨架排放的位置、空間都相同，營業(yè)員的促銷方法也基本相同，經(jīng)過一段時間，記錄其銷售量數(shù)據(jù)，列于表8.1.6左半邊，其相應(yīng)的計算結(jié)果列于右側(cè)。

例8.1.4某食品公司對一種食品設(shè)計了四種新包裝。表8.1.6銷售量數(shù)據(jù)及計算表

包裝類型

銷售量

miTiTi2/miA11218230450468A2141213339507509A319172135710831091A4243025414581476和n=10T=180表8.1.6銷售量數(shù)據(jù)及計算表包裝類型銷售量miT由此可求得各類偏差平方和如下

方差分析表如表8.1.8所示.若?。?.01，查表得F0.01(3,6)=9.78，由于F=11.22>9.78，故我們可認(rèn)為各水平間有顯著差異。

由此可求得各類偏差平方和如下若?。?.01，查表得F0.表8.1.7例8.1.4的方差分析表

來源平方和自由度均方和F比因子A25838611.22誤差e4667.67總和T3049表8.1.7例8.1.4的方差分析表來源平方和自由由于因子顯著，我們還可以給出諸水平均值的估計。因子A的四個水平均值的估計分別為由此可見，第四種包裝方式效果最好。誤差方差的無偏估計為由于因子顯著，我們還可以給出諸水平均值的估計。因子A進(jìn)一步，利用(8.1.23)也可以給出諸水平均值的置信區(qū)間，只是在這里要用不同的mi代替那里相同的m。此處，，若?。?.05，則t1-/2(fe)=t0.95(6)=2.4469，

，于是效果較好的第三和第四個水平均值的0.95置信區(qū)間分別為

進(jìn)一步，利用(8.1.23)也可以給出諸水平均值的置§8.2

多重比較

8.2.1效應(yīng)差的置信區(qū)間如果方差分析的結(jié)果因子A顯著，則等于說有充分理由認(rèn)為因子A各水平的效應(yīng)不全相同，但這并不是說它們中一定沒有相同的。就指定的一對水平Ai與Aj，我們可通過求i-j的區(qū)間估計來進(jìn)行比較。

§8.2多重比較8.2.1效應(yīng)差的置信區(qū)間由于，故由此給出i-j的置信水平為1-的置信區(qū)間為(8.2.1)其中是2的無偏估計。這里的置信區(qū)間與第六章中的兩樣本的t區(qū)間基本一致，區(qū)別在于這里2的估計使用了全部樣本而不僅僅是兩個水平Ai,Aj下的觀測值。由于例8.2.1

繼續(xù)例8.1.2，，fe=21，?。?.05，則t1-/2(fe)=t0.975(21)=2.0796，于是可算出各個置信區(qū)間為

可見第一個區(qū)間在0的左邊，所以我們可以概率95%斷言認(rèn)為1

小于2，其它二個區(qū)間包含0點，雖然從點估計角度看水平均值估計有差別，但這種差異在0.05水平上是不顯著的。

例8.2.1繼續(xù)例8.1.2，8.2.2多重比較問題對每一組(i,j)，(8.2.1)給出的區(qū)間的置信水平都是1，但對多個這樣的區(qū)間，要求其同時成立，其聯(lián)合置信水平就不再是1了。

8.2.2多重比較問題譬如，設(shè)E1,…,Ek是k個隨機(jī)事件，且有

P(Ei)=1，i=1,…,k，則其同時發(fā)生的概率這說明它們同時發(fā)生的概率可能比1小很多。為了使它們同時發(fā)生的概率不低于1，一個辦法是把每個事件發(fā)生的概率提高到1/k.這將導(dǎo)致每個置信區(qū)間過長，聯(lián)合置信區(qū)間的精度很差，一般人們不采用這種方法。

譬如，設(shè)E1,…,Ek是k個隨機(jī)事件，且有在方差分析中，如果經(jīng)過F檢驗拒絕原假設(shè)，表明因子A是顯著的，即r個水平對應(yīng)的水平均值不全相等，此時，我們還需要進(jìn)一步確認(rèn)哪些水平均值間是確有差異的，哪些水平均值間無顯著差異。同時比較任意兩個水平均值間有無明顯差異的問題稱為多重比較，多重比較即要以顯著性水平同時檢驗如下r(r1)/2個假設(shè)：（8.2.2）

在方差分析中，如果經(jīng)過F檢驗拒絕原假設(shè)，表明因子A是直觀地看，當(dāng)H0ij成立時，不應(yīng)過大，因此，關(guān)于假設(shè)(8.2.2)的拒絕域應(yīng)有如下形式諸臨界值應(yīng)在（8.2.2）成立時由P(W)=確定。下面分重復(fù)數(shù)相等和不等分別介紹臨界值的確定。

直觀地看，當(dāng)H0ij成立時，

8.2.3重復(fù)數(shù)相等場合的T法

在重復(fù)數(shù)相等時，由對稱性自然可以要求諸cij相等，記為c.記，則由給定條件不難有

8.2.3重復(fù)數(shù)相等場合的T法于是當(dāng)(8.2.2)成立時，1==r=，可推出其中，稱為t化極差統(tǒng)計量，其分布可由隨機(jī)模擬方法得到。于是,其中q1(r,fe)表示q(r,fe)的1分位數(shù)，其值在附表8中給出。于是當(dāng)(8.2.2)成立時，1==r=重復(fù)數(shù)相同時多重比較可總結(jié)如下：對給定的的顯著性水平，查多重比較的分位數(shù)q(r,fe)表，計算，比較諸與c的大小，若則認(rèn)為水平Ai與水平Aj間有顯著差異，反之，則認(rèn)為水平Ai與水平Aj間無明顯差別。這一方法最早由Turkey提出，因此稱為T法。

重復(fù)數(shù)相同時多重比較可總結(jié)如下：對給定的的顯著性水平

例8.2.2繼續(xù)例8.1.2，若取=0.05，則查表知q1-0.05(3,21)=3.57，而。所以，認(rèn)為1與2有顯著差別，認(rèn)為1與3無顯著差別，認(rèn)為2與3有顯著差別這說明：1與3之間無顯著差別，而它們與2之間都有顯著差異。例8.2.2繼續(xù)例8.1.2，若取=0.05，8.2.4重復(fù)數(shù)不等場合的S法在重復(fù)數(shù)不等時，若假設(shè)(8.2.2)成立，則或從而可以要求，在此要求下可推出8.2.4重復(fù)數(shù)不等場合的S法在重復(fù)數(shù)不等時，若假設(shè)可以證明，從而亦即可以證明

例8.2.3在例8.1.4中，我們指出包裝方式對食品銷量有明顯的影響，此處r=4,fe=6,

，若取=0.05，則F0.95(3,6)=4.76。注意到m1=m4=2，m2=m3=3，故例8.2.3在例8.1.4中，我們指出包裝方式對食品銷由于這說明A1,A2,

A3間無顯著差異，A1,A2與A4有顯著差異，但A4與A3的差異卻尚未達(dá)到顯著水平。綜合上述，包裝A4銷售量最佳。

由于§8.3方差齊性檢驗

在進(jìn)行方差分析時要求r個方差相等，這稱為方差齊性。理論研究表明，當(dāng)正態(tài)性假定不滿足時對F檢驗影響較小,即F檢驗對正態(tài)性的偏離具有一定的穩(wěn)健性，而F檢驗對方差齊性的偏離較為敏感。所以r個方差的齊性檢驗就顯得十分必要。所謂方差齊性檢驗是對如下一對假設(shè)作出檢驗：（8.3.1）

§8.3方差齊性檢驗在進(jìn)行方差分析時要求r個方很多統(tǒng)計學(xué)家提出了一些很好的檢驗方法，這里介紹幾個最常用的檢驗，它們是：Hartley檢驗，僅適用于樣本量相等的場合；Bartlett檢驗，可用于樣本量相等或不等的場合，但是每個樣本量不得低于5；

修正的Bartlett檢驗，在樣本量較小或較大、相等或不等場合均可使用。

很多統(tǒng)計學(xué)家提出了一些很好的檢驗方法，這里介紹幾個最8.3.1Hartley檢驗

當(dāng)各水平下試驗重復(fù)次數(shù)相等時，即m1=m2==mr=m,Hartley提出檢驗方差相等的檢驗統(tǒng)計量：（8.3.2）這個統(tǒng)計量的分布無明顯的表達(dá)式，但在諸方差相等條件下，可通過隨機(jī)模擬方法獲得H分布的分位數(shù)，該分布依賴于水平數(shù)r和樣本方差的自由度f=m1，因此該分布可記為H(r，f)，其分位數(shù)表列于附表10上。

8.3.1Hartley檢驗當(dāng)各水平下試驗重復(fù)直觀上看，當(dāng)H0成立，即諸方差相等（12=22==r2）時，H的值應(yīng)接近于1，當(dāng)H的值較大時，諸方差間的差異就大，H愈大，諸方差間的差異就愈大，這時應(yīng)拒絕(8.3.1)中的H0。由此可知，對給定的顯著性水平，檢驗H0的拒絕域為W={H>H1(r,f)}（8.3.3）其中H1(r,f)為H分布的1分位數(shù)。

直觀上看，當(dāng)H0成立，即諸方差相等（12=22

例8.3.1有四種不同牌號的鐵銹防護(hù)劑（簡稱防銹劑），現(xiàn)要比較其防銹能力。數(shù)據(jù)見表8.3.1。這是一個重復(fù)次數(shù)相等的單因子試驗。我們考慮用方差分析方法對之進(jìn)行比較分析，為此，首先要進(jìn)行方差齊性檢驗。例8.3.1有四種不同牌號的鐵銹防護(hù)劑（簡稱防銹劑），本例中，四個樣本方差可由表8.3.1中諸Qi求出，即由此可得統(tǒng)計量H的值

在=0.05時，由附表10查得H0.95(4,9)=6.31，由于H<6.31，所以應(yīng)該保留原假設(shè)H0，即認(rèn)為四個總體方差間無顯著差異。

本例中，四個樣本方差可由表8.3.1中諸Qi求出，即8.3.2Bartlett檢驗

在單因子方差分析中有r個樣本，設(shè)第i個樣本方差為：由于幾何平均數(shù)總不會超過算術(shù)平均數(shù)，故有GMSe≤MSe

,其中

等號成立當(dāng)且僅當(dāng)諸si2彼此相等，若諸si2間的差異愈大，則此兩個平均值相差也愈大。

8.3.2Bartlett檢驗在單因子方差分由此可見，在比值GMSe/MSe較大時，就意味著諸樣本方差差異較大，從而檢驗（8.3.1）表示的一對假設(shè)的拒絕域應(yīng)是W={lnGMSe/MSe>>d}（8.3.4）Bartlett證明了，檢驗的拒絕域為W={B>1-2(r-1)}（8.3.8）考慮到這里2分布是近似分布，在諸樣本量mi均不小于5時使用上述檢驗是適當(dāng)?shù)摹?/p>

由此可見，在比值GMSe/MSe較大時，就意味著諸樣

例8.3.2為研究各產(chǎn)地的綠茶的葉酸含量是否有顯著差異，特選四個產(chǎn)地綠茶，其中A1制作了7個樣品，A2制作了5個樣品，A3與A4各制作了6個樣品，共有24個樣品，按隨機(jī)次序測試其葉酸含量，測試結(jié)果如表8.3.3所示。

例8.3.2為研究各產(chǎn)地的綠茶的葉酸含量是否有顯著差異為能進(jìn)行方差分析，首先要進(jìn)行方差齊性檢驗，從表8.3.3中數(shù)據(jù)可求得s12=2.14,s22=2.83,s32=2.41,s42=1.12，再從表8.3.4上查得MSe=2.09，由(8.3.6)，可求得

再由(8.3.7)，還可求得Bartlett檢驗統(tǒng)計量的值對給定的顯著性水平=0.05，查表知0.952(41)=7.815。由于B<7.815，故應(yīng)保留原假設(shè)H0，即可認(rèn)為諸水平下的方差間無顯著差異。

為能進(jìn)行方差分析，首先要進(jìn)行方差齊性檢驗，從表8.38.3.3修正的Bartlett檢驗

針對樣本量低于5時不能使用Bartlett檢驗的缺點，Box提出修正的Bartlett檢驗統(tǒng)計量

（8.3.9）其中B與C如（8.3.7）與（8.3.6）所示，且8.3.3修正的Bartlett檢驗針對樣本量在原假設(shè)H0：12=22==r2成立下，Box還證明了統(tǒng)計量的近似分布是F分布F(f1,f2)，對給定的顯著性水平，該檢驗的拒絕域為（8.3.10）其中f2的值可能不是整數(shù)，這時可通過對F分布的分位數(shù)表施行內(nèi)插法得到分位數(shù)。

在原假設(shè)H0：12=22==r2成立下，B

例8.3.3

對例8.3.2中的綠茶葉酸含量的數(shù)據(jù)，我們用修正的Bartlett檢驗再一次對等方差性作出檢驗。在例8.3.2中已求得：C=1.0856，B=0.970，還可求得：

對給定的顯著性水平=0.05，在F分布的分位數(shù)表上可查得F0.95(3,682.4)=F0.95(3,)=2.60由于<2.60，故保留原假設(shè)H0，即認(rèn)為四個水平下的方差間無顯著差異。

例8.3.3對例8.3.2中的綠茶葉酸含量的數(shù)據(jù)，我們§8.4

一元線性回歸

8.4.1變量間的兩類關(guān)系十九世紀(jì)，英國生物學(xué)家兼統(tǒng)計學(xué)家高爾頓研究發(fā)現(xiàn)：其中x表示父親身高，y表示成年兒子的身高（單位：英寸，1英寸=2.54厘米）。這表明子代的平均高度有向中心回歸的意思，使得一段時間內(nèi)人的身高相對穩(wěn)定。之后回歸分析的思想滲透到了數(shù)理統(tǒng)計的其它分支中。

§8.4一元線性回歸8.4.1變量間的兩類關(guān)系回歸分析便是研究變量間相關(guān)關(guān)系的一門學(xué)科。它通過對客觀事物中變量的大量觀察或試驗獲得的數(shù)據(jù)，去尋找隱藏在數(shù)據(jù)背后的相關(guān)關(guān)系，給出它們的表達(dá)形式——回歸函數(shù)的估計。變量間的相關(guān)關(guān)系不能用完全確切的函數(shù)形式表示，但在平均意義下有一定的定量關(guān)系表達(dá)式，尋找這種定量關(guān)系表達(dá)式就是回歸分析的主要任務(wù)。回歸分析處理的是變量與變量間的關(guān)系。變量間常見的關(guān)系有兩類：確定性關(guān)系與相關(guān)關(guān)系。回歸分析便是研究變量間相關(guān)關(guān)系的一門學(xué)科。它通過對客觀事物8.4.2一元線性回歸模型設(shè)y與x間有相關(guān)關(guān)系，稱x為自變量(預(yù)報變量)，y為因變量(響應(yīng)變量)，在知道x取值后，y有一個分布p(yx)，我們關(guān)心的是y的均值E(Yx)：(8.4.1)這便是y關(guān)于x的理論回歸函數(shù)——條件期望，也就是我們要尋找的相關(guān)關(guān)系的表達(dá)式。通常，相關(guān)關(guān)系可用下式表示

y=f(x)+其中是隨機(jī)誤差，一般假設(shè)~N(0,

2)。

8.4.2一元線性回歸模型

例8.4.1

合金的強(qiáng)度y(×107Pa)與合金中碳的含量x(%)有關(guān)。為研究兩個變量間的關(guān)系。首先是收集數(shù)據(jù)，我們把收集到的數(shù)據(jù)記為(xi,yi),i=1,2,,n。本例中，我們收集到12組數(shù)據(jù)，列于表8.4.1中

進(jìn)行回歸分析首先是回歸函數(shù)形式的選擇。當(dāng)只有一個自變量時，通常可采用畫散點圖的方法進(jìn)行選擇。例8.4.1合金的強(qiáng)度y(×107Pa)與合金表8.4.1合金鋼強(qiáng)度y與碳含量x的數(shù)據(jù)

序號x(%)y(×107Pa)序號x(%)y(×107Pa)10.1042.070.1649.020.1143.080.1753.030.1245.090.1850.040.1345.0100.2055.050.1445.0110.2155.060.1547.5120.2360.0表8.4.1合金鋼強(qiáng)度y與碳含量x的數(shù)據(jù)序號x(%)y為找出兩個量間存在的回歸函數(shù)的形式，可以畫一張圖：把每一對數(shù)(xi,yi)看成直角坐標(biāo)系中的一個點，在圖上畫出n個點，稱這張圖為散點圖，見圖8.4.1

為找出兩個量間存在的回歸函數(shù)的形式，可以畫一張圖：從散點圖我們發(fā)現(xiàn)12個點基本在一條直線附近，這說明兩個變量之間有一個線性相關(guān)關(guān)系，這個相關(guān)關(guān)系可以表示為y=0+1x+(8.4.2)這便是y關(guān)于x的一元線性回歸的數(shù)據(jù)結(jié)構(gòu)式。通常假定

E()=0,Var()=

2(8.4.3)在對未知參數(shù)作區(qū)間估計或假設(shè)檢驗時，還需要假定誤差服從正態(tài)分布，即

y~N(0+1x,

2)(8.4.4)顯然，假定(8.4.4)比(8.4.3)要強(qiáng)。

從散點圖我們發(fā)現(xiàn)12個點基本在一條直線附近，這說明由于0,1均未知，需要我們從收集到的數(shù)據(jù)(xi,yi)，i=1,2,…,n，出發(fā)進(jìn)行估計。在收集數(shù)據(jù)時，我們一般要求觀察獨立地進(jìn)行，即假定y1,y2,,yn,相互獨立。綜合上述諸項假定，我們可以給出最簡單、常用的一元線性回歸的數(shù)學(xué)模型：(8.4.5)

由于0,1均未知，需要我們從收集到的數(shù)據(jù)(x由數(shù)據(jù)(xi,yi)，i=1,2,…,n，可以獲得0,1的估計，稱(8.4.6)為y關(guān)于x的經(jīng)驗回歸函數(shù)，簡稱為回歸方程，其圖形稱為回歸直線。給定x=x0后，稱為回歸值（在不同場合也稱其為擬合值、預(yù)測值）。

由數(shù)據(jù)(xi,yi)，i=1,2,…,n，可以獲得8.4.3回歸系數(shù)的最小二乘估計

一般采用最小二乘方法估計模型(8.4.5)中的0,1：令：

應(yīng)該滿足

稱這樣得到的稱為0,1的最小二乘估計，記為LSE。

8.4.3回歸系數(shù)的最小二乘估計一般采用最小最小二乘估計可以通過求偏導(dǎo)數(shù)并命其為0而得到：(8.4.7)這組方程稱為正規(guī)方程組，經(jīng)過整理，可得(8.4.8)

最小二乘估計可以通過求偏導(dǎo)數(shù)并命其為0而得到：解(8.4.8)可得（8.4.9）這就是參數(shù)的最小二乘估計，其中

解(8.4.8)可得表8.4.2例8.4.2的計算表

xi=1.90n=12yi=590.5xi2=0.3194xiyi=95.9250yi2=29392.75lxx=0.0186lxy=2.4292lyy=335.2292由此給出回歸方程為:

例8.4.2

使用例8.4.1種合金鋼強(qiáng)度和碳含量數(shù)據(jù)，我們可求得回歸方程，見下表.

表8.4.2例8.4.2的計算表xi=1.90n

定理8.4.1在模型(8.4.5)下，有（1）（2）（3）對給定的x0，關(guān)于最小二乘估計的一些性質(zhì)羅列在如下定理之中

定理8.4.1在模型(8.4.5)下，有關(guān)于最小二定理8.4.1說明

分別是0,1的無偏估計；

是E(y0)=0+1x0的無偏估計；

除外，與是相關(guān)的；

要提高的估計精度（即降低它們的方差）就要求n大，lxx大（即要求x1,x2,,xn較分散）。

定理8.4.1說明分別是0,18.4.4回歸方程的顯著性檢驗

在使用回歸方程作進(jìn)一步的分析以前，首先應(yīng)對回歸方程是否有意義進(jìn)行判斷。如果1=0，那么不管x如何變化，E(y)不隨x的變化作線性變化，那么這時求得的一元線性回歸方程就沒有意義，稱回歸方程不顯著。如果10，E(y)隨x的變化作線性變化，稱回歸方程是顯著的。綜上，對回歸方程是否有意義作判斷就是要作如下的顯著性檢驗：H0：1=0vsH1：10拒絕H0表示回歸方程是顯著的。8.4.4回歸方程的顯著性檢驗在使用回歸方程一、F檢驗采用方差分析的思想，我們從數(shù)據(jù)出發(fā)研究各yi不同的原因。數(shù)據(jù)總的波動用總偏差平方和表示。引起各yi不同的原因主要有兩個因素：其一是H0可能不真，E(y)隨x的變化而變化，從而在每一個x的觀測值處的回歸值不同，其波動用回歸平方和表示；其二是其它一切因素，包括隨機(jī)誤差、x對E(y)的非線性影響等，這可用殘差平方和表示。且有如下平方和分解式：ST=SR+Se(8.4.13)

在一元線性回歸中有三種等價的檢驗方法，下面分別加以介紹。一、F檢驗在一元線性回歸中有三種等價的檢驗方法，下面分別加定理8.4.2設(shè)yi=i+1

i，其中in相互獨立，且Ei=0，Var(yi)=

2，i=1,,n，沿用上面的記號，有(8.4.14)(8.4.15)這說明是

2的無偏估計。

關(guān)于SR

和

Se所含有的成分可由如下定理說明。

定理8.4.2設(shè)yi=i+1xi+i，其中進(jìn)一步，有關(guān)SR

和

Se的分布，有如下定理。

定理8.4.3

設(shè)y1,y2,,yn相互獨立，且

yi～N(i+1

2)，i=1,,n，則在上述記號下，有（1）Se/

2~2(n2)，（2）若H0成立，則有SR/

2~2(1)（3）SR與Se，獨立（或與Se，獨立）。

進(jìn)一步，有關(guān)SR和Se的分布，有如下定理。定理8.4.如同方差分析那樣，我們可以考慮采用F比作為檢驗統(tǒng)計量：

在1

=0時，F(xiàn)~F(1,n2)，其中fR=1,fe=n2.對于給定的顯著性水平，拒絕域為

FF1-(1,n2)整個檢驗也可列成一張方差分析表。

如同方差分析那樣，我們可以考慮采用F比作為檢驗統(tǒng)計量來源平方和自由度均方和F比回歸SR=317.2589fA=1MSA=317.2589176.55殘差Se=17.9703fe=10MSe=1.79703總和ST=335.2292fT=11例8.4.3在合金鋼強(qiáng)度的例8.4.2中，我們已求出了回歸方程，這里我們考慮關(guān)于回歸方程的顯著性檢驗。經(jīng)計算有

若取=0.01，則F0.99(1,10)=10<F，因此在顯著性水平0.01下回歸方程是顯著的。

來源平方和自由度均方和F比回歸SR=317.2589fA=

二、t檢驗對H0：1

=0的檢驗也可基于t分布進(jìn)行。由于，因此在H0為真時，有，其中，它可用來檢驗假設(shè)H0。對給定的顯著性水平，拒絕域為.由于，稱為的標(biāo)準(zhǔn)誤，即的標(biāo)準(zhǔn)差的估計。

二、t檢驗注意到t2=F，因此，t檢驗與F檢驗是等同的。以例8.4.2中數(shù)據(jù)為例，可以計算得到若取=0.01，則由于13.2872>3.1698，因此，在顯著性水平0.01下回歸方程是顯著的。

注意到t2=F，因此，t檢驗與F檢驗是等同的。

三、相關(guān)系數(shù)檢驗一元線性回歸方程是反映兩個隨機(jī)變量x與y間的線性相關(guān)關(guān)系，它的顯著性檢驗還可通過對二維總體相關(guān)系數(shù)的檢驗進(jìn)行。它的一對假設(shè)是H0：=0vsH1：

0(8.4.18)所用的檢驗統(tǒng)計量為樣本相關(guān)系數(shù)(8.4.19)拒絕域為W={rc}，其中臨界值c應(yīng)是H0:=0成立下r的分布的1分位數(shù)，故記為c=r1-(n2).

三、相關(guān)系數(shù)檢驗由樣本相關(guān)系數(shù)的定義可以得到r與F統(tǒng)計量之間的關(guān)系這表明，r是F的嚴(yán)格單調(diào)增函數(shù)，故可以從F分布的1分位數(shù)F1-(1,n2)得到r的1分位數(shù)為由樣本相關(guān)系數(shù)的定義可以得到r與F統(tǒng)計量之間的關(guān)系譬如，對=0.01，n=12，F(xiàn)0.99(1,10)=10.04，于是。為實際使用方便，人們已對r1-(n-2)編制了專門的表，見附表9。以例8.4.2中數(shù)據(jù)為例，可以計算得到若取=0.01，查附表9知r0.99(10)=0.708,由于0.9728>0.708，因此，在顯著性水平0.01下回歸方程是顯著的。

譬如，對=0.01，n=12，F(xiàn)0.99(1,

在一元線性回歸場合，三種檢驗方法是等價的：在相同的顯著性水平下，要么都拒絕原假設(shè)，要么都接受原假設(shè)，不會產(chǎn)生矛盾。

F檢驗可以很容易推廣到多元回歸分析場合，而其他二個則否，所以，F(xiàn)檢驗是最常用的關(guān)于回歸方程顯著性檢驗的檢驗方法。在一元線性回歸場合，三種檢驗方法是等價的：在相同的顯

8.4.5估計與預(yù)測

當(dāng)回歸方程經(jīng)過檢驗是顯著的后，可用來做估計和預(yù)測。這是二個不同的問題：（1）當(dāng)x=x0時，尋求均值E(y0)=0+1x0的點估計與區(qū)間估計（注意這里E(y0)是常量）是估計問題；（2）當(dāng)x=x0時，y0的觀察值在什么范圍內(nèi)？由于y0是隨機(jī)變量，為此只能求一個區(qū)間，使y0落在這一區(qū)間的概率為1-，即要求，使稱區(qū)間為y0的概率為1-的預(yù)測區(qū)間，這是預(yù)測問題。

8.4.5估計與預(yù)測一、E(y0)的估計在x=x0時，其對應(yīng)的因變量y0是一個隨機(jī)變量，有一個分布，我們經(jīng)常需要對該分布的均值給出估計。由于E(y0)=0+1x0，一個直觀的估計應(yīng)為我們習(xí)慣上將上述估計記為（注意這里表示的是E(y0)的估計，而不表示y0的估計，因為y0是隨機(jī)變量，它是沒有估計的）。由于分別是0,1的無偏估計，因此，也是E(y0)的無偏估計。

一、E(y0)的估計為得到E(y0)的區(qū)間估計，我們需要知道的分布。由定理8.4.1，又由定理8.4.3知，Se/

2~2(n-2)，且與相互獨立，故為得到E(y0)的區(qū)間估計，我們需要知道于是E(y0)的1的置信區(qū)間（CI）是（8.4.20）其中（8.4.21）于是E(y0)的1的置信區(qū)間（CI）是

二、y0的預(yù)測區(qū)間實用中往往更關(guān)心x=x0時對應(yīng)的因變量y0的取值范圍。y0的最可能取值為，于是，我們可以使用以為中心的一個區(qū)間作為y0的取值范圍。經(jīng)推導(dǎo)，的表達(dá)式為(8.4.23）上述預(yù)測區(qū)間（PI）與E(y0)的置信區(qū)間的差別就在于根號里多個1。

二、y0的預(yù)測區(qū)間預(yù)測區(qū)間的長度2與樣本量n、x的偏差平方和lxx、x0到的距離有關(guān)。當(dāng)時，預(yù)測精度可能變得很差，

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

概率論及數(shù)理統(tǒng)計方差分析與回歸分析課件

文檔簡介

溫馨提示

最新文檔

評論

概率論及數(shù)理統(tǒng)計方差分析與回歸分析課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔