版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一節(jié)回歸模型回歸分析是研究隨機(jī)現(xiàn)象中變量之間關(guān)系的一種數(shù)理統(tǒng)計(jì)方法。它的主要內(nèi)容是:從一組數(shù)據(jù)出發(fā),確定這些變量間的關(guān)系式,對(duì)這些關(guān)系式的可信程度進(jìn)行統(tǒng)計(jì)檢驗(yàn),從影響一個(gè)量的許多變量中,判斷哪些變量的影響是顯著的,哪些是不顯著的,尋找具有較好統(tǒng)計(jì)性質(zhì)的回歸設(shè)計(jì),利用所求得的關(guān)系式進(jìn)行預(yù)報(bào)和控制。一、一元線性回歸模型一元回歸分析是處理隨機(jī)變量y和變量x之間關(guān)系的一種方法,即通過(guò)分析數(shù)據(jù),找出變量x和y間的一種關(guān)系。如果兩個(gè)變量的關(guān)系是線性的,那就是一元線性回歸分析所研究問(wèn)題。那么,怎樣建立一元線性回歸的數(shù)學(xué)模型呢?首先,把觀察得到的n對(duì)數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)表示在平
2、面直角坐標(biāo)系(圖51)中,考察這些點(diǎn)的大致分布情況,如果這些點(diǎn)之間近似存在著線性關(guān)系yabx,那么,由最小二乘法可得量x和y之間的規(guī)律,即y和x是否顯著地存在線性關(guān)系呢?這可以用F方和為S剩,則 如果在給定顯著性水平下,有PFF(1,n2)1,于是有1的把握確定回歸直線的顯著性。否則,在給定顯著性水平下,回歸不顯著,即變量x和y的線性關(guān)系不顯著。二、多元線性回歸模型對(duì)于一元以上的線性回歸,這里先討論二元線性回歸。設(shè)隨機(jī)變量y和另外兩個(gè)變量x1和x2近似存在線性關(guān)系yab1x1b2x2,同樣可以討論二元以上的線性回歸。為了書(shū)寫(xiě)簡(jiǎn)便,可以用矩陣的形式來(lái)表示回歸系數(shù)。設(shè)隨機(jī)變量y與另外p個(gè)變量x1,
3、x2,x3,xp近似存在線性關(guān)系y01x12x2pxp,經(jīng)過(guò)n次試驗(yàn),得到數(shù)據(jù)組(yi,xi1,xi2,xip)(i1,2,n)。這就有上述方程組就可以寫(xiě)成YX。經(jīng)過(guò)矩陣的運(yùn)算,并運(yùn)用最小二乘法,(XTX)-1是XTX的逆矩陣。二元線性回歸也可以用矩陣的形式來(lái)表示。設(shè)y01x12x2,于是在數(shù)據(jù)處理過(guò)程中,兩個(gè)或兩個(gè)以上變量之間的回歸關(guān)系,并非總是線性的。這時(shí),選擇恰當(dāng)類(lèi)型的曲線比直線更符合實(shí)際情況。但在許多情況下,非線性回歸可以通過(guò)某些簡(jiǎn)單的變量變換,轉(zhuǎn)化為線性回歸。例如,假設(shè)變量y和x之間有關(guān)系式y(tǒng)0ex,只要兩邊取對(duì)數(shù),并令ylny,0ln0,就可以將上述非線性回歸問(wèn)題轉(zhuǎn)化為線性回歸問(wèn)題
4、。三、回歸模型在教學(xué)評(píng)估中的應(yīng)用舉例1同一學(xué)科成績(jī)的一元線性回歸分析從一組學(xué)生某學(xué)科的平時(shí)成績(jī)與期中考試成績(jī)或兩次不同考試的成績(jī),分析這組學(xué)生學(xué)習(xí)該學(xué)科的水平狀況,便是一元線性回歸模型在教學(xué)評(píng)估中的一個(gè)應(yīng)用。例如,從某班隨機(jī)抽取15名學(xué)生兩個(gè)學(xué)期的數(shù)學(xué)期末考試成績(jī)?nèi)绫?1(x、y分別表示第一學(xué)期、第二學(xué)期的期末成績(jī)),下面用一元線性回歸進(jìn)行分析。所以,這組學(xué)生的成績(jī)相關(guān)。根據(jù)一元線性回歸計(jì)算方法,得lxy1117,lyy1365.6,下面用F檢驗(yàn)進(jìn)行方差分析,檢驗(yàn)回歸的顯著性。查表得F0.01(1,13)9.07,可見(jiàn)FF0.01(1,13),于是我們有99%的把握認(rèn)為回歸是顯著的,即x和y之
5、間存在線性關(guān)系。如果把第二次考試成績(jī)作為基礎(chǔ),根據(jù)上面得到的一元線性回歸方程預(yù)測(cè)第三次考試學(xué)生的成績(jī),可以把第三次考試的成績(jī)填入表52(x表示預(yù)測(cè)成績(jī),y表示實(shí)際的考試成績(jī))。同樣,用第三次考試成績(jī)作為基礎(chǔ),又可以預(yù)測(cè)第四次考試成績(jī),依此類(lèi)推。當(dāng)然,每一次的預(yù)測(cè)都應(yīng)該與實(shí)際分?jǐn)?shù)進(jìn)行比較,判斷預(yù)測(cè)的準(zhǔn)確性,并加以修正。在不需要較為精確地對(duì)學(xué)生學(xué)習(xí)水平作出預(yù)測(cè)的情況下,為避免較大的計(jì)算量,也可以采用比較簡(jiǎn)單的“平均數(shù)”法,粗略地對(duì)學(xué)生的學(xué)習(xí)狀況作出回歸分析。具體地可以按下面步驟完成。第一步,分組。把n個(gè)測(cè)驗(yàn)數(shù)據(jù)點(diǎn)(xi,yi)(i1,2,n)分成大致均勻的兩組。若n為偶數(shù),則平分成兩組;若n為奇數(shù)
6、,可第二步,求平均數(shù)。分別求出這兩組數(shù)據(jù)的各個(gè)平均數(shù),并組成新第三步,求過(guò)P、Q兩點(diǎn)的直線可以認(rèn)為,這條直線是過(guò)這n個(gè)點(diǎn)的一元線性回歸直線。對(duì)上面提到的15名學(xué)生的數(shù)學(xué)成績(jī),按照前8名為一組,后7名為另一組,分成兩組,然后用表53(x、y分別表示第一學(xué)期、第二學(xué)期期末成績(jī))的數(shù)據(jù)計(jì)算。因此,得到P(79.3, 76.5), Q(73.7, 70.1),而通過(guò)P,Q的直線這樣,我們也可以用這條回歸直線來(lái)預(yù)測(cè)這15名學(xué)生的學(xué)習(xí)成績(jī)。2同一學(xué)科成績(jī)的二元線性回歸分析利用二元線性回歸,可以從一組學(xué)生某學(xué)科更多的測(cè)驗(yàn)數(shù)據(jù)(如平時(shí)成績(jī),考試成績(jī))中,預(yù)測(cè)這組學(xué)生該學(xué)科的成績(jī)?,F(xiàn)在對(duì)上述15名學(xué)生三個(gè)學(xué)期數(shù)
7、學(xué)期末成績(jī)(在表54中,x1、x2和y分別表示高一第一學(xué)期、第二學(xué)期和高二第一學(xué)期期末成績(jī))進(jìn)行二元線性回歸分析由二元線性回歸計(jì)算方法,得到:解得 b10.282,b20.622。由此可得這組學(xué)生的二元線性回歸方程是雖然通過(guò)上面回歸方法得到了二元線性回歸方程,但兩個(gè)因素x1和x2對(duì)y的回歸并不一定是顯著的。這里存在著以下幾種情況:因素x1對(duì)y回歸顯著,而因素x2對(duì)y回歸不顯著;因素x1對(duì)y回歸不顯著,而因素x2對(duì)y回歸顯著;因素x1和x2對(duì)y回歸都顯著;因素x1和x2對(duì)y回歸都不顯著。下面通過(guò)表55,對(duì)前面的二元線性回歸方程進(jìn)行檢驗(yàn)。由于F0.05(2,12)3.89F,所以得到的回歸直線是顯
8、著的。既然上面回歸是顯著的,那么,我們可以根據(jù)這15名學(xué)生的兩個(gè)學(xué)期期末成績(jī),預(yù)測(cè)第三個(gè)學(xué)期的期末成績(jī),然后,照樣可以把第三個(gè)學(xué)期的成績(jī)作為一個(gè)因素(如因素x2),去預(yù)測(cè)第四個(gè)學(xué)期的期末成績(jī)。不過(guò),每一次預(yù)測(cè)值與實(shí)際值都應(yīng)進(jìn)行檢驗(yàn),并且加以修正。如果用F檢驗(yàn)法檢驗(yàn)回歸不顯著,那么就應(yīng)該對(duì)每個(gè)因素進(jìn)行單獨(dú)方差分析,剔除回歸不顯著的因素。一般來(lái)說(shuō),凡是偏回歸平方和(所謂偏回歸平方和,是指總的回歸平方和,減去剔除某因素后所得的回歸平方和的值)大的變量一定是顯著的;凡是偏回歸平方和小的變量,卻并不一定不顯著。3同一學(xué)科成績(jī)的中位數(shù)穩(wěn)健性回歸分析用最小二乘法求回歸直線,對(duì)所有的測(cè)驗(yàn)數(shù)據(jù)都是一視同仁的,顯
9、然個(gè)別遠(yuǎn)離數(shù)據(jù)群體的“離群值”影響了回歸的顯著性(擬合度)。若用“中位數(shù)”的方法,可以求出一種較為穩(wěn)健的回歸,其步驟是:第一步,分組。將各數(shù)據(jù)點(diǎn)按某一變量(例如x)值從小到大的順序重新排列,得x(1)x(2)x(n);另一變量y值隨之相應(yīng)地排列。然后將n個(gè)點(diǎn)大致均勻地分成左(L),中(M),右(R)三組,并使左右兩組點(diǎn)數(shù)盡可能相等,如遇有相同的x值,則應(yīng)該將相應(yīng)的點(diǎn)劃歸為同一組,不可分割開(kāi)。第二步,求中位數(shù)、綜合點(diǎn)。在按第一步分出的左、中、右三組中各求出x值和y值的中位數(shù),分別得到三個(gè)組的綜合點(diǎn):L(xL,yL),M(xM,yM),R(xR,yR)。這些“綜合點(diǎn)”不一定是原始數(shù)據(jù)點(diǎn)。第三步,用
10、“中位數(shù)”的綜合點(diǎn)求回歸直線。由綜合點(diǎn)先求出斜率的初始值再取分別過(guò)這三個(gè)綜合點(diǎn),且以b1為斜率的三條直線的截距的平均數(shù)為截距,即第四步,求殘差及其中位數(shù),迭代。求出各點(diǎn)(xi,yi)(i1,2,n)與初始回歸直線的初始?xì)埐睿喝?0或10,迭代結(jié)束。否則繼續(xù)按照上面方法迭代,直到第k步出現(xiàn)k0或k0為止。這時(shí)最終的回歸直線為aka1a。下面對(duì)前面提到的15名學(xué)生的成績(jī)作中位數(shù)穩(wěn)健性回歸。第一步,由表56,左、中、右三組的中位數(shù)分別為xL66,yL67,xM73,yM78,xR89,yR79,于是,初始的回歸直線是數(shù),得綜合點(diǎn):L(66,3.35),M(73,1.73),R(89,2.83)。 由
11、于10,所以迭代結(jié)束,最終的回歸直線是從表56中的第五列可以看出(74,60)、(97,98)這兩個(gè)“離群點(diǎn)”,由于中位數(shù)比平均數(shù)回歸更具有穩(wěn)健性,所以,在用中位數(shù)法求回歸直線的過(guò)程中,自然降低了“離群值”的影響。4題目難度的回歸分析題目的難度指數(shù)對(duì)測(cè)驗(yàn)結(jié)果反應(yīng)最敏感。為了對(duì)題目的難度有一個(gè)比較準(zhǔn)確,又可操作的定量化估計(jì),可以利用回歸分析,根據(jù)學(xué)生的實(shí)際得分率與決定題目難度的有關(guān)因素的賦值建立回歸關(guān)系,預(yù)測(cè)題目的難度。學(xué)科專家研究確認(rèn),數(shù)學(xué)測(cè)驗(yàn)題目的難度因素主要取決于測(cè)驗(yàn)涉及知識(shí)的廣度、運(yùn)算量、邏輯推理量、失誤點(diǎn)、障礙點(diǎn)、綜合度、熟悉度等因素。可以認(rèn)為通常意義下的難度由這七個(gè)因素所確定,只要對(duì)
12、這七個(gè)因素客觀地賦值,可以克服主觀估計(jì)帶來(lái)的偏差。具體方法是:(1)利用已有測(cè)驗(yàn)的數(shù)據(jù),求得各題難度指數(shù)pL(l1,2,k,k為題目數(shù))。(2)對(duì)各題給出對(duì)應(yīng)的難度因素值nil。(3)利用邏輯斯蒂回歸模型:用與pL對(duì)應(yīng)的nil建立回歸方程。由于數(shù)學(xué)測(cè)驗(yàn)一般由三類(lèi)題型(填空題、選擇題和解答題)組成,它們的測(cè)試功能和考查要求各有所異,因此,應(yīng)該分別建立三個(gè)回歸方程著,以便判別回歸方程本身的優(yōu)劣。(5)當(dāng)新的題目編制完后,通過(guò)對(duì)每題難度因素nil的賦值,代(6)計(jì)算剩余標(biāo)準(zhǔn)差,衡量估計(jì)難度值WL變差的大小,確定估計(jì)難度與實(shí)際得分率的平均誤差。例如,用1989年和1990年高考數(shù)學(xué)上海試卷中的數(shù)據(jù),分別建立三類(lèi)題型的回歸方程:1.369n41.363n50.91495n6,0.27023n40.13013n50.29579n61.5384n7,0.10652n41.1799n50.064717n61.2517n7。平方和之比的算術(shù)平方根)分別為R10.85,R20.91;R30.88??梢哉J(rèn)為估計(jì)難度與實(shí)際考試結(jié)果的擬合度較好,同時(shí)也說(shuō)明了難度因素的確定是合理的。對(duì)上述三個(gè)線性回歸方程的方差分析,可分別得到F
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 單位管理制度范例匯編【職工管理】十篇
- 《市場(chǎng)進(jìn)入和效率》課件
- DBJ51-T 040-2021 四川省工程建設(shè)項(xiàng)目招標(biāo)代理操作規(guī)程
- 超高層商住樓轉(zhuǎn)換層施工方案#模板工程#鋼筋工程#混凝土工程
- 《小數(shù)點(diǎn)移動(dòng)》課件2
- 《寶馬銷(xiāo)售流程》課件
- 《電動(dòng)力學(xué)chapter》課件
- 印刷包裝行業(yè)市場(chǎng)營(yíng)銷(xiāo)經(jīng)驗(yàn)分享
- 電腦設(shè)備銷(xiāo)售員工作總結(jié)
- 玩具模型銷(xiāo)售工作總結(jié)
- 地脈動(dòng)測(cè)試原理及應(yīng)用
- 基坑排水計(jì)算
- 溝槽式連接管道工程技術(shù)規(guī)程
- 原料罐區(qū)設(shè)備操作規(guī)程
- 廈門(mén)市2023-2024學(xué)年度初中語(yǔ)文初一上學(xué)期語(yǔ)文期末質(zhì)量檢測(cè)
- 項(xiàng)目施工員安全生產(chǎn)責(zé)任制考核記錄
- 中職英語(yǔ)教學(xué)總結(jié)
- 高中數(shù)學(xué)人教A版知識(shí)點(diǎn)與公式大全
- 2023年八省聯(lián)考普通高等學(xué)校招生全國(guó)統(tǒng)一考試語(yǔ)文試題含答案
- 《Windows 網(wǎng)絡(luò)操作系統(tǒng)》-教學(xué)教案
- 完整版成人教育計(jì)算機(jī)考試題目答案
評(píng)論
0/150
提交評(píng)論