統(tǒng)計(jì)學(xué)數(shù)學(xué)模型

上傳人：s*** IP屬地：天津上傳時(shí)間：2022-05-07 格式：DOCX 頁數(shù)：10 大小：17.60KB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩5頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、一、多元回歸1、方法概述：在研究變量之間的相互影響關(guān)系模型時(shí)候，用到這類方法，具體地說：其可以定量地描述某一現(xiàn)象和某些因素之間的函數(shù)關(guān)系，將各變量的已知值帶入回歸方程可以求出因變量的估計(jì)值，從而可以進(jìn)行預(yù)測等相關(guān)研究。2、分類分為兩類：多元線性回歸和非線性線性回歸；其中非線性回歸可以通過一定的變化轉(zhuǎn)化為線性回歸，比如：y=lnx可以轉(zhuǎn)化為y=uu=lnx來解決；所以這里主要說明多元線性回歸應(yīng)該注意的問題。3、注意事項(xiàng)在做回歸的時(shí)候，一定要注意兩件事：(1)回歸方程的顯著性檢驗(yàn)(可以通過sa"Dspss來解決)(2)回歸系數(shù)的顯著性檢驗(yàn)(可以通過sa/口spss來解決)檢驗(yàn)是很多學(xué)生在

2、建模中不注意的地方，好的檢驗(yàn)結(jié)果可以體現(xiàn)出你模型的優(yōu)劣，是完整論文的體現(xiàn)，所以這點(diǎn)大家一定要注意。4、使用步驟：(1)根據(jù)已知條件的數(shù)據(jù)，通過預(yù)處理得出圖像的大致趨勢或者數(shù)據(jù)之間的大致關(guān)系；(2)選取適當(dāng)?shù)幕貧w方程；(3)擬合回歸參數(shù)；(4)回歸方程顯著性檢驗(yàn)及回歸系數(shù)顯著性檢驗(yàn)（5）進(jìn)行后繼研究（如：預(yù)測等）這種模型的的特點(diǎn)是直觀，容易理解。這體現(xiàn)在：動(dòng)態(tài)聚類圖可以很直觀地體現(xiàn)出來！當(dāng)然，這只是直觀的一個(gè)方面！二、聚類分析聚類有兩種類型：（1）Q型聚類：即對(duì)樣本聚類；（2）R型聚類：即對(duì)變量聚類；聚類方法：（1）最短距離法（2）最長距離法（3）中間距離法（4）重心法（5）類平均法（6）可變類

3、平均法（7）可變法（8）利差平均和法在具體做題中，適當(dāng)選取方法；3、注意事項(xiàng)在樣本量比較大時(shí)，要得到聚類結(jié)果就顯得不是很容易，這時(shí)需要根據(jù)背景知識(shí)和相關(guān)的其他方法輔助處理。還需要注意的是：如果總體樣本的顯著性差異不是特別大的時(shí)候，使用的時(shí)候也要注意！4、方法步驟（1）首先把每個(gè)樣本自成一類；（2）選取適當(dāng)?shù)暮饬繕?biāo)準(zhǔn)，得到衡量矩陣，比如說：距離矩陣或相似性矩陣，找到矩陣中最小的元素，將該元素對(duì)應(yīng)的兩個(gè)類歸為一類，（4）重復(fù)第2步，直到只剩下一個(gè)類；補(bǔ)充：聚類分析是一種無監(jiān)督的分類，下面將介紹有監(jiān)督的“分類”。我簡單說明下，無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)是什么無監(jiān)督學(xué)習(xí)：發(fā)現(xiàn)的知識(shí)是未知的而有監(jiān)督學(xué)習(xí)：發(fā)

4、現(xiàn)的知識(shí)是已知的或者這么說吧：有監(jiān)督學(xué)習(xí)是對(duì)一個(gè)已知模型做優(yōu)化，而無監(jiān)督學(xué)習(xí)是從數(shù)據(jù)中挖掘模型他們?cè)诜诸愔袘?yīng)用比較廣泛（非數(shù)值分類）如果是數(shù)值分類就是預(yù)測了，這點(diǎn)要注意三、數(shù)據(jù)分類1、方法概述數(shù)據(jù)分類是一種典型的有監(jiān)督的機(jī)器學(xué)習(xí)方法，其目的是從一組已知類別的數(shù)據(jù)中發(fā)現(xiàn)分類模型，以預(yù)測新數(shù)據(jù)的未知類別。這里需要說明的是：預(yù)測和分類是有區(qū)別的，預(yù)測是對(duì)數(shù)據(jù)的預(yù)測，而分類是類別的預(yù)測。2、類別方法：（1）神經(jīng)網(wǎng)路（2）決策樹（這里不再闡述，有興趣的同學(xué)，可以參考數(shù)據(jù)挖掘和數(shù)據(jù)倉庫相關(guān)書籍）3、注意事項(xiàng)1»神經(jīng)網(wǎng)路適用于下列情況的分類：（1）數(shù)據(jù)量比較小，缺少足夠的樣本建立數(shù)學(xué)模型；（2）數(shù)

5、據(jù)的結(jié)構(gòu)難以用傳統(tǒng)的統(tǒng)計(jì)方法來描述（3）分類模型難以表示為傳統(tǒng)的統(tǒng)計(jì)模型這里主要介紹以上三點(diǎn)，其他的情況大家可以自己總結(jié)！2»神經(jīng)網(wǎng)路的優(yōu)點(diǎn)：分類準(zhǔn)確度高，并行分布處理能力強(qiáng)，對(duì)噪聲數(shù)據(jù)有較強(qiáng)的魯棒性和容錯(cuò)能力能夠充分逼近復(fù)雜的非線性關(guān)系，具備聯(lián)想記憶的功能等。3神經(jīng)網(wǎng)路缺點(diǎn)：需要大量的參數(shù)，不能觀察中間學(xué)習(xí)過程，輸出結(jié)果較難解釋，會(huì)影響到結(jié)果的可信度，需要較長的學(xué)習(xí)時(shí)間，當(dāng)數(shù)據(jù)量較大的時(shí)候，學(xué)習(xí)速度會(huì)制約其應(yīng)用。4、步驟這里只做簡略說明，具體步驟，大家可以查閱神經(jīng)網(wǎng)路數(shù)據(jù)挖掘等相關(guān)書籍（1）初始化全系數(shù)（2）輸入訓(xùn)練樣本（3）計(jì)算實(shí)際輸出值（4）計(jì)算實(shí)際輸出值和期望輸出值之間的誤差

6、（5）用誤差去修改權(quán)系數(shù)（6）判斷是否滿足終止條件，如果滿足終止，否則進(jìn)入第二步.四、判別分析1、概述其是基于已知類別的訓(xùn)練樣本，對(duì)未知類別的樣本判別的一種統(tǒng)計(jì)方法，也是一種有監(jiān)督的學(xué)習(xí)方法，是分類的一個(gè)子方法！具體是：在研究已經(jīng)過分類的樣本基礎(chǔ)上，根據(jù)某些判別分析方法建立判別式，然后對(duì)未知分類的樣本進(jìn)行分類！2、分類根據(jù)判別分析方法的不同，可分為下面幾類：（1）距離判別法（2）Fisher判別法（3）Baye肆ij別法（4）逐步判別法關(guān)于這幾類的方法的介紹，大家可以參考多元統(tǒng)計(jì)學(xué)，其中比較常用的是baye琲ij別法和逐步判別法3、注意事項(xiàng)：判別分析主要針對(duì)的是有監(jiān)督學(xué)習(xí)的分類問題。共有四種方

7、法，這里重點(diǎn)注意其優(yōu)缺點(diǎn)：(1)距離判別方法簡單容易理解，但是它將總體等概率看待，沒有差異性；(2)Bayes判別法有效地解決了距離判別法的不足，即：其考慮了先驗(yàn)概率一一所以通常這種方法在實(shí)際中應(yīng)用比較多！(3)在進(jìn)行判別分析之前，應(yīng)首先檢驗(yàn)各類均值是不是有差異(因?yàn)榕袆e分析要求給定的樣本數(shù)據(jù)必須有明顯的差異)，如果檢驗(yàn)后某兩個(gè)總體的差異不明顯，應(yīng)將這兩個(gè)總體合為一個(gè)總體，再由剩下的互不相同的總體重現(xiàn)建立判別分析函數(shù)。(4)這里說明下Fisher判別法和bayes判別法的使用要求：兩者對(duì)總體的數(shù)據(jù)的分布要求不同，具體的，F(xiàn)isher要求對(duì)數(shù)據(jù)分布沒有特殊要求，而bayes則要求數(shù)據(jù)分布是多元正

8、態(tài)分布，但實(shí)際中卻沒有這么嚴(yán)格！(5)這種方法可以利用sps§sas等軟件來輕松實(shí)現(xiàn)4、方法步驟這里以baye琲ij別法為例簡要講述，具體的方法和軟件實(shí)現(xiàn)，可以去數(shù)學(xué)中國網(wǎng)站下載或者參考多元統(tǒng)計(jì)學(xué)(1)計(jì)算各類中變量的均值xj及均值向量xh,各變量的總均值xi及均值向量x(2)計(jì)算類內(nèi)協(xié)方差及其逆矩陣(3)計(jì)算bayes判別函數(shù)中，各個(gè)變量的系數(shù)及常數(shù)項(xiàng)并寫出判別函數(shù)(4)計(jì)算類內(nèi)協(xié)方差矩陣及各總協(xié)方差矩陣做多個(gè)變量的全體判別效果的檢驗(yàn)(5)做各個(gè)變量的判別能力檢驗(yàn)(6)判別樣本應(yīng)屬于的類別1.5主成分分析1、概述主成分分析是一種降維數(shù)的數(shù)學(xué)方法，具體就是，通過降維技術(shù)獎(jiǎng)多個(gè)變量化為

9、少數(shù)幾個(gè)主成分的統(tǒng)計(jì)分析方法。在建模中，主要用于降維，系統(tǒng)評(píng)估，回歸分析，加權(quán)分析等等。2、分類(無)3、注意事項(xiàng)在應(yīng)用主成分分析時(shí)候，應(yīng)該注意：(1)綜合指標(biāo)彼此獨(dú)立或者不相互干涉(2)每個(gè)綜合指標(biāo)所反映的各個(gè)樣本的總信息量等于對(duì)應(yīng)特征向量的特征值。通常要選取的綜合指標(biāo)的特征值貢獻(xiàn)率之和應(yīng)為80%以上(3)其在應(yīng)用上側(cè)重于信息貢獻(xiàn)影響力的綜合評(píng)價(jià)(4)當(dāng)主成分因子負(fù)荷的符號(hào)有正也有負(fù)的時(shí)候，綜合評(píng)價(jià)的函數(shù)意義就不明確！4、方法步驟大家可以參考多元統(tǒng)計(jì)學(xué)這本書籍，在這里就不做闡述，也可以從數(shù)學(xué)中國網(wǎng)站的統(tǒng)計(jì)學(xué)板塊下載！六、因子分析1、概述其是也是將變量總和為數(shù)量較少的幾個(gè)因子，是降維的一種數(shù)學(xué)

10、技術(shù)！它和主成分分析的最大區(qū)別是：其是一種探索性分析方法，即：通過用最少個(gè)數(shù)的幾個(gè)不可觀察的變量來說明出現(xiàn)在可觀察變量中的相關(guān)模型(有點(diǎn)類似于前面講述的分類和聚類的區(qū)別，大家好好體會(huì)下)它提供了一種有效的利用數(shù)學(xué)模型來解釋事物之間的關(guān)系，體現(xiàn)出數(shù)據(jù)挖掘的一點(diǎn)精神！2、分類因子分析是R型，即對(duì)變量研究3、注意事項(xiàng)(1)其不是對(duì)研究總體的變量的降維，而是根據(jù)原始變量信息構(gòu)造新的變量，作為共同因子，這點(diǎn)區(qū)別于主成分分析(2)它通過旋轉(zhuǎn)可以使得因子變量具有可解釋性(這塊可能不容易理解，大家可以去找因子分析的相關(guān)書籍查閱，搞清楚這塊，對(duì)于你解釋模型會(huì)起到很大的作用)(3)這里說明下，因子分析和主成分分析

11、的區(qū)別和聯(lián)系<1>兩者都是降維數(shù)學(xué)技術(shù)，前者是后者的推廣和發(fā)展<2>主成分分析只是一般的變量替換，其始終是基于原始變量研究數(shù)據(jù)的模型規(guī)律；而因子分析則是通過挖掘出新的少數(shù)變量，來研究的一種方法，有點(diǎn)像數(shù)據(jù)挖掘中的未知關(guān)聯(lián)關(guān)則發(fā)現(xiàn)！4、方法步驟(略)大家可以去論壇上下載相關(guān)電子資源，也可以參考多元統(tǒng)計(jì)學(xué)七、殘差分析1、概述在實(shí)際問題中，由于觀察人員的粗心或偶然因素的干擾。常會(huì)使我們所得到的數(shù)據(jù)不完全可靠，即出現(xiàn)異常數(shù)據(jù)。有時(shí)即使通過相關(guān)系數(shù)或F檢驗(yàn)證實(shí)回歸方程可靠，也不能排除數(shù)據(jù)存在上述問題。殘差分析的目的就在于解決這一問題。所謂殘差是指實(shí)際觀察值與回歸估計(jì)值的差。2、分

12、類無3、應(yīng)用(1)通過殘差分析來排除異常數(shù)據(jù)(2)通過殘差分析來檢驗(yàn)?zāi)Ｐ偷目煽啃赃€有很多應(yīng)用，大家在使用過程中據(jù)情況選取，靈活應(yīng)用！八、典型相關(guān)分析1、概述前面介紹的方法主要是一個(gè)變量和多個(gè)變量之間的關(guān)系，而典型相關(guān)分析研究的是多個(gè)變量和多個(gè)變量之間的關(guān)系，或者是一組變量和一組變量之間關(guān)系！其可以揭示兩組變量之間的關(guān)系，從而供大家研究兩個(gè)現(xiàn)象之間的關(guān)系。例如：蔬菜的產(chǎn)出水平和影響產(chǎn)出水平的變量之間的關(guān)系！2、分類多對(duì)多的變量關(guān)系研究！3、注意事項(xiàng)(1)其可以很好地解決組合相關(guān)性的問題(2)其還局限于兩組變量的研究，而且要求這兩組變量都是連續(xù)變量且需服從多元正態(tài)分布九、時(shí)間序列1、概述時(shí)間序列預(yù)

13、測法是一種定量分析方法，它是在時(shí)間序列變量分析的基礎(chǔ)上，運(yùn)用一定的數(shù)學(xué)方法建立預(yù)測模型，使時(shí)間趨勢向外延伸，從而預(yù)測未來市場的發(fā)展變化趨勢，確定變量預(yù)測值。其基本特點(diǎn)是：假定事物的過去趨勢會(huì)延伸到未來；預(yù)測所依據(jù)的數(shù)據(jù)具有不規(guī)則性；撇開市場發(fā)展之間的因果關(guān)系。2、分類時(shí)間序列的變動(dòng)形態(tài)一般分為四種：長期趨勢變動(dòng)，季節(jié)變動(dòng)，循環(huán)變動(dòng)，不規(guī)則變動(dòng)。方法分類：（1）平均數(shù)預(yù)測（簡單算術(shù)平均法，加權(quán)算術(shù)平均法，幾何平均數(shù)法）（2）移動(dòng)平均數(shù)預(yù)測（一次移動(dòng)平均法，二次移動(dòng)平均法）（3）指數(shù)平滑法預(yù)測（一次，二次，三次指數(shù)平滑法）（4）趨勢法預(yù)測（分割平均法，最小二乘法，三點(diǎn)法）（5）季節(jié)變動(dòng)法（簡單平均法，季節(jié)比例法）3.注意事項(xiàng)（1）季節(jié)變動(dòng)法預(yù)測需要籌集至少三年以上的資料（2）移動(dòng)平均法在短期預(yù)測中較準(zhǔn)確，長期預(yù)測中效果較差；（3）移動(dòng)平均可以消除或減少時(shí)間序列數(shù)據(jù)受偶然性因素干擾而產(chǎn)生的隨機(jī)變動(dòng)影響。(4)一次移動(dòng)平均法適用于具有明顯線性趨勢的時(shí)間序列數(shù)據(jù)的預(yù)測；一次移動(dòng)平均法只能用來對(duì)下一期進(jìn)行預(yù)測，不能

人人文庫> 全部分類> 應(yīng)用文書 > 作業(yè)報(bào)告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)學(xué)數(shù)學(xué)模型

文檔簡介

溫馨提示

最新文檔

評(píng)論

統(tǒng)計(jì)學(xué)數(shù)學(xué)模型

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔