數(shù)學(xué)建模中統(tǒng)計(jì)學(xué)常用方法參考模板_第1頁
數(shù)學(xué)建模中統(tǒng)計(jì)學(xué)常用方法參考模板_第2頁
數(shù)學(xué)建模中統(tǒng)計(jì)學(xué)常用方法參考模板_第3頁
數(shù)學(xué)建模中統(tǒng)計(jì)學(xué)常用方法參考模板_第4頁
數(shù)學(xué)建模中統(tǒng)計(jì)學(xué)常用方法參考模板_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1.1多元回歸1、方法概述:在研究變量之間的相互影響關(guān)系模型時(shí)候,用到這類方法,具體地說:其可以定量地描述某一現(xiàn)象和某些因素之間的函數(shù)關(guān)系,將各變量的已知值帶入回歸方程可以求出因變量的估計(jì)值,從而可以進(jìn)行預(yù)測等相關(guān)研究。2、分類 分為兩類:多元線性回歸和非線性線性回歸;其中非線性回歸可以通過一定的變化轉(zhuǎn)化為線性回歸,比如:y=lnx 可以轉(zhuǎn)化為 y=u u=lnx來解決;所以這里主要說明多元線性回歸應(yīng)該注意的問題。3、 注意事項(xiàng) 在做回歸的時(shí)候,一定要注意兩件事:(1)回歸方程的顯著性檢驗(yàn)(可以通過sas和spss來解決)(2) 回歸系數(shù)的顯著性檢驗(yàn)(可以通過sas和spss來解決)檢驗(yàn)是很多

2、學(xué)生在建模中不注意的地方,好的檢驗(yàn)結(jié)果可以體現(xiàn)出你模型的優(yōu)劣,是完整論文的體現(xiàn),所以這點(diǎn)大家一定要注意。4、使用步驟:(1)根據(jù)已知條件的數(shù)據(jù),通過預(yù)處理得出圖像的大致趨勢或者數(shù)據(jù)之間的大致關(guān)系;(2)選取適當(dāng)?shù)幕貧w方程;(3)擬合回歸參數(shù);(4)回歸方程顯著性檢驗(yàn)及回歸系數(shù)顯著性檢驗(yàn)(5)進(jìn)行后繼研究(如:預(yù)測等)這種模型的的特點(diǎn)是直觀,容易理解。這體現(xiàn)在:動(dòng)態(tài)聚類圖可以很直觀地體現(xiàn)出來!當(dāng)然,這只是直觀的一個(gè)方面!2、分類聚類有兩種類型:(1) Q型聚類:即對樣本聚類;(2) R型聚類:即對變量聚類;聚類方法:(1)最短距離法(2)最長距離法(3)中間距離法(4)重心法(5)類平均法(6)

3、可變類平均法(7)可變法(8) 利差平均和法在具體做題中,適當(dāng)選取方法;3、注意事項(xiàng)在樣本量比較大時(shí),要得到聚類結(jié)果就顯得不是很容易,這時(shí)需要根據(jù)背景知識和相關(guān)的其他方法輔助處理。還需要注意的是:如果總體樣本的顯著性差異不是特別大的時(shí)候,使用的時(shí)候也要注意!4、方法步驟(1)首先把每個(gè)樣本自成一類;2)選取適當(dāng)?shù)暮饬繕?biāo)準(zhǔn),得到衡量矩陣,比如說:距離矩陣或相似性矩陣,找到矩陣中最小的元素,將該元素對應(yīng)的兩個(gè)類歸為一類,(4)重復(fù)第2步,直到只剩下一個(gè)類;(4)重復(fù)第2步,直到只剩下一個(gè)類;補(bǔ)充:聚類分析是一種無監(jiān)督的分類,下面將介紹有監(jiān)督的“分類”。1 / 5我簡單說明下,無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)

4、是什么無監(jiān)督學(xué)習(xí):發(fā)現(xiàn)的知識是未知的而有監(jiān)督學(xué)習(xí):發(fā)現(xiàn)的知識是已知的或者這么說吧:有監(jiān)督學(xué)習(xí)是對一個(gè)已知模型做優(yōu)化,而無監(jiān)督學(xué)習(xí)是從數(shù)據(jù)中挖掘模型他們在分類中應(yīng)用比較廣泛(非數(shù)值分類)如果是數(shù)值分類就是預(yù)測了,這點(diǎn)要注意1.3數(shù)據(jù)分類1、方法概述數(shù)據(jù)分類是一種典型的有監(jiān)督的機(jī)器學(xué)習(xí)方法,其目的是從一組已知類別的數(shù)據(jù)中發(fā)現(xiàn)分類模型,以預(yù)測新數(shù)據(jù)的未知類別。這里需要說明的是:預(yù)測和分類是有區(qū)別的,預(yù)測是對數(shù)據(jù)的預(yù)測,而分類是類別的預(yù)測。2、類別方法:(1)神經(jīng)網(wǎng)路(2)決策樹(這里不再闡述,有興趣的同學(xué),可以參考數(shù)據(jù)挖掘和數(shù)據(jù)倉庫相關(guān)書籍)3、注意事項(xiàng)1 神經(jīng)網(wǎng)路適用于下列情況的分類:(1) 數(shù)據(jù)

5、量比較小,缺少足夠的樣本建立數(shù)學(xué)模型;(2) 數(shù)據(jù)的結(jié)構(gòu)難以用傳統(tǒng)的統(tǒng)計(jì)方法來描述(3) 分類模型難以表示為傳統(tǒng)的統(tǒng)計(jì)模型這里主要介紹以上三點(diǎn),其他的情況大家可以自己總結(jié)!2 神經(jīng)網(wǎng)路的優(yōu)點(diǎn):分類準(zhǔn)確度高,并行分布處理能力強(qiáng),對噪聲數(shù)據(jù)有較強(qiáng)的魯棒性和容錯(cuò)能力能夠充分逼近復(fù)雜的非線性關(guān)系,具備聯(lián)想記憶的功能等。3 神經(jīng)網(wǎng)路缺點(diǎn):需要大量的參數(shù),不能觀察中間學(xué)習(xí)過程,輸出結(jié)果較難解釋,會影響到結(jié)果的可信度,需要較長的學(xué)習(xí)時(shí)間,當(dāng)數(shù)據(jù)量較大的時(shí)候,學(xué)習(xí)速度會制約其應(yīng)用。4、步驟這里只做簡略說明,具體步驟,大家可以查閱神經(jīng)網(wǎng)路數(shù)據(jù)挖掘等相關(guān)書籍(1)初始化全系數(shù)(2)輸入訓(xùn)練樣本(3)計(jì)算實(shí)際輸出值

6、(4)計(jì)算實(shí)際輸出值和期望輸出值之間的誤差(5)用誤差去修改權(quán)系數(shù)(6)判斷是否滿足終止條件,如果滿足終止,否則進(jìn)入第二步.4判別分析1、概述其是基于已知類別的訓(xùn)練樣本,對未知類別的樣本判別的一種統(tǒng)計(jì)方法,也是一種有監(jiān)督的學(xué)習(xí)方法,是分類的一個(gè)子方法!具體是:在研究已經(jīng)過分類的樣本基礎(chǔ)上,根據(jù)某些判別分析方法建立判別式,然后對未知分類的樣本進(jìn)行分類!2、分類根據(jù)判別分析方法的不同,可分為下面幾類:(1)距離判別法(2) Fisher判別法(3)Bayes判別法(4)逐步判別法關(guān)于這幾類的方法的介紹,大家可以參考多元統(tǒng)計(jì)學(xué),其中比較常用的是bayes判別法和逐步判別法3、 注意事項(xiàng):判別分析主要

7、針對的是有監(jiān)督學(xué)習(xí)的分類問題。共有四種方法,這里重點(diǎn)注意其優(yōu)缺點(diǎn):(1)距離判別方法簡單容易理解,但是它將總體等概率看待,沒有差異性;(2)Bayes判別法有效地解決了距離判別法的不足,即:其考慮了先驗(yàn)概率所以通常這種方法在實(shí)際中應(yīng)用比較多?。?)在進(jìn)行判別分析之前,應(yīng)首先檢驗(yàn)各類均值是不是有差異(因?yàn)榕袆e分析要求給定的樣本數(shù)據(jù)必須有明顯的差異),如果檢驗(yàn)后某兩個(gè)總體的差異不明顯,應(yīng)將這兩個(gè)總體合為一個(gè)總體,再由剩下的互不相同的總體重現(xiàn)建立判別分析函數(shù)。(4)這里說明下Fisher判別法和bayes判別法的使用要求:兩者對總體的數(shù)據(jù)的分布要求不同,具體的,F(xiàn)isher要求對數(shù)據(jù)分布沒有特殊要求

8、,而bayes則要求數(shù)據(jù)分布是多元正態(tài)分布,但實(shí)際中卻沒有這么嚴(yán)格?。?)這種方法可以利用spss,sas等軟件來輕松實(shí)現(xiàn)4、方法步驟這里以bayes判別法為例簡要講述,具體的方法和軟件實(shí)現(xiàn),可以去數(shù)學(xué)中國網(wǎng)站下載或者參考多元統(tǒng)計(jì)學(xué)(1) 計(jì)算各類中變量的均值xj及均值向量xh,各變量的總均值xi及均值向量x(2)計(jì)算類內(nèi)協(xié)方差及其逆矩陣(3)計(jì)算bayes判別函數(shù)中,各個(gè)變量的系數(shù)及常數(shù)項(xiàng)并寫出判別函數(shù)(4)計(jì)算類內(nèi)協(xié)方差矩陣及各總協(xié)方差矩陣做多個(gè)變量的全體判別效果的檢驗(yàn)(5)做各個(gè)變量的判別能力檢驗(yàn)(6) 判別樣本應(yīng)屬于的類別1.5主成分分析1、概述主成分分析是一種降維數(shù)的數(shù)學(xué)方法,具體就

9、是,通過降維技術(shù)獎(jiǎng)多個(gè)變量化為少數(shù)幾個(gè)主成分的統(tǒng)計(jì)分析方法。在建模中,主要用于降維,系統(tǒng)評估,回歸分析,加權(quán)分析等等。2、分類(無)3、注意事項(xiàng)在應(yīng)用主成分分析時(shí)候,應(yīng)該注意:(1) 綜合指標(biāo)彼此獨(dú)立或者不想(2) 每個(gè)綜合指標(biāo)所反映的各個(gè)樣本的總信息量等于對應(yīng)特征向量的特征值。通常要選取的綜合指標(biāo)的特征值貢獻(xiàn)率之和應(yīng)為80%以上(3) 其在應(yīng)用上側(cè)重于信息貢獻(xiàn)影響力的綜合評價(jià)(4) 當(dāng)主成分因子負(fù)荷的符號有正也有負(fù)的時(shí)候,綜合評價(jià)的函數(shù)意義就不明確!4、方法步驟大家可以參考多元統(tǒng)計(jì)學(xué)這本書籍,在這里就不做闡述,也可以從數(shù)學(xué)中國網(wǎng)站的統(tǒng)計(jì)學(xué)板塊下載!1.6 因子分析1、概述其是也是將變量總和為

10、數(shù)量較少的幾個(gè)因子,是降維的一種數(shù)學(xué)技術(shù)!它和主成分分析的最大區(qū)別是:其是一種探索性分析方法,即:通過用最少個(gè)數(shù)的幾個(gè)不可觀察的變量來說明出現(xiàn)在可觀察變量中的相關(guān)模型(有點(diǎn)類似于前面講述的分類和聚類的區(qū)別,大家好好體會下)它提供了一種有效的利用數(shù)學(xué)模型來解釋事物之間的關(guān)系,體現(xiàn)出數(shù)據(jù)挖掘的一點(diǎn)精神!2、分類因子分析是R型,即對變量研究3、注意事項(xiàng)(1)其不是對研究總體的變量的降維,而是根據(jù)原始變量信息構(gòu)造新的變量,作為共同因子,這點(diǎn)區(qū)別于主成分分析(2)它通過旋轉(zhuǎn)可以使得因子變量具有可解釋性(這塊可能不容易理解,大家可以去找因子分析的相關(guān)書籍查閱,搞清楚這塊,對于你解釋模型會起到很大的作用)(

11、3)這里說明下,因子分析和主成分分析的區(qū)別和聯(lián)系<1>兩者都是降維數(shù)學(xué)技術(shù),前者是后者的推廣和發(fā)展<2>主成分分析只是一般的變量替換,其始終是基于原始變量研究數(shù)據(jù)的模型規(guī)律;而因子分析則是通過挖掘出新的少數(shù)變量,來研究的一種方法,有點(diǎn)像數(shù)據(jù)挖掘中的未知關(guān)聯(lián)關(guān)則發(fā)現(xiàn)!4、方法步驟(略)大家可以去論壇上下載相關(guān)電子資源,也可以參考多元統(tǒng)計(jì)學(xué)1.7殘差分析1、 概述在實(shí)際問題中,由于觀察人員的粗心或偶然因素的干擾。常會使我們所得到的數(shù)據(jù)不完全可靠, 即出現(xiàn)異常數(shù)據(jù)。有時(shí)即使通過相關(guān)系數(shù)或F檢驗(yàn)證實(shí)回歸方程可靠,也不能排除數(shù)據(jù)存在上述問題。殘差分析的目的就在于解決這一問題。所謂

12、殘差是指實(shí)際觀察值與回歸估計(jì)值的差。2、分類無3、應(yīng)用(1)通過殘差分析來排除異常數(shù)據(jù)(2)通過殘差分析來檢驗(yàn)?zāi)P偷目煽啃赃€有很多應(yīng)用,大家在使用過程中據(jù)情況選取,靈活應(yīng)用!18典型相關(guān)分析1、概述前面介紹的方法主要是一個(gè)變量和多個(gè)變量之間的關(guān)系,而典型相關(guān)分析研究的是多個(gè)變量和多個(gè)變量之間的關(guān)系,或者是一組變量和一組變量之間關(guān)系!其可以揭示兩組變量之間的關(guān)系,從而供大家研究兩個(gè)現(xiàn)象之間的關(guān)系。例如:蔬菜的產(chǎn)出水平和影響產(chǎn)出水平的變量之間的關(guān)系!2、分類多對多的變量關(guān)系研究!3、注意事項(xiàng)(1)其可以很好地解決組合相關(guān)性的問題(2)其還局限于兩組變量的研究,而且要求這兩組變量都是連續(xù)變量且需服從

13、多元正態(tài)分布1.9時(shí)間序列1、概述時(shí)間序列預(yù)測法是一種定量分析方法,它是在時(shí)間序列變量分析的基礎(chǔ)上,運(yùn)用一定的數(shù)學(xué)方法建立預(yù)測模型,使時(shí)間趨勢向外延伸,從而預(yù)測未來市場的發(fā)展變化趨勢,確定變量預(yù)測值。其基本特點(diǎn)是:假定事物的過去趨勢會延伸到未來;預(yù)測所依據(jù)的數(shù)據(jù)具有不規(guī)則性;撇開市場發(fā)展之間的因果關(guān)系。2、分類時(shí)間序列的變動(dòng)形態(tài)一般分為四種:長期趨勢變動(dòng),季節(jié)變動(dòng),循環(huán)變動(dòng),不規(guī)則變動(dòng)。方法分類:(1) 平均數(shù)預(yù)測(簡單算術(shù)平均法,加權(quán)算術(shù)平均法,幾何平均數(shù)法)(2) 移動(dòng)平均數(shù)預(yù)測(一次移動(dòng)平均法,二次移動(dòng)平均法)(3) 指數(shù)平滑法預(yù)測(一次,二次,三次指數(shù)平滑法)(4) 趨勢法預(yù)測(分割平均法,最小二乘法,三點(diǎn)法)(5) 季節(jié)變動(dòng)法(簡單平均法,季節(jié)比例法)3注意事項(xiàng)(1)季節(jié)變動(dòng)法預(yù)測需要籌集至少三年以上的資料(2)移動(dòng)平均法在短期預(yù)測中較準(zhǔn)確,長期預(yù)測中效果較差;(3)移動(dòng)平均可以消除或減少時(shí)間序列數(shù)據(jù)受偶然性因素干擾而產(chǎn)生的隨機(jī)變動(dòng)影響。(4)一次移動(dòng)平均法適用于具有明顯線性趨勢的時(shí)間序列數(shù)據(jù)的預(yù)測;一次移動(dòng)平均法只能用來對下一期進(jìn)行預(yù)測,不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論