統(tǒng)計學(xué)數(shù)學(xué)模型_第1頁
統(tǒng)計學(xué)數(shù)學(xué)模型_第2頁
統(tǒng)計學(xué)數(shù)學(xué)模型_第3頁
統(tǒng)計學(xué)數(shù)學(xué)模型_第4頁
統(tǒng)計學(xué)數(shù)學(xué)模型_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、一、多元回歸1、方法概述:在研究變量之間的相互影響關(guān)系模型時候,用到這類方法,具體地說:其可以定量地描述某一現(xiàn)象和某些因素之間的函數(shù)關(guān)系,將各變量的已知值帶入回歸方程可以求出因變量的估計值,從而可以進行預(yù)測等相關(guān)研究。2、分類分為兩類:多元線性回歸和非線性線性回歸;其中非線性回歸可以通過一定的變化轉(zhuǎn)化為線性回歸,比如:y=lnx可以轉(zhuǎn)化為y=uu=lnx來解決;所以這里主要說明多元線性回歸應(yīng)該注意的問題。3、注意事項在做回歸的時候,一定要注意兩件事:(1)回歸方程的顯著性檢驗(可以通過sas和spss來解決)(2)回歸系數(shù)的顯著性檢驗(可以通過sas和spss來解決)檢驗是很多學(xué)生在建模中不注

2、意的地方,好的檢驗結(jié)果可以體現(xiàn)出你模型的優(yōu)劣,是完整論文的體現(xiàn),所以這點大家一定要注意。4、使用步驟:(1)根據(jù)已知條件的數(shù)據(jù),通過預(yù)處理得出圖像的大致趨勢或者數(shù)據(jù)之間的大致關(guān)系;(2)選取適當?shù)幕貧w方程;(3)擬合回歸參數(shù);(4) 回歸方程顯著性檢驗及回歸系數(shù)顯著性檢驗(5) 進行后繼研究(如:預(yù)測等)這種模型的的特點是直觀,容易理解。這體現(xiàn)在:動態(tài)聚類圖可以很直觀地體現(xiàn)出來!當然,這只是直觀的一個方面!二、聚類分析聚類有兩種類型:(1) Q型聚類:即對樣本聚類;(2)R型聚類:即對變量聚類;聚類方法:(1)最短距離法(2)最長距離法(3)中間距離法(4)重心法(5)類平均法(6)可變類平均

3、法(7)可變法(8)利差平均和法在具體做題中,適當選取方法;3、注意事項在樣本量比較大時,要得到聚類結(jié)果就顯得不是很容易,這時需要根據(jù)背景知識和相關(guān)的其他方法輔助處理。還需要注意的是:如果總體樣本的顯著性差異不是特別大的時候,使用的時候也要注意!4、 方法步驟(1)首先把每個樣本自成一類;(2)選取適當?shù)暮饬繕藴?,得到衡量矩陣,比如說:距離矩陣或相似性矩陣,找到矩陣中最小的元素,將該元素對應(yīng)的兩個類歸為一類,(4)重復(fù)第2步,直到只剩下一個類;補充:聚類分析是一種無監(jiān)督的分類,下面將介紹有監(jiān)督的“分類”。我簡單說明下,無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)是什么無監(jiān)督學(xué)習(xí):發(fā)現(xiàn)的知識是未知的而有監(jiān)督學(xué)習(xí):發(fā)現(xiàn)

4、的知識是已知的或者這么說吧:有監(jiān)督學(xué)習(xí)是對一個已知模型做優(yōu)化,而無監(jiān)督學(xué)習(xí)是從數(shù)據(jù)中挖掘模型他們在分類中應(yīng)用比較廣泛(非數(shù)值分類)如果是數(shù)值分類就是預(yù)測了,這點要注意三、數(shù)據(jù)分類1、方法概述數(shù)據(jù)分類是一種典型的有監(jiān)督的機器學(xué)習(xí)方法,其目的是從一組已知類別的數(shù)據(jù)中發(fā)現(xiàn)分類模型,以預(yù)測新數(shù)據(jù)的未知類別。這里需要說明的是:預(yù)測和分類是有區(qū)別的,預(yù)測是對數(shù)據(jù)的預(yù)測,而分類是類別的預(yù)測。2、 類別方法:(1)神經(jīng)網(wǎng)路(2)決策樹(這里不再闡述,有興趣的同學(xué),可以參考數(shù)據(jù)挖掘和數(shù)據(jù)倉庫相關(guān)書籍)3、注意事項1神經(jīng)網(wǎng)路適用于下列情況的分類:(1)數(shù)據(jù)量比較小,缺少足夠的樣本建立數(shù)學(xué)模型;(2)數(shù)據(jù)的結(jié)構(gòu)難以

5、用傳統(tǒng)的統(tǒng)計方法來描述(3)分類模型難以表示為傳統(tǒng)的統(tǒng)計模型這里主要介紹以上三點,其他的情況大家可以自己總結(jié)!2神經(jīng)網(wǎng)路的優(yōu)點:分類準確度高,并行分布處理能力強,對噪聲數(shù)據(jù)有較強的魯棒性和容錯能力能夠充分逼近復(fù)雜的非線性關(guān)系,具備聯(lián)想記憶的功能等。3神經(jīng)網(wǎng)路缺點:需要大量的參數(shù),不能觀察中間學(xué)習(xí)過程,輸出結(jié)果較難解釋,會影響到結(jié)果的可信度,需要較長的學(xué)習(xí)時間,當數(shù)據(jù)量較大的時候,學(xué)習(xí)速度會制約其應(yīng)用。4、步驟這里只做簡略說明,具體步驟,大家可以查閱神經(jīng)網(wǎng)路數(shù)據(jù)挖掘等相關(guān)書籍(1)初始化全系數(shù)(2)輸入訓(xùn)練樣本(3)計算實際輸出值(4)計算實際輸出值和期望輸出值之間的誤差(5)用誤差去修改權(quán)系數(shù)

6、(6)判斷是否滿足終止條件,如果滿足終止,否則進入第二步.四、判別分析1、 概述其是基于已知類別的訓(xùn)練樣本,對未知類別的樣本判別的一種統(tǒng)計方法,也是一種有監(jiān)督的學(xué)習(xí)方法,是分類的一個子方法!具體是:在研究已經(jīng)過分類的樣本基礎(chǔ)上,根據(jù)某些判別分析方法建立判別式,然后對未知分類的樣本進行分類!2、分類根據(jù)判別分析方法的不同,可分為下面幾類:(1)距離判別法(2)Fisher判別法(3)Bayes判別法(4)逐步判別法關(guān)于這幾類的方法的介紹,大家可以參考多元統(tǒng)計學(xué),其中比較常用的是bayes判別法和逐步判別法3、注意事項:判別分析主要針對的是有監(jiān)督學(xué)習(xí)的分類問題。共有四種方法,這里重點注意其優(yōu)缺點:

7、(1)距離判別方法簡單容易理解,但是它將總體等概率看待,沒有差異性;(2)Bayes判別法有效地解決了距離判別法的不足,即:其考慮了先驗概率所以通常這種方法在實際中應(yīng)用比較多?。?)在進行判別分析之前,應(yīng)首先檢驗各類均值是不是有差異(因為判別分析要求給定的樣本數(shù)據(jù)必須有明顯的差異),如果檢驗后某兩個總體的差異不明顯,應(yīng)將這兩個總體合為一個總體,再由剩下的互不相同的總體重現(xiàn)建立判別分析函數(shù)。(4)這里說明下Fisher判別法和bayes判別法的使用要求:兩者對總體的數(shù)據(jù)的分布要求不同,具體的,F(xiàn)isher要求對數(shù)據(jù)分布沒有特殊要求,而bayes則要求數(shù)據(jù)分布是多元正態(tài)分布,但實際中卻沒有這么嚴格

8、?。?)這種方法可以利用spss,sas等軟件來輕松實現(xiàn)4、方法步驟這里以bayes判別法為例簡要講述,具體的方法和軟件實現(xiàn),可以去數(shù)學(xué)中國網(wǎng)站下載或者參考多元統(tǒng)計學(xué)(1) 計算各類中變量的均值xj及均值向量xh,各變量的總均值xi及均值向量x(2)計算類內(nèi)協(xié)方差及其逆矩陣(3)計算bayes判別函數(shù)中,各個變量的系數(shù)及常數(shù)項并寫出判別函數(shù)(4)計算類內(nèi)協(xié)方差矩陣及各總協(xié)方差矩陣做多個變量的全體判別效果的檢驗(5)做各個變量的判別能力檢驗(6)判別樣本應(yīng)屬于的類別1.5主成分分析1、 概述主成分分析是一種降維數(shù)的數(shù)學(xué)方法,具體就是,通過降維技術(shù)獎多個變量化為少數(shù)幾個主成分的統(tǒng)計分析方法。在建模

9、中,主要用于降維,系統(tǒng)評估,回歸分析,加權(quán)分析等等。2、 分類(無)3、注意事項在應(yīng)用主成分分析時候,應(yīng)該注意:(1)綜合指標彼此獨立或者不相互干涉(2)每個綜合指標所反映的各個樣本的總信息量等于對應(yīng)特征向量的特征值。通常要選取的綜合指標的特征值貢獻率之和應(yīng)為80%以上(3)其在應(yīng)用上側(cè)重于信息貢獻影響力的綜合評價(4)當主成分因子負荷的符號有正也有負的時候,綜合評價的函數(shù)意義就不明確!4、方法步驟大家可以參考多元統(tǒng)計學(xué)這本書籍,在這里就不做闡述,也可以從數(shù)學(xué)中國網(wǎng)站的統(tǒng)計學(xué)板塊下載!六、因子分析1、概述其是也是將變量總和為數(shù)量較少的幾個因子,是降維的一種數(shù)學(xué)技術(shù)!它和主成分分析的最大區(qū)別是:

10、其是一種探索性分析方法,即:通過用最少個數(shù)的幾個不可觀察的變量來說明出現(xiàn)在可觀察變量中的相關(guān)模型(有點類似于前面講述的分類和聚類的區(qū)別,大家好好體會下)它提供了一種有效的利用數(shù)學(xué)模型來解釋事物之間的關(guān)系,體現(xiàn)出數(shù)據(jù)挖掘的一點精神!2、 分類因子分析是R型,即對變量研究3、注意事項(1)其不是對研究總體的變量的降維,而是根據(jù)原始變量信息構(gòu)造新的變量,作為共同因子,這點區(qū)別于主成分分析(2)它通過旋轉(zhuǎn)可以使得因子變量具有可解釋性(這塊可能不容易理解,大家可以去找因子分析的相關(guān)書籍查閱,搞清楚這塊,對于你解釋模型會起到很大的作用)(3)這里說明下,因子分析和主成分分析的區(qū)別和聯(lián)系兩者都是降維數(shù)學(xué)技術(shù)

11、,前者是后者的推廣和發(fā)展主成分分析只是一般的變量替換,其始終是基于原始變量研究數(shù)據(jù)的模型規(guī)律;而因子分析則是通過挖掘出新的少數(shù)變量,來研究的一種方法,有點像數(shù)據(jù)挖掘中的未知關(guān)聯(lián)關(guān)則發(fā)現(xiàn)!4、方法步驟(略)大家可以去論壇上下載相關(guān)電子資源,也可以參考多元統(tǒng)計學(xué)七、殘差分析1、概述在實際問題中,由于觀察人員的粗心或偶然因素的干擾。常會使我們所得到的數(shù)據(jù)不完全可靠,即出現(xiàn)異常數(shù)據(jù)。有時即使通過相關(guān)系數(shù)或F檢驗證實回歸方程可靠,也不能排除數(shù)據(jù)存在上述問題。殘差分析的目的就在于解決這一問題。所謂殘差是指實際觀察值與回歸估計值的差。2、分類無3、應(yīng)用(1)通過殘差分析來排除異常數(shù)據(jù)(2)通過殘差分析來檢驗

12、模型的可靠性還有很多應(yīng)用,大家在使用過程中據(jù)情況選取,靈活應(yīng)用!八、典型相關(guān)分析1、概述前面介紹的方法主要是一個變量和多個變量之間的關(guān)系,而典型相關(guān)分析研究的是多個變量和多個變量之間的關(guān)系,或者是一組變量和一組變量之間關(guān)系!其可以揭示兩組變量之間的關(guān)系,從而供大家研究兩個現(xiàn)象之間的關(guān)系。例如:蔬菜的產(chǎn)出水平和影響產(chǎn)出水平的變量之間的關(guān)系!2、分類多對多的變量關(guān)系研究!3、注意事項(1)其可以很好地解決組合相關(guān)性的問題(2)其還局限于兩組變量的研究,而且要求這兩組變量都是連續(xù)變量且需服從多元正態(tài)分布九、時間序列1、概述時間序列預(yù)測法是一種定量分析方法,它是在時間序列變量分析的基礎(chǔ)上,運用一定的數(shù)

13、學(xué)方法建立預(yù)測模型,使時間趨勢向外延伸,從而預(yù)測未來市場的發(fā)展變化趨勢,確定變量預(yù)測值。其基本特點是:假定事物的過去趨勢會延伸到未來;預(yù)測所依據(jù)的數(shù)據(jù)具有不規(guī)則性;撇開市場發(fā)展之間的因果關(guān)系。2、分類時間序列的變動形態(tài)一般分為四種:長期趨勢變動,季節(jié)變動,循環(huán)變動,不規(guī)則變動。方法分類:(1) 平均數(shù)預(yù)測(簡單算術(shù)平均法,加權(quán)算術(shù)平均法,幾何平均數(shù)法)(2)移動平均數(shù)預(yù)測(一次移動平均法,二次移動平均法)(3)指數(shù)平滑法預(yù)測(一次,二次,三次指數(shù)平滑法)(4)趨勢法預(yù)測(分割平均法,最小二乘法,三點法)(5)季節(jié)變動法(簡單平均法,季節(jié)比例法)3注意事項(1)季節(jié)變動法預(yù)測需要籌集至少三年以上的資料(2)移動平均法在短期預(yù)測中較準確,長期預(yù)測中效果較差;(3)移動平均可以消除或減少時間序列數(shù)據(jù)受偶然性因素干擾而產(chǎn)生的隨機變動影響。(4)一次移動平均法適用于具有明顯線性趨勢的時間序列數(shù)據(jù)的預(yù)測;一次移動平均法只能用來對下一期進行預(yù)測,不能用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論