多元統(tǒng)計(jì)分析課程設(shè)計(jì)報(bào)告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第1頁
多元統(tǒng)計(jì)分析課程設(shè)計(jì)報(bào)告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第2頁
多元統(tǒng)計(jì)分析課程設(shè)計(jì)報(bào)告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第3頁
多元統(tǒng)計(jì)分析課程設(shè)計(jì)報(bào)告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第4頁
多元統(tǒng)計(jì)分析課程設(shè)計(jì)報(bào)告樣例女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目 錄目 錄I一、問題分析11.1 問題重述1 問題分析1二、主成分分析方法基本原理22.1 主成分分析基本思想22.2 主成分分析的數(shù)學(xué)模型22.3 主成分分析的計(jì)算步驟3三、問題求解5四、結(jié)果分析74.1 相關(guān)系數(shù)矩陣74.2 協(xié)方差陣8五、總 結(jié)9六、課程設(shè)計(jì)心得體會(huì)9參考文獻(xiàn)10一、問題分析 問題重述49位女性在空腹情況下三個(gè)不同時(shí)刻的血糖含量(用表示)和攝入等量食糖一小時(shí)后的三個(gè)時(shí)刻的血糖含量(用小表示)的觀測(cè)值(單位:mg/100ml).問題:分別從樣本協(xié)方差陣S和樣本相關(guān)系數(shù)矩陣R出發(fā)做主成分分析,求主成分的貢獻(xiàn)率和各個(gè)主成分. 在兩種情況下,你認(rèn)為應(yīng)保留幾個(gè)主成分?其意義如何解

2、釋?就此而言,你認(rèn)為基于S和R的分析那個(gè)結(jié)果更為合理? 問題分析我們根據(jù)主成分分析的基本思想,設(shè)法將原來眾多的具有一定相關(guān)性的指標(biāo),重新組合成一組新的互不相關(guān)的綜合指標(biāo)來代替原來指標(biāo)。通常數(shù)學(xué)上的處理就是將原來個(gè)指標(biāo)作線性組合,作為新的綜合指標(biāo)。然后,在所有的線性組合中分別從樣本協(xié)方差陣S和樣本相關(guān)系數(shù)矩陣R出發(fā)做主成分分析,計(jì)算出各個(gè)主成分,進(jìn)而代表原來個(gè)指標(biāo)的信息。進(jìn)一步,建立主成分分析的數(shù)學(xué)模型。最后利用sas統(tǒng)計(jì)軟件來求解出各個(gè)主成分和各主成分的貢獻(xiàn)率。二、主成分分析方法基本原理 主成分分析基本思想主成分分析是數(shù)學(xué)上對(duì)數(shù)據(jù)降維的一種方法。其基本思想是設(shè)法將原來眾多的具有一定相關(guān)性的指標(biāo)

3、(比如個(gè)指標(biāo)),重新組合成一組新的互不相關(guān)的綜合指標(biāo)來代替原來指標(biāo)。通常數(shù)學(xué)上的處理就是將原來個(gè)指標(biāo)作線性組合,作為新的綜合指標(biāo)。但是這種線性組合,如果不加限制,則可以有很多,應(yīng)該如何去選取呢?在所有的線性組合中所選取的應(yīng)該是方差最大的,故稱為第一主成分。如果第一主成分不足以代表原來個(gè)指標(biāo)的信息,再考慮選取即選第二個(gè)線性組合。為了有效地反映原有信息,已有的信息就不需要再出現(xiàn)在中,用數(shù)學(xué)語言表達(dá)就是要求。稱為第二主成分,依此類推可以構(gòu)造出第三、第四、第個(gè)主成分。 主成分分析的數(shù)學(xué)模型設(shè)有個(gè)樣品(多元觀測(cè)值),每個(gè)樣品觀測(cè)項(xiàng)指標(biāo)(變量):,得到原始數(shù)據(jù)資料陣:其中.用數(shù)據(jù)矩陣的個(gè)列向量(即個(gè)指標(biāo)向

4、量)作線性組合,得綜合指標(biāo)向量:簡(jiǎn)寫成:為了加以限制,對(duì)組合系數(shù)作如下要求:即:為單位向量:,且由下列原則決定:1) 與互不相關(guān),即,其中是的協(xié)方差陣。2) 是的一切線性組合(系數(shù)滿足上述要求)中方差最大的,即: ,其中是與不相關(guān)的一切線性組合中方差最大的,是與,都不相關(guān)的的一切線性組合中方差最大的。 滿足上述要求的綜合指標(biāo)向量就是主成分,這個(gè)主成分從原始指標(biāo)所提供的信息總量中所提取的信息量依次遞減,每一個(gè)主成分所提取的信息量用方差來度量,主成分方差的貢獻(xiàn)就等于原指標(biāo)相關(guān)系數(shù)矩陣相應(yīng)的特征值,每一個(gè)主成分的組合系數(shù):就是相應(yīng)特征值所對(duì)應(yīng)的單位特征向量。方差的貢獻(xiàn)率為 其中,越大,說明相應(yīng)的主成

5、分反映綜合信息的能力越強(qiáng)。2.3 主成分分析的計(jì)算步驟(1) 計(jì)算協(xié)方差矩陣計(jì)算樣品數(shù)據(jù)的協(xié)方差矩陣:其中, (2) 求出的特征值及相應(yīng)的特征向量求出協(xié)方差矩陣的特征值及相應(yīng)的正交化單位特征向量:則的第個(gè)主成分為(3) 選擇主成分 在已確定的全部個(gè)主成分中合理選擇個(gè)來實(shí)現(xiàn)最終的評(píng)價(jià)分析。一般用方差貢獻(xiàn)率解釋主成分所反映的信息量的大小,的確定以累計(jì)貢獻(xiàn)率達(dá)到足夠大(一般在85%以上)為原則。(4) 計(jì)算主成分得分計(jì)算個(gè)樣品在個(gè)主成分上的得分: (5) 標(biāo)準(zhǔn)化實(shí)際應(yīng)用時(shí),指標(biāo)的量綱往往不同,所以在主成分計(jì)算之前應(yīng)先消除量綱的影響。消除數(shù)據(jù)的量綱有很多方法,常用方法是將原始數(shù)據(jù)標(biāo)準(zhǔn)化,即做如下數(shù)據(jù)變

6、換:其中, , ,標(biāo)準(zhǔn)化后的數(shù)據(jù)陣記為,其中每個(gè)列向量(標(biāo)準(zhǔn)化變量)的均值為0,標(biāo)準(zhǔn)差為1,數(shù)據(jù)無量綱。標(biāo)準(zhǔn)化后變量的協(xié)方差矩陣(Covariance Matrix),即原變量的相關(guān)系數(shù)矩陣(Correlation Matrix)此時(shí)個(gè)樣品在個(gè)主成分上的得分應(yīng)為:三、問題求解1. 使用“分析家”做主成分分析的步驟1) 在“分析家”中打開數(shù)據(jù)集; 2) 選擇菜單“Statistics(統(tǒng)計(jì))”®“Multivariate(多元分析)”®“Principal Components(主成分分析)”,打開“Principal Components”對(duì)話框; 3) 在對(duì)話框中輸入主成

7、分分析的變量,如圖所示。圖6-1 多元分析對(duì)話框 3) 單擊“Method”按鈕,在打開的對(duì)話框中可以選擇計(jì)算協(xié)方差矩陣的特征值或是計(jì)算相關(guān)系數(shù)矩陣的特征值。系統(tǒng)默認(rèn)計(jì)算相關(guān)系數(shù)矩陣的特征值和特征向量,單擊“OK”按鈕返回。 4) 單擊“Output”按鈕,在打開的對(duì)話框(圖左)中包括“Descriptive Statistics”選項(xiàng)、“Bivariate Plots”選項(xiàng)以及各種多元分析的選項(xiàng)。選中“Principal Component Analysis”復(fù)選框,單擊下面的“Principal Component Options”按鈕,打開“Principal Component Opt

8、ions”對(duì)話框,選中“Eigenvectors”復(fù)選框,取消“Correlations(Structure)”復(fù)選框,如圖右所示。四、結(jié)果分析4.1 相關(guān)系數(shù)矩陣變量的簡(jiǎn)單統(tǒng)計(jì)量相關(guān)系數(shù)關(guān)系矩陣相關(guān)系數(shù)關(guān)系矩陣的特征值特征向量主成分分析:,其中,4.2 協(xié)方差陣協(xié)方差矩陣特征值特征向量主成分分析:,其中,五、總 結(jié)本次課程設(shè)計(jì),我們運(yùn)用sas統(tǒng)計(jì)軟件,來分析“女性空腹及攝入食糖后體內(nèi)血糖含量主成分分析”,我們從樣本協(xié)方差陣S和樣本相關(guān)系數(shù)矩陣R出發(fā)來做主成分分析,進(jìn)一步來求出主成分的貢獻(xiàn)率和各個(gè)主成分的模型. 同時(shí),在應(yīng)用軟件操作時(shí),我們求解出了相應(yīng)的協(xié)方差系數(shù)矩陣,特征值以及特征向量,從而

9、寫出了主成分的模型和各個(gè)主成分的貢獻(xiàn)率。與此同時(shí),我們亦討論了在從樣本協(xié)方差陣S和樣本相關(guān)系數(shù)矩陣R出發(fā)來做主成分分析的這兩種情況下,我們應(yīng)保留的主成分是什么。 六、課程設(shè)計(jì)心得體會(huì)通過本次課程設(shè)計(jì),使我們對(duì)多元統(tǒng)計(jì)分析的主成分分析有了進(jìn)一步了解。主成分分析是將多指標(biāo)化為少數(shù)幾個(gè)綜和指標(biāo)的一種統(tǒng)計(jì)分析方法。在實(shí)際問題中,研究多指標(biāo)的問題是經(jīng)常遇到的問題,多元統(tǒng)計(jì)分析處理的是多變量(多指標(biāo))問題。由于變量個(gè)數(shù)太多,并且彼此之間存在著一定的相關(guān)性,因而使得所觀測(cè)到的數(shù)據(jù)在一定程度上反應(yīng)的信息有所重疊,而且變量較多時(shí),在高位空間上研究樣本的分布規(guī)律比較復(fù)雜,勢(shì)必增加分析問題的復(fù)雜性。從而,人們想用較少的綜合變量來代替較多的變量;而這幾個(gè)綜合變量又能反映原來變量的信息,并且彼此之間互不相關(guān),利用降維的思想,產(chǎn)生了主成分分析。同時(shí),讓我對(duì)sas統(tǒng)計(jì)軟件有了一定的了解,對(duì)其一些基本思想有了一些理論根據(jù),明白了其中些許的規(guī)則。 參考文獻(xiàn)1 方開泰編著實(shí)用多元統(tǒng)計(jì)分析上海:華東師

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論