![《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量_第1頁](http://file4.renrendoc.com/view5/M01/2F/21/wKhkGGYFBG-ASJulAAC7MRB-Zso054.jpg)
![《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量_第2頁](http://file4.renrendoc.com/view5/M01/2F/21/wKhkGGYFBG-ASJulAAC7MRB-Zso0542.jpg)
![《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量_第3頁](http://file4.renrendoc.com/view5/M01/2F/21/wKhkGGYFBG-ASJulAAC7MRB-Zso0543.jpg)
![《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量_第4頁](http://file4.renrendoc.com/view5/M01/2F/21/wKhkGGYFBG-ASJulAAC7MRB-Zso0544.jpg)
![《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量_第5頁](http://file4.renrendoc.com/view5/M01/2F/21/wKhkGGYFBG-ASJulAAC7MRB-Zso0545.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量2024/3/28《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量如果你要到裁縫店定做一件上衣,需要測量很多尺寸,譬如身長、袖長、胸圍、腰圍、肩寬、肩厚等。但服裝廠要生產(chǎn)一批新型服裝,卻不可能完全按照每個人的這些尺寸來對型號進行劃分,而是把各個方面進行高度概括,用少數(shù)幾個指標作為分類的型號,簡單明了的反映不同人群的體態(tài)特征。日常生活中經(jīng)常遇到包含很多變量的數(shù)據(jù),比如各個地區(qū)的若干經(jīng)濟指標數(shù)據(jù),上市公司財務(wù)報表公布的多項財務(wù)數(shù)據(jù)等等。這些數(shù)據(jù)中的變量雖然很多,但往往相互之間都有著一定的關(guān)聯(lián),這使得只要找出少數(shù)幾個“代表”就可以對復(fù)雜的信息進行比較完整的描述了。主成分分析和因子分析便是實現(xiàn)這一過程的兩種方法。*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量第8章用少數(shù)變量代表多個變量8.1主成分分析8.2因子分析*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量在研究實際問題時,往往需要收集多個變量。但這樣會使多個變量間存在較強的相關(guān)關(guān)系,即這些變量間存在較多的信息重復(fù),直接利用它們進行分析,不但模型復(fù)雜,還會因為變量間存在多重共線性而引起較大的誤差。為能夠充分利用數(shù)據(jù),通常希望用較少的新變量代替原來較多的舊變量,同時要求這些新變量盡可能反映原變量的信息。主成分分析和因子分子正是解決這類問題的有效方法。它們能夠提取信息,使變量簡化降維,從而使問題更加簡單直觀。主成分分析和因子分析
(PrincipalComponentAnalysis&FactorAnalysis)*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量8.1主成分分析8.1.1主成分分析的基本思想是什么?8.1.2如何選擇主成分?8.1.3怎樣解釋主成分?
第8章用少數(shù)變量代表多個變量*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量8.1.1主成分分析的基本思想是什么?8.1主成分分析*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量主成分的概念由KarlPearson在1901年提出考察多個變量間相關(guān)性的一種多元統(tǒng)計方法研究如何通過少數(shù)幾個主成分來解釋多個變量間的內(nèi)部結(jié)構(gòu)。即從原始變量中導(dǎo)出少數(shù)幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān)。主成分分析的目的:數(shù)據(jù)的壓縮;數(shù)據(jù)的解釋它常被用來尋找判斷事物或現(xiàn)象的綜合指標,并對綜合指標所包含的信息進行適當?shù)慕忉?。什么是主成分分析?/p>
(PrincipalComponentAnalysis)*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量【例8.1】表8-1是北京市某高中50名學(xué)生的六門課程測試成績數(shù)據(jù)
乍一看,很難從這六門課程的測試得分來評價這50名學(xué)生的成績優(yōu)劣,也很難分析這些學(xué)生的成績分布特征。要解決這樣的問題,自然希望能把這一數(shù)據(jù)中包含的六個變量概括成一兩個綜合變量。那么這一做法是否可行呢?提煉出來的少數(shù)變量能夠代表原數(shù)據(jù)的多少信息?如何解釋它們呢?我們首先來了解一下主成分分析的基本思想。對于例8.1中的數(shù)據(jù),每一個學(xué)生的觀測值都包含了六個變量,所以表示在坐標系中每一個觀測值就是六維空間中的一個點,每一維就代表一個變量。把六個變量概括成一兩個綜合變量,實質(zhì)上就是一個降維的過程。主成分分析的基本思想是什么?
表8-1北京市某高中學(xué)生六門課程測試成績數(shù)據(jù)*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量對于存在線性相關(guān)的兩個變量,直接進行分析可能由于多重共線性而無法得出正確結(jié)論。如何對這兩個變量所攜帶的信息(在統(tǒng)計上信息往往是指數(shù)據(jù)的變異)進行濃縮處理?分別用橫軸和縱軸表示兩個變量,每個觀測值就是二維坐標系中的一個點,所有的數(shù)據(jù)點大致散布成一個橢圓形,那么這個橢圓有一個長軸和一個短軸,我們稱之為主軸,主軸之間是相互垂直的。主成分分析的基本思想是什么?
(以兩個變量為例)顯然,短軸方向上,數(shù)據(jù)點之間的差異較?。婚L軸方向上,數(shù)據(jù)變化則較大。如果原坐標系中的橫軸和縱軸能夠分別與橢圓的長短軸平行,那么相對來說,長軸所代表的變量就描述了數(shù)據(jù)的主要變化,短軸所代表的變量則描述了數(shù)據(jù)的次要變化。*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量現(xiàn)在沿橢圓的長軸設(shè)定一個新的坐標系,則新產(chǎn)生的兩個變量和原始變量之間存在明顯的數(shù)學(xué)換算關(guān)系。但這兩個變量彼此不相關(guān),且信息量的分布顯然不同。長軸變量攜帶了大部分數(shù)據(jù)變異的信息,而短軸變量只攜帶了一小部分變異信息。橢圓的長軸和短軸相差越大時,說明長軸方向所代表的變量包含原始信息越多,那么用這個新變量來代替原始的兩個變量(即忽略包含少數(shù)信息的短軸變量)也就越合理,從而二維數(shù)據(jù)就可以降低為一維數(shù)據(jù)。但現(xiàn)實數(shù)據(jù)往往并不滿足這樣的條件,這就需要把原始數(shù)據(jù)構(gòu)成的坐標系進行旋轉(zhuǎn),產(chǎn)生一個新的坐標系,使得新坐標系的橫軸和縱軸與橢圓的長短軸平行,實質(zhì)上也就是把原數(shù)據(jù)中的兩個變量變換成兩個新的變量。主成分分析的基本思想是什么?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量主成分分析的基本思想就是把原始數(shù)據(jù)構(gòu)成的橢圓的主軸找出來,再用代表絕大部分信息的那個軸(也就是長軸)作為代替原始變量的新變量。多維變量降維過程類似。只要把原始數(shù)據(jù)散布的高維橢球的各個主軸找出來,選擇最長的幾個軸作為新變量,主成分分析就基本完成了。作為橢圓(或橢球)的主軸,它們之間是相互垂直的,在代數(shù)上,這些新變量是原始變量的線性組合,叫作主成分(principalcomponent)。原始數(shù)據(jù)中有幾個變量,它們構(gòu)成的橢球就有幾個主軸,也就意味著最終可以找到幾個主成分。主成分分析的基本思想是什么?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量降維的目的,是選擇越少的主成分來代表原先的變量效果越好。根據(jù)主成分分析的思想,選擇的標準則是要求被選中的主成分所對應(yīng)的主軸的長度之和能夠占所有主軸長度總和的大部分。至于占到多少才足夠具有代表性,并沒有一個硬性的說法。在實際中,如果數(shù)據(jù)中包含的變量之間相關(guān)性很差,降維也就很難實現(xiàn),因為不相關(guān)的變量顯然無法找到一個很好的共同的代表。所以具體選幾個主成分,要視實際情況而定。有些文獻建議,所選的主軸總長度占所有主軸長度之和的大約85%即可,其實,這只是一個大體的說法,具體選幾個,要看實際情況而定。主成分分析的基本思想是什么?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量數(shù)學(xué)上的處理是將p個指標作線性組合,作為新的綜合指標。如果第一個線性組合,即第一個綜合指標記為F1。自然希望F1中更多地反映原來指標的信息。這里的“信息”是用F1的方差Var(F1)來表示。Var(F1)越大,表示F1包含的信息越多。在所有的線性組合中,所選的第1個主成分應(yīng)該是方差最大的。如果第1個主成分不足以代表原來p個指標的信息,再考慮選擇第2個線性組合,即第2個主成分F2。依此類推,可以選出第3個,第4個,…,第p個主成分。這些主成分間互不相關(guān),且方差遞減。主成分分析的數(shù)學(xué)模型*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量對原來的p個指標進行標準化,以消除變量在水平和量綱上的影響。根據(jù)標準化后的數(shù)據(jù)矩陣求出協(xié)方差矩陣求出協(xié)方差矩陣的特征根和特征向量確定主成分,并對各主成分所包含的信息給予適當?shù)慕忉?。主成分分析的步驟*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量8.1.2如何選擇主成分?8.1主成分分析*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量用SPSS實現(xiàn)主成分分析第1步:選擇【分析】下拉菜單,并選擇【降維-因子分析】選項進入主對話框;第2步:在主對話框中將原始數(shù)據(jù)中的所有變量選入【變量】;第3步:點擊【抽取】,在【輸出】下選擇【碎石圖】,點擊【繼續(xù)】回到主對話框;第4步:點擊【旋轉(zhuǎn)】,在【輸出】下選擇【載荷圖】,點擊【繼續(xù)】回到主對話框,點擊【確定】。
用SPSS對例8.1實現(xiàn)主成分分析*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量如何選擇主成分?解:例8.1中的數(shù)據(jù)主成分分析的SPSS輸出結(jié)果如下表解釋的總方差成份初始特征值提取平方和載入合計方差的%累積%合計方差的%累積%13.72962.14662.1463.72962.14662.14621.20620.09682.2421.20620.09682.2423.4036.72488.9664.3255.41494.3805.2043.39597.7756.1342.225100.000提取方法:主成份分析。*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量表中的“初始特征根”對應(yīng)的就是關(guān)于主成分的信息?!俺跏继卣鞲毕旅娴牡谝涣小昂嫌嫛奔丛紨?shù)據(jù)構(gòu)成的高維橢球的六個主軸的長度,數(shù)學(xué)上又稱之為特征值。特征根可以看作是主成分影響力度的指標,代表引入該主成分后可以解釋平均原始變量的信息。如果特征根小于1,說明該主成分的解釋力度還不如直接引入一個原始變量的平均解釋力度大。因此可以用特征根大于1作為納入標準。第二列“方差的%”則是每個主軸長度占所有主軸長度總和(也就是所有特征值的總和,又叫總方差)的百分比。表明該主成分的方差占全部總方差的比重(也稱為主成分的方差貢獻率)。第三列“方差%”分別對應(yīng)的就是由大到小排列的前若干個主軸長度之和占所有主軸長度總和的累積百分比(累計貢獻率)。如何選擇主成分?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量最長的主軸(即第一主成分)長度為3.729,它占六個主軸長度總和的62.164%;第二長的主軸(即第二主成分)長度為1.206,占所有主軸長度總和的20.096%。二者的長度之和累積起來則占到了所有主軸長度總和的82.242%。后面四個主軸的長度在所有主軸長度總和中所占的比例相對較小,從而對代表原先六個變量的貢獻越來越少。因此在這里我們采用SPSS輸出結(jié)果中所建議的(表中最右側(cè)三列),對例8.1的數(shù)據(jù)選擇頭兩個主成分。如何選擇主成分?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量SPSS還提供了一個更為直觀的圖形工具來幫助選擇主成分,即碎石圖(ScreePlot)從碎石圖中可以直觀的看到例8.1中六個主軸長度變化的趨勢。實踐中,通常結(jié)合具體情況,選擇碎石圖中變化趨勢出現(xiàn)拐點的前幾個主成分作為原先變量的代表,在該例中選擇前兩個主成分即可。如何選擇主成分?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量8.1.3怎樣解釋主成分?8.1主成分分析*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量尋找主成分的過程實質(zhì)上就是尋找橢球主軸的過程,而這些主軸所代表的新變量在代數(shù)上是原始變量的線性組合(坐標旋轉(zhuǎn))。SPSS同樣可以自動輸出關(guān)于這些組合的計算結(jié)果。下表即例8.1的主成分載荷矩陣。怎樣解釋主成分?成份矩陣a成份12數(shù)學(xué)-.778.430物理-.580.682化學(xué)-.784.318語文.893.312歷史.826.406英語.833.438提取方法:主成份。a.已提取了2個成份。*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量輸出結(jié)果“成分矩陣”中的每一列分別給出了所選擇的每一個主成分作為原始變量線性組合的系數(shù)。如果我們分別用表示原始數(shù)據(jù)中的六門課程成績,而用表示六個主成分,那么根據(jù)表中給出的結(jié)果,我們選擇的頭兩個主成分與原先六個變量的關(guān)系如下:怎樣解釋主成分?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量主成分對應(yīng)原始變量的每一個系數(shù)實質(zhì)上就是主成分與原先每一個變量之間的線性相關(guān)系數(shù),稱為主成分載荷(Loading)。理論上而言,相關(guān)系數(shù)(絕對值)越大,說明主成分與該變量之間的線性相關(guān)關(guān)系越強,從而主成分對該變量的代表性也就越大。例8.1中提取的第一主成分與原先六個變量之間的相關(guān)系數(shù)都較大(與“物理”的相關(guān)系數(shù)相對偏低),說明它可以充分的解釋原先的所有變量。而第二主成分只與原始數(shù)據(jù)中的“物理”有較大的相關(guān)關(guān)系,與其他變量的相關(guān)系數(shù)均較小,這可能是由于“物理”這門課程與其他課程性質(zhì)上較大的區(qū)別所導(dǎo)致的。
怎樣解釋主成分?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量對于提取兩個主成分的情形,SPSS還提供了一張二維圖來直觀顯示它們對原始變量的解釋情況圖中把原先的每一個變量與提取的兩個主成分之間的相關(guān)系數(shù)分別作為坐標系中兩個方向的坐標值,這樣每一個變量對應(yīng)的主成分載荷就對應(yīng)坐標系中的一個點,因此人們把這種圖形稱為載荷圖(LoadingPlot)怎樣解釋主成分?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量實際中,主成分分析的一個重要應(yīng)用則在于利用主成分與原始變量之間的線性關(guān)系,可以根據(jù)每一個觀測對象各個變量的原始取值,計算出其所對應(yīng)的各個主成分的值。這樣便可以按照少數(shù)幾個主成分的數(shù)值,簡單明了的分析研究對象的狀況,從而解決對包含多個復(fù)雜變量的數(shù)據(jù)進行排序、評價等問題。比如例8.1,我們就可以把每個學(xué)生的六門課程測試成績的數(shù)據(jù)轉(zhuǎn)換成兩個主成分的值,然后再按照它們的大小對各個學(xué)生的成績進行比較。怎樣解釋主成分?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量案例分析
中國上市公司財務(wù)績效綜合評價1、案例背景上市公司的財務(wù)績效是指上市公司在一定期間的盈利能力、資產(chǎn)質(zhì)量、經(jīng)營增長等方面的有關(guān)信息。了解了不同上市公司的財務(wù)績效,有利于投資者等信息使用者據(jù)以評價企業(yè)盈利能力、預(yù)測企業(yè)成長潛力、進而做出更加準確的相關(guān)經(jīng)濟決策。*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量案例分析2、案例分析指標設(shè)定與數(shù)據(jù)來源(1)指標設(shè)定??冃гu價要依靠財務(wù)指標,而財務(wù)指標企業(yè)總結(jié)和評價財務(wù)狀況和經(jīng)營成果的相對指標。因此我們選擇了對于上市公司來說具有意義的指標:每股收益(x1)、每股營業(yè)利潤(x2)、每股息稅前利潤(x3)、每股未分配利潤(x4)、資產(chǎn)報酬率(x5)和資產(chǎn)凈利率(x6)\銷售凈利率(x7)、營業(yè)利潤率(x8);成本費用率(x9)
(2)案例數(shù)據(jù)*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量案例分析3、案例擬解決的問題試建立上市公司經(jīng)營績效評價模型,并對選取的樣本上市公司進行財務(wù)績效。4、案例分析要求通過本案例,使學(xué)生掌握以下內(nèi)容:(1)主成分的基本思想。(2)主成分在實際應(yīng)用中的主要作用。(3)由協(xié)方差矩陣和相關(guān)矩陣求主成分有什么不同。(4)能夠用SPSS軟件進行主成分分析。(5)理解主成分命名的依據(jù)。*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量8.2因子分析8.2.1什么是因子分析?8.2.2怎樣解釋因子分析結(jié)果?8.2.3幾點說明第8章用少數(shù)變量代表多個變量*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量8.2.1什么是因子分析?8.2因子分析*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量因子分析和主成分分析有很多相似之處,它們的目的是一致的,都是要將具有一定關(guān)聯(lián)的多個變量進行高度概括,尋找合適的少數(shù)變量來代表原先的所有變量。尤其在計算機上實現(xiàn)時,兩種方法所要耗費的時間并沒有太大差異,除了可能有一兩個選項不同之外,它們的輸出結(jié)果所包含的內(nèi)容十分類似。因此,人們往往對二者不加區(qū)分。實質(zhì)上,主成分分析可以看作是因子分析的一個特例,因子分析是主成分分析的推廣和發(fā)展,二者最直觀的區(qū)別就在于變量和主成分/因子個數(shù)的一致性上。主成分分析的基本思想是要尋找高維橢球的所有主軸,因此,原始數(shù)據(jù)包含了多少個變量,就有多少個主成分,人們對于主成分的選擇是依據(jù)最終的分析結(jié)果來確定的。而因子分析則需要事先確定要找?guī)讉€成分,也就是所謂的因子(Factor),因子個數(shù)從一開始可能就遠少于原始變量的個數(shù)。
什么是因子分析?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量因子分析是由CharlesSpearman在1904年提出的,他被公認為因子分析之父。因子分析在某種程度上可以被看成是主成分分析的推廣和擴展。因子分析對問題的研究更深入,它是將具有錯綜復(fù)雜關(guān)系的變量綜合為少數(shù)的幾個因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系,探討多個能夠直接測量、并具有一定相關(guān)性的實測指標是如何受少數(shù)幾個獨立因子所支配的,同時根據(jù)不同因子還可以對變量進行分類。因子分析是多元統(tǒng)計中處理降維的一種統(tǒng)計方法。什么是因子分析?
(FactorAnalysis)*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量原始變量和因子個數(shù)的不一致,使得不僅在數(shù)學(xué)模型上,而且在實際求解過程中,因子分析和主成分分析都有著一定的區(qū)別,計算上因子分析更為復(fù)雜。因子分析可能存在的一個優(yōu)點是:在對主成分和原始變量之間的關(guān)系進行描述時,如果主成分的直觀意義比較模糊不易解釋,主成分分析沒有更好的改進方法;因子分析則額外提供了“因子旋轉(zhuǎn)(factorrotation)”這樣一個步驟,可以使分析結(jié)果盡可能達到易于解釋且更為合理的目的。什么是因子分析?
(FactorAnalysis)*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量8.2.2怎樣解釋因子分析結(jié)果?8.2因子分析*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量用SPSS實現(xiàn)因子分析第1步:選擇【分析】下拉菜單,并選擇【降維-因子分析】選項進入主對話框;第2步:在主對話框中將原始數(shù)據(jù)中的所有變量選入【變量】;第3步:點擊【抽取】,在【方法】下選擇一種方法,在【輸出】下選擇【碎石圖】,在【抽取】下可以選擇按照特征值大小選因子,也可以選定因子的個數(shù),點擊【繼續(xù)】回到主對話框;第4步:點擊【旋轉(zhuǎn)】,在【方法】下選擇一種旋轉(zhuǎn)方法,在【輸出】下選擇【旋轉(zhuǎn)解】和【載荷圖】,點擊【繼續(xù)】回到主對話框;第5步:點擊【得分】,并選擇【輸出因子得分系數(shù)矩陣
】,點擊【確定】
用SPSS對例8.1實現(xiàn)因子分析*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量Principalcomponents(主成分法):這是默認選項(多數(shù)情況下不用更改)。通過主成分分析的思想提取公因子,它假設(shè)變量是因子的線性組合。UnweightLeastSquare(不加權(quán)最小平方法):該方法使實際的相關(guān)矩陣和再生的相關(guān)矩陣之差的平方和達到最小。GeneralizedLeastSquare(加權(quán)最小平方法):用變量值進行加權(quán),該方法也是使實際的相關(guān)矩陣和再生的相關(guān)矩陣之差的平方和達到最小。MaximumLikelihood(最大似然法):該方法不要求數(shù)據(jù)服從正態(tài)分布,在樣本量較大時使用較好。PrincipalAxisFactoring(主軸因子法):該方法從原始變量的相關(guān)性出發(fā),使得變量間的相關(guān)程度盡可能地被公因子解釋。提取公因子的方法
(SPSS)*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量SPSS提供5種旋轉(zhuǎn)方法,其中最常用的是Varimax(方差最大正交旋轉(zhuǎn))和Promax。Varimax(方差最大正交旋轉(zhuǎn)):這是最常用的旋轉(zhuǎn)方法。使各因子保持正交狀態(tài),但盡量使各因子的方差達到最大,即相對的載荷平方和達到最大,從而方便對因子的解釋。Quartimax(四次方最大正交旋轉(zhuǎn)):該方法傾向于減少和每個變量有關(guān)的因子數(shù),從而簡化對原變量的解釋。Equamax(平方最大正交旋轉(zhuǎn)):該方法介于方差最大正交旋轉(zhuǎn)和四次方最大正交旋轉(zhuǎn)之間。DirectOblimin(斜交旋轉(zhuǎn)):該方法需要事先指定一個因子映像的自相關(guān)范圍。Promax:該方法在方差最大正交旋轉(zhuǎn)的基礎(chǔ)上進行斜交旋轉(zhuǎn)因子旋轉(zhuǎn)的方法
(SPSS)*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量例8.1數(shù)據(jù)的因子分析。在SPSS中,因子分析與主成分分析類似,也可以根據(jù)各個特征值的大小來選擇因子,也可以繪制直觀的碎石圖來幫助判斷,標準也是類似的。不同的是,因子分析可以通過“因子旋轉(zhuǎn)”這一步驟得到下表的旋轉(zhuǎn)后的因子載荷矩陣。怎樣解釋因子分析結(jié)果?旋轉(zhuǎn)成份矩陣a
成份12
數(shù)學(xué)-.341.821
物理-.028.895
化學(xué)-.415.737
語文.893-.312
歷史.899-.196
英語.924-.176
提取方法:主成份。旋轉(zhuǎn)法:具有Kaiser標準化的正交旋轉(zhuǎn)法。
a.旋轉(zhuǎn)在3次迭代后收斂。
*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量在上表的輸出結(jié)果中,每一個數(shù)值同樣代表了所選擇的因子和原先的每一個變量之間的相關(guān)系數(shù),因此稱之為因子載荷(factorloading)。這個表也就描述了原先的六個變量與兩個因子的關(guān)系,但有所不同的是,具體的關(guān)系表達式改變了。仍以表示原始數(shù)據(jù)中的六門課程成績,而用表示兩個因子,根據(jù)上面的輸出結(jié)果,因子和這些原始變量之間的關(guān)系為:
怎樣解釋因子分析結(jié)果?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量這里因子寫在了方程的右邊,而原始變量寫在了方程的左邊,與主成分分析中主成分載荷矩陣給出的表達式恰好相反。但兩種分析方法下得到的系數(shù)均是各個成分(因子)與各個原始變量之間的線性相關(guān)系數(shù),所以系數(shù)的絕對值大小都說明了成分(因子)對原始變量的解釋程度。因子分析得到的兩個因子的旋轉(zhuǎn)后因子載荷表現(xiàn)出了較為明顯的特征。第一個因子和“語文”、“歷史”、“英語”三門課程成績相關(guān)關(guān)系最強,且均為正值,與其他三門課程成績的關(guān)系較弱;第二個因子則恰好相反,它與“數(shù)學(xué)”、“物理”、“化學(xué)”三門課程成績的相關(guān)關(guān)系最強,也均為正值。
相對于前面的主成分分析,這樣的結(jié)果似乎能夠使人們更容易結(jié)合實際,對兩個因子的直觀意義進行合理說明,即可以給第一個因子取名為“文科因子”,第二個因子取名為“理科因子”。
怎樣解釋因子分析結(jié)果?*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量該矩陣給出了每個因子作為所有原始變量線性組合的系數(shù)。根據(jù)這些系數(shù)便可以計算每個學(xué)生對應(yīng)的第一個因子和第二個因子的取值,我們把它們稱為因子得分(factorscore)。有了因子得分,我們就可以對每個學(xué)生分別按照“文科因子”水平和“理科因子”水平進行評價和排序。
怎樣解釋因子分析結(jié)果?成份得分系數(shù)矩陣
成份
12數(shù)學(xué).059.409
物理.231.539
化學(xué).000.337
語文.349.054
歷史.383.126
英語.401.145
提取方法:主成份。旋轉(zhuǎn)法:具有Kaiser標準化的正交旋轉(zhuǎn)法。構(gòu)成得分。
*《應(yīng)用統(tǒng)計學(xué)》第8章用少數(shù)變量代表多個變量樣本量要足夠大。一般而言,要求樣本量至少是原始變量總數(shù)的5倍以上。如果要得到比較理想的結(jié)果,則應(yīng)該在10倍以上。此外,樣本總量也應(yīng)足夠大,理論
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大雪節(jié)氣科普
- 詞匯量的力量
- 進入團圓的申請書
- 全國導(dǎo)游基礎(chǔ)知識-2022全國導(dǎo)游科目五現(xiàn)場面試真題及答案
- 初級公司信貸-初級銀行從業(yè)資格考試《公司信貸》點睛提分卷1
- 2025年捆鈔機項目效益評估報告
- 企業(yè)內(nèi)部API文檔編寫指南
- 土地證申請書范文
- 醫(yī)學(xué)影像三基三嚴試題
- DB2113-T 0011-2024 地理標志產(chǎn)品 三十家子鱗棒蔥
- 持續(xù)質(zhì)量改進項目匯報
- 2024版買賣二手車合同范本
- 阻燃更要消煙一文讓你掌握無煙阻燃改性技術(shù)的方方面面
- 第15課 列強入侵與中國人民的反抗斗爭 教學(xué)設(shè)計-2023-2024學(xué)年中職高一上學(xué)期高教版(2023)中國歷史全一冊
- 2023年人教版七年級歷史下冊《全冊課件》
- 新大象版科學(xué)三年級下冊全冊知識點 (復(fù)習(xí)用)
- 2024年黑龍江省專升本考試生理學(xué)護理學(xué)專業(yè)測試題含解析
- 建筑設(shè)計工程設(shè)計方案
- 供熱行業(yè)環(huán)境保護管理辦法
- (2024年)氣胸完整課件
- 2023年部編版高中語文必修上冊古詩詞誦讀
評論
0/150
提交評論