利用spss對某個班成績的多元統(tǒng)計分析_第1頁
利用spss對某個班成績的多元統(tǒng)計分析_第2頁
利用spss對某個班成績的多元統(tǒng)計分析_第3頁
利用spss對某個班成績的多元統(tǒng)計分析_第4頁
利用spss對某個班成績的多元統(tǒng)計分析_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

.判別分析的概述3.1判別分析的基本思想判別分析是用于判斷個體所屬類別的一種統(tǒng)計方法。根據(jù)已知觀測對象的分類和若干表明觀測對象特征的變量值,建立判別函數(shù)和判別準則,并使其錯判率最小,對于一個未知分類的樣本,將所測指標代入判別方程,從而判斷它來自哪個總體。當(dāng)然,這種準則在某種意義上是最優(yōu)的,如錯判概率最小或錯判損失最小等。其前提是總體均值有顯著差異,否則錯分率大,判別分析無意義。3.2判別分析與聚類分析的關(guān)系區(qū)別:判別分析是在研究對象分類已知的情況下,根據(jù)樣本數(shù)據(jù)推導(dǎo)出一個或一組判別函數(shù),同時指定一種判別準則,用于確定待判樣品的所屬類別,使錯判率最小。聚類分析預(yù)先不知道分類,它要解決的問題,正是對給定的未知分類的樣品進行分類,它是一種純統(tǒng)計技術(shù),只要有多指標存在,就能根據(jù)各觀測的變量值近似程度排序,只是描述性的統(tǒng)計,而判別分析能對未知分類觀測判別分類,帶有預(yù)測性質(zhì)。聯(lián)系:兩者都是研究分類問題,兩種方法往往聯(lián)合起來使用。樣品聚類是進行判別分析之前的必要工作,根據(jù)樣品聚類的結(jié)果進行判別分析。4.在SPSS軟件上的操作步驟4.1對應(yīng)分析的操作步驟(1)打開SPSS文件,在表格下方有兩個選項,分別是數(shù)據(jù)試圖和變量視圖,點擊變量視圖選項,在前三行分別輸入“學(xué)號”、“科目”、“成績”,其中學(xué)號與科目的值項需要做如下設(shè)置:在彈出的值標簽對話框里,在值這一項里輸入“1”,標簽輸入“1”,再點擊“添加”按鈕,依次添加到40為止,在科目的值標簽對話框內(nèi),在值這一項中輸入“1”,標簽輸入“語文”,點擊“添加”按鈕,再依次添加“2”對應(yīng)標簽為“數(shù)學(xué)”,“3”對應(yīng)標簽為“外語”,“4”對應(yīng)標簽為“體育”,綜上分別完成對1號至40號學(xué)號以及4項科目進行數(shù)字的賦值。然后點擊數(shù)據(jù)視圖進行數(shù)據(jù)輸入,數(shù)據(jù)輸入按照成績單輸入(成績單見附錄),如:第一行第一列輸入“1”,第二列輸入“1”,第三列輸入“82”,第二行第一列輸入“2”,第二列輸入“1”,第三列輸入“81”,以此類推,共輸入160行數(shù)據(jù)。在SPSS的數(shù)據(jù)視圖中輸入數(shù)據(jù)后,再依次點選數(shù)據(jù)→加權(quán)個案,進入加權(quán)個案的對話框,系統(tǒng)默認是對觀測值不使用權(quán)重,選中加權(quán)個案選項,此時下面的頻率變量被激活,選中成績并點擊箭頭,使變量成績充當(dāng)權(quán)數(shù)的作用,點擊確定。(2)數(shù)據(jù)輸入完成后,選擇分析→降維→對應(yīng)分析,然后把“學(xué)號”選入“行”,再點擊“定義范圍…”來定義范圍為1(最小數(shù)值)到40(最大數(shù)值),之后點擊更新,再點擊繼續(xù)。之后同樣地,把“科目”選入“列”,并定義其范圍為1~4。然后點選“模型”,在出現(xiàn)的對話框中選擇數(shù)據(jù)標準化方法,本次分析距離度量點選Eucliden,下面的標準化方法選擇選項被激活,有5種可供選擇的數(shù)據(jù)標準化方法,本次分析選擇第5種:使列總和相等,刪除均值,其余選項為默認,點擊確定運行。(3)圖表編輯:根據(jù)SPSS對數(shù)據(jù)的計算,會得到一系列的表格,對對后一張疊加散點圖進行部分操作,雙擊疊加散點圖會彈出一個圖表編輯器,點擊“向X軸添加參考線”又會彈出一個屬性對話框,把位置坐標改為0,關(guān)閉對話框,點擊“向Y軸添加參考線”,同上步驟將位置坐標改為0,關(guān)閉圖表編輯器,此時疊加散點圖被分為4各區(qū)域,方便于接下來的結(jié)果分析。4.2聚類分析與判別分析的操作步驟1.再次打開SPSS文件,點擊變量視圖選項,在前七行分別輸入“學(xué)號”、“語文”、“數(shù)學(xué)”、“外語”、“體育”、“總分”、“概況”,其中概況的值項需要做如下設(shè)置:在彈出的值標簽對話框里,在值這一項里輸入“1”,標簽輸入“優(yōu)”,再點擊“添加”按鈕,依次添加“2”對應(yīng)標簽為“良”,“3”對應(yīng)標簽為“及格”,“4”對應(yīng)標簽為“不及格”,綜上分別完成對4種概況進行數(shù)字的賦值。然后同樣點擊數(shù)據(jù)視圖進行數(shù)據(jù)輸入,數(shù)據(jù)輸入依然按照成績單輸入(成績單見附錄)。2.數(shù)據(jù)輸入完成后,選擇分析→分類→系統(tǒng)聚類,然后把“語文”、“數(shù)學(xué)”、“外語”、“體育”選入變量中,然后點擊“繪圖”,在出現(xiàn)的對話框中勾選譜系圖,其余選項為默認,點擊繼續(xù),確定運行。3.再次選擇分析→分類→判別,然后把“概況”選入分組變量中,再點擊“定義范圍…”來定義范圍為1(最小數(shù)值)到4(最大數(shù)值),然后將“語文”、“數(shù)學(xué)”、“外語”、“體育”選入自變量中,然后點擊“Statistics…”,在出現(xiàn)的對話框中勾選平均值與Fisher’s,其余選項為默認,點擊繼續(xù),確定運行。5.結(jié)果分析5.1對應(yīng)表表5.1對應(yīng)表學(xué)號科目語文數(shù)學(xué)外語體育有效邊際182.000120.00071.00095.000368.000281.000119.00077.00090.000367.000383.000115.00069.00091.500358.500472.000115.00075.00095.000357.000輸出的第一部分對應(yīng)表是由原始數(shù)據(jù)學(xué)號與科目分類的列聯(lián)表,可以看出觀測總數(shù)n=40,說明原始數(shù)據(jù)中沒有記錄缺失,有效邊際為行列數(shù)的總和。5.2匯總匯總維數(shù)慣量比例置信奇異值相關(guān)奇異值慣量解釋累積標準差21.075.006.548.548.002-.0412.052.003.264.813.0023.044.002.1871.000總計.0101.0001.000表5.2第二部分匯總表給出了總慣量以及每一維度所揭示的總慣量的百分比的信息??芍倯T量為0.01,卡方值為0.4,有關(guān)系式:總慣量=卡方值*觀測總數(shù)(0.4=0.01*40),由此可以清楚地看到總慣量與卡方值的關(guān)系,同時說明總慣量描述了列聯(lián)表行與列之間總的相關(guān)關(guān)系。奇異值所反映的是行與列個狀態(tài)在二維圖中分值的相關(guān)程度,實際上是對行與列進行因子分析產(chǎn)生的新的綜合變量的典型相關(guān)系數(shù),其在取值上等于特征值的平方根。慣量比例部分是各維度分別解釋總慣量的比例及累計百分比,從表中可以看出第一維和第二維的慣量比例占總慣量的81.3%,因此可以選取兩維來進行分析。5.3概述行點和概述列點表5.3概述行點a學(xué)號維中的得分貢獻點對維慣量維對點慣量質(zhì)量12慣量1212總計1.025.242-.385.000.020.071.348.611.9592.025.403-.322.000.054.050.659.293.9523.025.168-.301.000.009.044.259.575.8354.025.341-.172.000.039.014.767.136.903表5.4概述列點a科目維中的得分貢獻點對維慣量維對點慣量質(zhì)量12慣量1212總計語文.250.000-.143.002.000.099.000.135.135數(shù)學(xué).250.082-.427.003.022.880.047.887.934外語.250.540.065.005.975.021.989.010.999體育.250.029-.013.000.003.001.039.006.045有效總計1.000.0101.0001.000第三部分是對列聯(lián)表行與列個狀態(tài)有關(guān)信息的概括(概述行點只截取了部分數(shù)據(jù))。其中,質(zhì)量部分分別指列聯(lián)表中行與列的邊緣概率。維中的得分是各維度的分值,指行列各狀態(tài)在二維圖中的坐標值。如語文坐標為(-0.00,-0.143)。慣量是每一行(列)與其重心的加權(quán)距離的平方,可以看出I=J=0.01,即行剖面的總慣量等與列剖面的總慣量。貢獻部分是指行(列)的每一狀態(tài)對每一維度(公共因子)特征值的貢獻及每一維度對行(列)各個狀態(tài)的特征值等貢獻。如第一維度中,外語對應(yīng)的數(shù)值最大,為0.975,說明外語這一狀態(tài)對第一維度的貢獻最大。5.4疊加散點圖圖5.1由以上兩張坐標表可以得出如下的疊加散點圖,也是輸出的最后一部分,是學(xué)號各狀態(tài)與科目各狀態(tài)同時在一張二維圖上的投影。在圖上既可以看到每一變量內(nèi)部各狀態(tài)之間的相關(guān)關(guān)系,又可以同時考察兩變量之間的相關(guān)關(guān)系。在同一變量內(nèi)部,在各學(xué)科間,體育與各狀態(tài)之間距離相近,而外語可以單獨歸為一類,對于語文,各學(xué)號之間的距離均很近,語文與體育距離比較相近,則可以將體育和語文歸為一類,外語分為一類,數(shù)學(xué)分為一類,很明顯的形成了三大類。同時考察兩變量各狀態(tài),可以看出這個班的同學(xué)的成績語文與體育偏好,周圍的學(xué)號也較為集中,分數(shù)比較接近,也就是說這個班語文成績與體育成績沒有特別顯著的特點。學(xué)號7與學(xué)號36離數(shù)學(xué)較遠,說明他與數(shù)學(xué)的相關(guān)性越小,學(xué)號28、學(xué)號26與學(xué)號35離外語較遠,說明他與位于的相關(guān)性越小,換言之,他們該科成績較低。而再觀察學(xué)號較為集中的區(qū)域內(nèi),也說明大部分學(xué)號都與體育和語文的相關(guān)性較大。再從每個學(xué)號出發(fā),如1號距離外語的距離相對于它距離其他三個科目而言是較遠的,所以1號要加強對外語的練習(xí),2號和1號的不同在于它離外語的距離接近它離數(shù)學(xué)的距離,也就是說2號在加強外語練習(xí)的同時還要兼顧著對語文的練習(xí)。以上是由SPSS默認設(shè)置得到的結(jié)果。實際研究中,可以采用創(chuàng)新思維,根據(jù)不同的研究目的對散點圖進行研究。運用向量分析了解學(xué)科偏好排序。我們可以從中心向任意點連線作向量,例如從中心向語文做向量,然后讓所有的學(xué)號往這條向量及延長線上作垂線,垂點越靠近向量正向的表示越偏好這種學(xué)科。即偏好語文的學(xué)生學(xué)號依次是9號、1號、2號、3號等等。依次類推,也可以從中心往所有的學(xué)號作向量,得到每一個學(xué)生在選擇4學(xué)科上的偏好排名,如28號的偏科情況為數(shù)學(xué)、語文、體育、外語。接著,我們可以從向量夾角的角度看不同學(xué)科或不同學(xué)生之間的相似情況,從余弦定理的角度看相似性。從圖上我們可以看出,當(dāng)我們從中心向任意兩個學(xué)號(相同類別)做向量的時候,夾角是銳角的話表示兩個學(xué)生具有相似性,銳角越小越相似。也就是說,2號和5號是相似成績,當(dāng)然也是競爭者,也具有替代性;我們也看出數(shù)學(xué)與外語就有非常大的差異了。因為如果作向量他們是幾乎是直角了。5.5樹狀圖圖5.25.6特征值表5.5特徵值函數(shù)特徵值變異的%累加%典型相關(guān)性110.291a99.399.3.9552.057a.699.9.2333.010a.1100.0.100a.前3個典型區(qū)別函數(shù)用於分析。第六部分反映了判別函數(shù)的特征根,解釋方差的比例和典型相關(guān)系數(shù),第一判別函數(shù)解釋了99.3%的方差,第二判別函數(shù)解釋了0.6%的方差,第三判別函數(shù)解釋了0.1%的方差。5.7顯著性檢驗表5.6Wilks'Lambda(λ)函數(shù)的檢定Wilks'Lambda(λ)卡方df顯著性1至3.08387.14212.0002至3.9362.3026.8903.990.3522.839第七部分是對三個判別函數(shù)的顯著性檢驗,看出第一判別函數(shù)在0.05的顯著性水平上是顯著的,第二與第三判別函數(shù)不顯著。5.8標準化典型判別式函數(shù)系數(shù)表5.7標準化典型區(qū)別函數(shù)係數(shù)函數(shù)123語文.903.134.539數(shù)學(xué)1.387-.246-.578外語1.463-.268.392體育.772.947.024第八部分可以看出判別系數(shù)表示為:5.9結(jié)構(gòu)矩陣表5.8結(jié)構(gòu)矩陣函數(shù)123體育.142.952*-.126數(shù)學(xué).282-.218-.879*外語.288-.226.604*語文.086-.113.479*區(qū)別變數(shù)與標準化典型區(qū)別函數(shù)之間的聯(lián)合組內(nèi)相關(guān)性依函數(shù)內(nèi)相關(guān)性絕對大小排序的變數(shù)。*.每一個變數(shù)與任何區(qū)別函數(shù)之間最大的絕對相關(guān)性第九部分是結(jié)構(gòu)矩陣,即判別載荷,由權(quán)重和判別載荷可以看出,外語對判別函數(shù)1與判別函數(shù)3的貢獻較大,體育對判別函數(shù)2的貢獻較大。5.10群組重心的函數(shù)表5.9群組重心的函數(shù)概況函數(shù)123優(yōu)4.568-.216.119良1.191.064-.101及格-2.343.244.090不及格-5.289-.450-.021以群組平均值求值的非標準化典型區(qū)別函數(shù)第十部分是反應(yīng)判別函數(shù)在各組的重心,根據(jù)結(jié)果,判別函數(shù)在y=1這一組的重心為(4.568,-0.216,0.119),在y=2這一組的重心為(1.191,0.064,-0.101),在y=3這一組的重心為(-2.343,0.244,0.09),在y=4這一組的重心為(-5.289,-0.45,-0.021),這樣我們就可以根據(jù)每個觀測的判別Z得分對觀測進行分類。5.11分類函數(shù)系數(shù)表5.10分類函數(shù)係數(shù)概況優(yōu)良及格不及格語文10.3769.9109.4549.036數(shù)學(xué)10.2629.7029.0918.625外語11.95211.25810.5599.992體育20.59919.91719.17618.325(常數(shù))-2400.472-2190.839-1982.558-1799.533費歇(Fisher)線性區(qū)別函數(shù)第十一部分是每組的分類函數(shù)(區(qū)別于判別函數(shù)),也稱費歇現(xiàn)行判別函數(shù),由表中結(jié)果可以說明:y=1這一組的分類函數(shù)是y=2這一組的分類函數(shù)是y=3這一組的分類函數(shù)是y=4這一組的分類函數(shù)是可以計算出每個觀測在各組的分類函數(shù)值,然后將觀測分類到較大的分類函數(shù)值中。6.結(jié)論我們通過聯(lián)系所學(xué)的課程《多元統(tǒng)計分析》,用對應(yīng)分析、聚類分析、判別分析相結(jié)合解決實際問題,并發(fā)散思維,跳出書本,運用不同的方法解讀統(tǒng)計學(xué)的多元統(tǒng)計分析。在判別分析的結(jié)果中也可以看出17號,27號與39號同學(xué)與原始概況有所不同,17號成績概述為良,而判別分析后為及格,27號成績概述為及格,判別分析后為良,39號成績概述為及格,判別分析后為不及格,說明這三位同學(xué)的觀測值(即成績)處于判別分類的交界處,只要成績稍一提高就可以進入上一類別,也就是說老師的輔導(dǎo)重心不用放在這三位同學(xué)身上。從輸出結(jié)果中得出結(jié)論,這個班級的體育成績是最為平衡的,也體現(xiàn)出這個班學(xué)生的身體素質(zhì)是很好的,其次是這個班的語文成績也是相對平均的,但是也不難看出,外語與數(shù)學(xué)是這個班的軟肋。同時可以說明28號同學(xué)與7號同學(xué)是偏科最為嚴重的,另外35號同學(xué)和26號同學(xué)也比較偏科。從這個班目前的學(xué)習(xí)狀況來看,這個班體育成績應(yīng)當(dāng)繼續(xù)保持,擁有健康的體質(zhì)才是學(xué)習(xí)的前提條件,語文成績要從整體來提高,從整個班級入手,加強對學(xué)生平時的課程練習(xí),爭取下一次的考試成績能夠穩(wěn)定到90分以上,對于數(shù)學(xué)與外語科目,老師要多多的關(guān)注那些偏科的學(xué)生,例如外語老師就要多關(guān)注學(xué)號為28、26、35的這三位同學(xué),數(shù)學(xué)老師就要多關(guān)注學(xué)號為36、7的這兩位同學(xué),這樣補上他們的短板,對整個班級成績的影響也是非常重要的。我們本次課設(shè)將創(chuàng)新主要應(yīng)用在對應(yīng)分析這一方面,具體體現(xiàn)在散點圖分析中,之前只考慮了變量間點與點

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論