![多元統(tǒng)計分析(聚類分析,判別分析,對應(yīng)分析)_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/7/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f1.gif)
![多元統(tǒng)計分析(聚類分析,判別分析,對應(yīng)分析)_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/7/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f2.gif)
![多元統(tǒng)計分析(聚類分析,判別分析,對應(yīng)分析)_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/7/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f3.gif)
![多元統(tǒng)計分析(聚類分析,判別分析,對應(yīng)分析)_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/7/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f4.gif)
![多元統(tǒng)計分析(聚類分析,判別分析,對應(yīng)分析)_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/7/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f/b62d0dce-ee7b-4899-aee6-a4dc54d3e06f5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、組員:鄒俊逸,綜合創(chuàng)新思維訓(xùn)練與實踐,隨著社會競爭的越來越激烈,家長和老師對于學生成績的態(tài)度愈加重視,對于學生將來的發(fā)展與前途也同樣感到一絲憂慮,因此及時公布學生的學習成績并且能夠增其長補其短對于學生將會有很大的幫助。本文利用某所重點學校某個班的成績單來分析這個班學生成績的優(yōu)劣,以達到取長補短的目的,主要應(yīng)用了spss軟件對成績進行了綜合性的分析,前言,目 錄,聚類分析,定義 聚類分析是統(tǒng)計學中研究“物以類聚”問題的多元統(tǒng)計分析方法。聚類分析又稱群分析,它是研究對樣品或指標進行分類的一種多元統(tǒng)計方法。所謂的“類”,通俗地說就是相似元素的集合,聚類分析,基本步驟 (1)計算n個樣品兩兩間的距離,
2、得樣品間的距離矩陣 。類與類之間的距離本文應(yīng)用的是類平均法。所謂類平均法就是:兩類樣品兩兩之間平方距離的平均作為類之間的距離,即: 采用這種類間距離的聚類方法,稱為類平均法。 (2) 初始(第一步:i=1)n個樣本各自構(gòu)成一類,類的個數(shù)k=n,第t類 (t=1,2,n)。此時類間的距離就是樣品間的距離(即 )。 (3)對步驟i得到的距離矩陣 ,合并類間距離最小的兩類為一新類。此時類的總個數(shù)k減少1類,即k=n-i+1. (4)計算新類與其他類的距離,得新的距離矩陣 。若合并后類的總個數(shù)k扔大于1,重新步驟(3)和(4);直到類的總個數(shù)為1時轉(zhuǎn)到步驟(5)。 (5)畫譜系聚類圖; (6)決定總類
3、的個數(shù)及各類的成員,聚類分析,結(jié)果分析,返回,判別分析,概述 判別分析是用于判斷個體所屬類別的一種統(tǒng)計方法。根據(jù)已知觀測對象的分類和若干表明觀測對象特征的變量值,建立判別函數(shù)和判別準則,并使其錯判率最小,對于一個未知分類的樣本,將所測指標代入判別方程,從而判斷它來自哪個總體。當然,這種準則在某種意義上是最優(yōu)的,如錯判概率最小或錯判損失最小等。其前提是總體均值有顯著差異,否則錯分率大,判別分析無意義,判別分析,操作步驟 輸入數(shù)據(jù),選擇分析分類判別,然后把“概況”選入分組變量中,再點擊“定義范圍”來定義范圍為1(最小數(shù)值)到4(最大數(shù)值),然后將“語文”、“數(shù)學”、“外語”、“體育”選入自變量中,
4、然后點擊“statistics”,在出現(xiàn)的對話框中勾選平均值與fishers,其余選項為默認,點擊繼續(xù),確定運行,判別分析,反映了判別函數(shù)的特征根,解釋方差的比例和典型相關(guān)系數(shù),第一判別函數(shù)解釋了99.3%的方差,第二判別函數(shù)解釋了0.6%的方差,第三判別函數(shù)解釋了0.1%的方差,結(jié)果分析,是對三個判別函數(shù)的顯著性檢驗,看出第一判別函數(shù)在0.05的顯著性水平上是顯著的,第二與第三判別函數(shù)不顯著,判別分析,該部分可以看出判別系數(shù)表示為,該部分是結(jié)構(gòu)矩陣,即判別載荷,由權(quán)重和判別載荷可以看出,外語對判別函數(shù)1與判別函數(shù)3的貢獻較大,體育對判別函數(shù)2的貢獻較大,判別分析,根據(jù)結(jié)果,判別函數(shù)在y=1這
5、一組的重心為(4.568,-0.216,0.119),在y=2這一組的重心為(1.191,0.064,-0.101),在y=3這一組的重心為(-2.343,0.244,0.09),在y=4這一組的重心為(-5.289,-0.45,-0.021),這樣我們就可以根據(jù)每個觀測的判別z得分對觀測進行分類,對應(yīng)分析,概述 對應(yīng)分析的重要輸出結(jié)果之一在于,把變量與樣品同時反映到相同坐標軸(因子軸)的一張圖形上,結(jié)合計算結(jié)果,在繪出的圖形上能夠直觀地觀察變量之間的關(guān)系、樣品之間的關(guān)系以及變量與樣品之間的對應(yīng)關(guān)系。為此也有人認為,對應(yīng)分析的實質(zhì)是將變量、樣品的交叉表變換成為一張散點圖,從而將表格中包含的變量
6、、樣品的關(guān)聯(lián)信息用各散點空間位置關(guān)系的形式表現(xiàn)出來,對應(yīng)分析,操作步驟 (1)打開spss文件,在表格下方有兩個選項,分別是數(shù)據(jù)試圖和變量視圖,點擊變量視圖選項,在前三行分別輸入“學號”、“科目”、“成績”,其中學號與科目的值項需要做如下設(shè)置:在彈出的值標簽對話框里,在值這一項里輸入“1”,標簽輸入“1”,再點擊“添加”按鈕,依次添加到40為止,在科目的值標簽對話框內(nèi),在值這一項中輸入“1”,標簽輸入“語文”,點擊“添加”按鈕,再依次添加“2”對應(yīng)標簽為“數(shù)學”,“3”對應(yīng)標簽為“外語”,“4”對應(yīng)標簽為“體育”,綜上分別完成對1號至40號學號以及4項科目進行數(shù)字的賦值。 然后點擊數(shù)據(jù)視圖進行
7、數(shù)據(jù)輸入,數(shù)據(jù)輸入按照成績單輸入,如:第一行第一列輸入“1”,第二列輸入“1”,第三列輸入“82”,第二行第一列輸入“2”,第二列輸入“1”,第三列輸入“81”,以此類推,共輸入160行數(shù)據(jù)。在spss的數(shù)據(jù)視圖中輸入數(shù)據(jù)后,再依次點選數(shù)據(jù)加權(quán)個案,進入加權(quán)個案的對話框,系統(tǒng)默認是對觀測值不使用權(quán)重,選中加權(quán)個案選項,此時下面的頻率變量被激活,選中成績并點擊箭頭,使變量成績充當權(quán)數(shù)的作用,點擊確定。 (2)數(shù)據(jù)輸入完成后,選擇分析降維對應(yīng)分析,然后把“學號”選入“行”,再點擊“定義范圍”來定義范圍為1(最小數(shù)值)到40(最大數(shù)值),之后點擊更新,再點擊繼續(xù)。之后同樣地,把“科目”選入“列”,并
8、定義其范圍為14。然后點選“模型”,在出現(xiàn)的對話框中選擇數(shù)據(jù)標準化方法,本次分析距離度量點選eucliden,下面的標準化方法選擇選項被激活,有5種可供選擇的數(shù)據(jù)標準化方法,本次分析選擇第5種:使列總和相等,刪除均值,其余選項為默認,點擊確定運行。 (3)圖表編輯:根據(jù)spss對數(shù)據(jù)的計算,會得到一系列的表格,對對后一張疊加散點圖進行部分操作,雙擊疊加散點圖會彈出一個圖表編輯器,點擊“向x軸添加參考線”又會彈出一個屬性對話框,把位置坐標改為0,關(guān)閉對話框,點擊“向y軸添加參考線”,同上步驟將位置坐標改為0,關(guān)閉圖表編輯器,此時疊加散點圖被分為4各區(qū)域,方便于接下來的結(jié)果分析,對應(yīng)分析,輸出的第
9、一部分對應(yīng)表是由原始數(shù)據(jù)學號與科目分類的列聯(lián)表,可以看出觀測總數(shù)n=40,說明原始數(shù)據(jù)中沒有記錄缺失,有效邊際為行列數(shù)的總和,第二部分匯總表給出了總慣量以及每一維度所揭示的總慣量的百分比的信息。可知總慣量為0.01,卡方值為0.4,有關(guān)系式:總慣量=卡方值*觀測總數(shù)(0.4=0.01*40),由此可以清楚地看到總慣量與卡方值的關(guān)系,同時說明總慣量描述了列聯(lián)表行與列之間總的相關(guān)關(guān)系,結(jié)果分析,對應(yīng)分析,第三部分是對列聯(lián)表行與列個狀態(tài)有關(guān)信息的概括(概述行點只截取了部分數(shù)據(jù))。其中,質(zhì)量部分分別指列聯(lián)表中行與列的邊緣概率。維中的得分是各維度的分值,指行列各狀態(tài)在二維圖中的坐標值。如語文坐標為(-0
10、.00,-0.143)。慣量是每一行(列)與其重心的加權(quán)距離的平方,可以看出i=j=0.01,即行剖面的總慣量等與列剖面的總慣量。貢獻部分是指行(列)的每一狀態(tài)對每一維度(公共因子)特征值的貢獻及每一維度對行(列)各個狀態(tài)的特征值等貢獻。如第一維度中,外語對應(yīng)的數(shù)值最大,為0.975,說明外語這一狀態(tài)對第一維度的貢獻最大,對應(yīng)分析,由以上兩張坐標表可以得出如下的疊加散點圖,也是輸出的最后一部分,是學號各狀態(tài)與科目各狀態(tài)同時在一張二維圖上的投影。在圖上既可以看到每一變量內(nèi)部各狀態(tài)之間的相關(guān)關(guān)系,又可以同時考察兩變量之間的相關(guān)關(guān)系。 在同一變量內(nèi)部,在各學科間,體育與各狀態(tài)之間距離相近,而外語可以
11、單獨歸為一類,對于語文,各學號之間的距離均很近,語文與體育距離比較相近,則可以將體育和語文歸為一類,外語分為一類,數(shù)學分為一類,很明顯的形成了三大類。 同時考察兩變量各狀態(tài),可以看出這個班的同學的成績語文與體育偏好,周圍的學號也較為集中,分數(shù)比較接近,也就是說這個班語文成績與體育成績沒有特別顯著的特點。學號7與學號36離數(shù)學較遠,說明他與數(shù)學的相關(guān)性越小,學號28、學號26與學號35離外語較遠,說明他與位于的相關(guān)性越小,換言之,他們該科成績較低。而再觀察學號較為集中的區(qū)域內(nèi),也說明大部分學號都與體育和語文的相關(guān)性較大,對應(yīng)分析,運用向量分析了解學科偏好排序。我們可以從中心向任意點連線作向量,例如從中心向語文做向量,然后讓所有的學號往這條向量及延長線上作垂線,垂點越靠近向量正向的表示越偏好這種學科。即偏好語文的學生學號依次是9號、1號、2號、3號等等。依次類推,也可以從中心往所有的學號作向量,得到每一個學生在選擇4學科上的偏好排名,如28號的偏科情況為數(shù)學、語文、體育、外語。 接
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新型有機酸開發(fā)與生產(chǎn)項目風險識別與評估綜合報告
- 學校救助申請書
- 單位住房申請書范文
- 加強環(huán)境保護的生產(chǎn)規(guī)范
- 全國高考文綜試題及答案-全國卷
- 四川省成都市成華區(qū)某校2023-2024學年高一上學期期末模擬考試物理試題(解析版)
- 新版北師版一年級下冊數(shù)學課件一 20以內(nèi)數(shù)與加法第7課時 做個加法表
- 6年級-下冊-第09講-應(yīng)用題綜合練習-54
- 現(xiàn)代教育技術(shù)如何重塑課堂整合新模式
- Module9(單元測試)英語五年級下冊-外研版(一起)(含答案)
- 2025年高考數(shù)學總復(fù)習:集合與常用邏輯用語(教師卷)
- 肌力分級護理課件
- 第三章-自然語言的處理(共152張課件)
- 中學教學課件:下第課《認識人工智能》課件
- 《烏有先生歷險記》注釋版
- 2023版初中語文新課程標準
- 六年級口算訓(xùn)練每日100道
- 顳下頜關(guān)節(jié)功能障礙的評估新技術(shù)
- 專項債券在燃氣基礎(chǔ)設(shè)施建設(shè)中的融資作用
- 四川省瀘州市2024年中考地理試卷(附解析)
- GB/T 44255-2024土方機械純電動液壓挖掘機能量消耗量試驗方法
評論
0/150
提交評論