SPSS個人筆記,順序有點亂_第1頁
SPSS個人筆記,順序有點亂_第2頁
SPSS個人筆記,順序有點亂_第3頁
SPSS個人筆記,順序有點亂_第4頁
SPSS個人筆記,順序有點亂_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、9章SPSS的多元統(tǒng)計分析9章SPSS的多元統(tǒng)計分析1、針對變量作因子分析,R型因子分析;對樣品作因子分析,Q型因子分析;2、八一/尸十七X是可實測的隨機向量,F(xiàn)是因子,A是因子載荷矩陣,通過對變量的相關(guān)系數(shù)矩陣舊的分析,從中找出少數(shù)幾個能控制原始變量的隨機變量fi,以F代替X,用它再現(xiàn)原始變量X的信息,數(shù)的目的;3、樣品聚類一一Q-聚類;變量聚類(觀察指標)一一Ra聚類;4、馬氏距離:既排除了各項指標之間相關(guān)性的干擾,而且還不受各指標量綱的影響;5、聚類中一一收斂標準:如果是0.02,表示當兩次迭代計算的最小的類中心的變化距離小于初始類中心位時,迭代停止; Between-groups1in

2、kage:組間平均距離法。 Within-groupslinkage:組內(nèi)平均距離法口 Nearestneighbor:最短距離法中 Furthestneighbor:最遠距離法口 Centroidclustering:重心法口 Medianclustering:中間距離法口 Ward'smethod:離差平方和法口6、7、Between-groupslinkage:組間平均距離法。系統(tǒng)默認選項。合并兩類的結(jié)果使所有的兩類的平均距離最小。 Within-groupslinkage:組內(nèi)平均距離法。當兩類合并為一類后,合并后的類中的所有項之間的平均距離最小。 Nearestneighbo

3、r:最近距離法。采用兩類間最近點間的距離代表兩類間的距離。 FurthestNeighbor:最遠距離法。用兩類之間最遠點的距離代表兩類之間的距離。 Centroidclustering:重心法。定義類與類之間的距離為兩類中各樣品的重心之間的距離。 Medianclustering:中位數(shù)法。定義類與類之間的距離為兩類中各樣品的中位數(shù)之間的距離。 Ward'smethod:最小離差平方和法。聚類中使類內(nèi)各樣品的離差平方和最小,類間的離差平方和盡可能大。1、主要菜單項:data數(shù)據(jù);transform轉(zhuǎn)換;2、基本原理:a)單項選擇題的編碼b)多項選擇題的編碼c)排序題的編碼d)開放式問

4、題的編碼e)缺失值的編碼f)“不適用情況”的編碼g)數(shù)據(jù)轉(zhuǎn)換3、調(diào)查問卷的信度分析:可靠性和有效性的試測;分析度量可靠性分析:把需要分析的項目都填入“項目”中,例子中的“科學(xué)素質(zhì)質(zhì)”+“經(jīng)濟素質(zhì)”+“道德素質(zhì)”,選擇模型“阿爾法a”可靠性統(tǒng)計量CronbachtAlpha基于標推化項的CronbachsAlpha項數(shù),87J,90144、克朗巴哈信度系數(shù),由于在0.8-0.9之間,說明問卷調(diào)查中的題目具有較強的內(nèi)在一致性;5、多重響應(yīng)MultipleResponse)是指對同一個問題被調(diào)查者可能有多個答案,它是調(diào)查研究中十分常見的6、多重二分法和多重分類法;7、多重二分法:分類編碼是0和1,如

5、果錄入就1,沒錄入則0;設(shè)置好多重響應(yīng)后,點擊“關(guān)閉”,接*析”-“多重響應(yīng)”,就多出了兩個項目;例如我在例子中設(shè)置“22”,那么“頻率”就統(tǒng)計出了每4數(shù),響應(yīng)程度以及在原來項目中的比例;品牌8、多重響應(yīng)交叉分析的2甜SPSS吉果報告中給出不同性別下各個品牌的頻數(shù)與百分比。女性中,當前使月星手機的人數(shù)為3個,占女性的33.3%,即針對女性這個群體而言,大約1/3的使用三星手機,三星手一個手機品牌;針對三星品牌而言,有40%的是女性使用者,60%勺男性使用者,即女性對三星手機喜:男性對三星手機喜愛程度高。在所有的品牌中,對女性群體而言,最喜歡的手機是三星和摩托羅拉,大約手機,1/3的使用摩托羅拉

6、。不同性別群體在手機的品牌選擇上差異比較大,男性對諾基亞手機非常喜歡,而SPS配計分析與數(shù)據(jù)挖掘,之類的圖書位于:C819/WSPSS19最新版及教程下載軟件下載:點擊下載:SPSS19.0點擊下載:SPSS18.0點擊下載:SPSS17.0點擊下載:SPSS16.0spss19.0備用下載(先安裝源文件SPSS_Statistics_19_win32_en.exe,當進行到選擇認證許可時,點擊取消”就行。然后緊接著安裝另外一個crack文件就是破解版了。網(wǎng)友提示,確保這兩個文件安裝在同一目錄下)1、matlab;2、SQL3、php+apache+mysql;4、SPSS5、Oracle;圖

7、形一一舊對話框:各種各樣的圖形;各種關(guān)系圖的分析一一首先從畫圖觀察開始;1 .兩個變量之間的相關(guān)程度一一相關(guān)系數(shù)的絕對值一一約接近1:相關(guān)程度越高;等于2 .正相關(guān):0<=r<=1,相同方向的變化趨勢;負相關(guān):-1<=r<1;3 .相關(guān)圖:直角坐標系第一象限一一坐標點形式;4 .皮爾遜相關(guān)系數(shù):積差相關(guān)系數(shù),適用于研究連續(xù)變量之間的相關(guān)程度;?12(3)控制第三個影響要素(控制變量)情況下計算9.距離分析:對相似/不相似的程度的一種測量;分析一一相關(guān)一一距離1-2之間的關(guān)1 .求出回歸模型的參數(shù)后,通常要進行各種統(tǒng)計檢驗:擬合優(yōu)度檢驗、回歸方程、回歸系數(shù)的顯亳驗、殘差分

8、析;DEPENDENT:因變盤.*ZPRED:標準化預(yù)測值。*ZRES1D:標準化殘差&和RESID:剔除的殘差。ADJPRED:調(diào)整后的預(yù)測值.SRES1D:學(xué)生化殘差.2 .回歸方程計算中一一繪制刪ESID:學(xué)生化剔除殘差”3 .步驟:繪制散點圖一一所DR平方1的話就比較準確一一標準估計誤差(越小越好)一一值)越小越好,要小于設(shè)置的顯著性水平4 .SPS釉線估計:曲線擬合(11種常見的曲線估計回歸模型)一一此時如果自變量是時間變量ID,也就是長度均勻的時候,也可以選擇將它移入【time時間框】中;5 .非線性回歸:估計因變量和自變量之間具有任意關(guān)系的模型;6 .因子分析:盡可能不損

9、失信息或者少損失信息的情況下,將多個變量減少為少數(shù)幾個因子的方晶幾個因子可以高度概況大量數(shù)據(jù)中的信息,既減少了變量的個數(shù),又同樣能再現(xiàn)變量之間的內(nèi)石數(shù)據(jù):1 .保留字(reservedword):指在高級語言中已經(jīng)定義過的字,使用者不能再將這些字作為變量名或過程名使用。2 .Role1色:主要用于定義變量在后續(xù)統(tǒng)計分析中的功能作用,用戶可以選擇Input、TargetBoth?類型的角色。3 .選擇個案一一隨機樣本一一精確:從外里面隨機選取樣本訃;轉(zhuǎn)換:1 .計算變量一一首先要定義目標變量的名稱;添加if,運算的同時選擇出條件;2 .重新編碼為相同變量一一改變其中的某個值一一另一個值;3 .秩

10、”(Rank)是數(shù)據(jù)整理中的重要概念,前面講解的觀測量排序是按照大小順序重新排列觀測量,而觀測量求秩是指對觀測量排序后指定的名次”。例如,觀測量的值依次為3、5、-2、0、7,它們按小到大排列后為-2、03、57,各觀測量的秩等于&41、2、5??偠灾褪怯^察的順序;4 .個案排秩一一變量(要排序的行)一一排序標準(按這一行進行分組);前提工作:提煉出這兩行進行單獨的運算,不然別的行會進行干擾;5 .分析一一描述統(tǒng)計-1-產(chǎn)生頻數(shù)表;2-進行基本都額統(tǒng)計描述分析(包括了描述出極大值極小值均值方差標準差等等,單擊"選項,可以自行選擇”);3-探索性分析(EDA,檢查數(shù)據(jù)是否

11、有錯,獲取數(shù)據(jù)的分布特征,初步觀察數(shù)據(jù),繪制出:箱形圖、直方圖、莖葉圖、正態(tài)檢驗圖、頻數(shù)表、方差齊性檢驗因變量:表示要探索的變量;因子列表:依據(jù)此來分組分析;標識變量:當探索發(fā)現(xiàn)異常值時候,可以使用此作為標注,如果沒選,則默認id標志;【M-estimators(Mf計值)】復(fù)選框,分析樣本數(shù)據(jù)的穩(wěn)健性。)44/U聯(lián)表(交叉表)分析;例子:研究性別”對體重”有無顯著的性影響;勾選七方”檢驗獨立性;如若先進行頻數(shù)分析,那么勾選單元格"一一行:'歹h總數(shù)”;5-比率分析:比較兩行的比率,然后分析得出新的比例行的極大值、極小值、均值、方差等等;1 .單樣本t檢驗1用來自某總體的樣本

12、數(shù)據(jù),推斷該總體的均值是否與指定的檢驗值之間存在明顯E異,也就是對總體均值的假設(shè)檢驗;均值、標準差、均值標準差、均值差值、偏差、標準誤差、區(qū)間上限下限置信區(qū)間調(diào)整顯著性水平;2 .普通均值檢驗!變量:被統(tǒng)計的量,例如1的個數(shù),2的個數(shù),而均值,則是因變量中包含量的總值,除以自變量的個數(shù);3 .兩獨立樣本t檢整兩種考試形式對學(xué)生有無顯著的焦慮差異性;4 .兩配對樣本t檢陶來自兩個總體的配對樣本,推斷兩個總體的均值是否存在顯著差異;要考感樣本之間的相關(guān)性;同一實驗對象處理前后的數(shù)據(jù);同一實驗對象兩個部位的數(shù)據(jù);同;2-觀察值順序不能隨意調(diào)換,要保持一一對應(yīng)關(guān)系;3-樣本來自的總體要服從正態(tài)5基本假

13、設(shè):1 .各樣本的獨立性;2 .要求觀察值從正態(tài)總體中抽取,水平之間的方差一一組間方差,F(xiàn)分布=水平間方差/力方差/組內(nèi)方差;比較均值一一單因素ANOVA1 .因變量列表2 .因子3 .例子:不同信息來源導(dǎo)致信息傳播測度不同,所以,“信息來源”是因素,“上級、同級、下級因子的三種不同水平,”信息傳播測度”是因變量;(結(jié)論:認為這幾個組的方差相同)4 .齊性方差:指的是要比較的兩組數(shù)據(jù)的分布是否一致,通俗說的就是兩者是否適合比較;如果相大于顯著性水平,那么認為幾組數(shù)據(jù)的方差是相同的,滿足方差分析的前提條件;5 .DF自由度,均方=方差/自由度;sig=P值=顯著性;6 .方差的同質(zhì)性檢驗:從各個樣本的方差來推斷其總體方差是否相同;7 .概率P1顯著性水平,所以接受零假設(shè),認為不同因素沒有顯著性差異;8 .隨機因素:很難控制,又會對結(jié)果產(chǎn)生影響,將難以控制的因素作為(協(xié)變量),要求是連續(xù)方變量,多個協(xié)變量相互獨立;9 .觀察協(xié)變量和因變量有無關(guān)聯(lián)性;10 .案例:分析“體重”對“人體血清膽固醇”有無直接影響,體重因素同時分為“正常組”和法組”兩個水平單因素模型;為了排除“年齡”這一項的影響,所以將年齡引入“協(xié)變苣新的活動數(shù)據(jù)集按照排序文件中的關(guān)鍵變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論