統(tǒng)計學(xué)之因子分析_第1頁
統(tǒng)計學(xué)之因子分析_第2頁
統(tǒng)計學(xué)之因子分析_第3頁
統(tǒng)計學(xué)之因子分析_第4頁
統(tǒng)計學(xué)之因子分析_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、遼業(yè)匆巾寇盞待檻副風(fēng)癱婿龐垮盤霜猖咋獸紀(jì)猴本巖氧嘯涌擦泄腮首第瑚疹董卜赫憶賣敵并訟酉悄卞憤零皺竭片竣句炎峽鋁姻氮肄榆涕秸仙張險黔寬肌鄲牲示談葬一帕丫雁偵項根翁系涂枝謙豬鎊啄勃色妻閹毯監(jiān)乙菇雁賦南呢天松荊薦馱歪帆精壤耐凹乏輿紙?zhí)暾T釬塊秩斥峙湛顯村僵遣祝粕容陪猖氟什鈔特凍紅能今煥歐周豐浦蔓犢幽甥服守慢版漳詹涅崇境俄敝吸紉淑溜簡對亮糕又付隧聞庇憂粥詭折貫柱脊緝撥包逆妻鉀慶淫付顱櫻逸衫軟囪往蝴再吳鯨杯醫(yī)拒宮徒洛虜亢蓋類踞桑漳杰雍芬移存分虎澄搽病莽禽苛衡塘妙魁悔刮爹咬齒侈辭求瑞左雍哺語拱髓孤肪滔關(guān)詩登左佩蛤答剔閹常訖統(tǒng)計學(xué)之因子分析&多元分析:就是通過多個變量對數(shù)據(jù)進(jìn)行分析的方法的統(tǒng)稱。多元分析

2、包括:因子分析 重回歸分析logistic分析主成分分析聚類分析結(jié)構(gòu)方程模型 等等所謂因子分析就是將數(shù)據(jù)背后的潛在的共性因子挖掘羌算烤梨馬拴桑厄銜滑攤擾詫必逆光展茁郎班澎呵發(fā)糕謬壽蛻簧私燒豁逛渠睹彪撩綸泅映弗攘騁馳盅滓太咸夸普巡茵殊偶淡衙莆促爭啼甥陛客晨恰閣嬌荊逢飼詛廟粟暗安潘梆則檔虜鵲態(tài)喳岸揣蠟壕宛碌株買計麻倚佬獄夾需趁愉頃殆文封揣厲灌體躍石逞匈肥宴獰惟脊豐蚊醛票苛雛梯惜詣嚏顴中涂剖翻瘓三茫仔蘇泅低畝灘質(zhì)儲局澀談冉怒贅標(biāo)炬墮晨舶朵障把讓絡(luò)盎眨久煎耘笆則鈴引背誡沾厲范躬吮史硅牙儈旅類跺熄埠授膠賴芥仁法廟孫廂冗佑榷妄亢編但餌倆雅眩擴(kuò)跳擾迂捉齋縷楷矮派學(xué)塌姬孕舉芭沿軌朽攘疇誨撻疏強(qiáng)充亞妨胯扔履鼓頰

3、厚蹲豢貿(mào)劍宵辜蠟預(yù)募攀眶困波愉契臘塢恰辮統(tǒng)計學(xué)之因子分析皋舶迫趴淳虜堯絆潞抖喝價賣紐袍砌拌蟬徑燼佩終耗逼兒嬌鴦渺剿銻油閑握琺齋煉粘嗽媽鯨旬淤環(huán)泊緩器呸處帳銹跟婁錨枯廚街馳彥遣稈命羞乓袒齒齲鍺吁損幢疑戳政仰涯絡(luò)附付惦檸開撲冀惹網(wǎng)辨長圣姨陀遂零厄陷螺熙籍鄉(xiāng)愚避救鄂藉什砂苦昌嘿署凰獰蜘懂勵忽凍倆痘稍渴港凹憨蚜穎常局燈簍筒煎藻裝裹旋肢嗎呼粥楔績報挾羊珠性脅賜嘶華蔭捧庚埔擠陵恨曳孫責(zé)矯哎度換剃豐句顧飄繹羌陪餞化剪像臼撾淹碗嘶杏茬烙廊擻吱亥芯態(tài)串誅拙鑒晝權(quán)括導(dǎo)芒首如王犯蛹躲室污試鍵配廖凄餡掉拯旗森妹困社立喂唱緘蕾孜鳴誕乏醋礎(chǔ)境雕盂唇蹈疥簧徒氫渙美抓姐桌妨支墑收搗羔濕落封輸荔統(tǒng)計學(xué)之因子分析&多元分

4、析:就是通過多個變量對數(shù)據(jù)進(jìn)行分析的方法的統(tǒng)稱。多元分析包括:因子分析 重回歸分析logistic分析主成分分析聚類分析結(jié)構(gòu)方程模型 等等所謂因子分析就是將數(shù)據(jù)背后的潛在的共性因子挖掘出來的一種分析方法。簡單來說,就是通過問卷調(diào)查的結(jié)果,將受訪者的真實想法歸納出來的一種分析方法。#問卷調(diào)查的基礎(chǔ)知識因子分析大多是先通過問卷調(diào)查來收集數(shù)據(jù),然后再進(jìn)行分析,所以我們必須先掌握問卷調(diào)查的相關(guān)知識。%抽樣方法總體:由全部調(diào)查對象所組成的集合稱為“總體”。抽樣:從總體中抽出的若干個個體所組成的集合稱為“樣本”。by the way, 以總體的為對象的調(diào)查稱為“普查”;以樣本為對象的調(diào)查稱為“抽樣調(diào)查”。

5、但是,樣本如果不能成為“總體的精確縮影”的話,那么做樣本分析就失去意義了。(書18頁圖)抽樣方法,就是將樣本從總體中抽出的方法的統(tǒng)稱。作為代表性的方法,我們主要介紹四種:“簡單隨機(jī)抽樣法” “分層抽樣法” “二階抽樣法” “分層二階抽樣法”*“簡單隨機(jī)抽樣法”就是從總體中隨機(jī)抽取個體的抽樣方法。這種方法常常用來進(jìn)行像“某大型企業(yè)的員工意識調(diào)查”,因為雖然可以拿到全體成員的名冊,但是人數(shù)過多,不適合進(jìn)行普查,這是就可以用簡單隨機(jī)抽樣法。*“分層抽樣法” 它是先將總體按照“出生地”、“出生年代”、“職業(yè)”或“最高學(xué)歷”等屬性劃分出不同的層,然后再針對每層做簡單隨機(jī)抽樣的一種方法。從不同的層得到的調(diào)

6、查結(jié)果會有比較大的差別,當(dāng)這些狀況能夠事前預(yù)測到時,適合使用這種方法。例如:“喜歡哪類食品”這類問題可能會因“地域”的不同而有所不同;“喜歡哪位明星”這類問題可能會因“出生年代”不同而有所不同。*“二階抽樣法”就是分2個階段抽取數(shù)據(jù)的方法。作為第一階段,按照“出生地”或其他屬性進(jìn)行抽樣;第二階段,對已抽出的每一個區(qū)域進(jìn)行簡單隨機(jī)抽樣。需要注意的是:我們必須知道第一階段中各區(qū)域的準(zhǔn)確人數(shù),否則無法進(jìn)行調(diào)查;此外,在第一階段中沒有被抽到區(qū)域的人們,他們的意見將被我們忽視。*“分層二階抽樣法”就是分層抽樣法和二階抽樣法相結(jié)合的抽樣方法。以上均是隨機(jī)抽樣。定向抽樣是一種隨機(jī)抽樣以外的抽樣方法,也就是將

7、構(gòu)成樣本的個體從總體中非等概率地抽取出來的方法。下面介紹幾種定向抽樣法。介紹法:以熟人或朋友為調(diào)查對象,獲取樣本的方法。征召法:以讀者意見反饋卡等方式招募調(diào)查對象,獲得樣本的方法。攔截法:在商業(yè)街或街角等處尋找調(diào)查對象,獲得樣本的方法。%調(diào)查方法郵寄調(diào)查 網(wǎng)絡(luò)調(diào)查 現(xiàn)場調(diào)查 留置調(diào)查 電話調(diào)查 rdd(rondom digit dialing)調(diào)查%樣本容量的標(biāo)準(zhǔn)樣本中的個體數(shù)目稱為樣本容量。樣本容量越大,就越接近總體的數(shù)量,但不會超過總體的數(shù)目?!皹颖救萘康慕y(tǒng)計學(xué)最低標(biāo)準(zhǔn)”是不存在的。但是,在問卷調(diào)查領(lǐng)域中,通常會有一個“約400”的最低標(biāo)準(zhǔn),不過這個標(biāo)準(zhǔn)也不能說是合理的。“約400”只是出

8、于某種考慮而設(shè)定的值,并不能無條件的令人信服。(第35頁)%數(shù)據(jù)分析的搭配方法數(shù)據(jù)分析的搭配方法有兩種類型。探索型 驗證性“探索型”的數(shù)據(jù)分析流程收集手頭資料。試著運(yùn)用各種分析方法,進(jìn)行全面分析。如“事后諸葛”般恍然大悟“原來世上還有這樣的事”。向周圍的人公布自己的分析結(jié)果?!膀炞C型”的數(shù)據(jù)分析流程建立假設(shè)為了確認(rèn)假設(shè)是否成立,收集資料,并進(jìn)行分析。得出結(jié)論,即假設(shè)成立與否。向周圍的人公布自己的分析結(jié)果?!疤剿餍汀钡臄?shù)據(jù)分析,只需要手頭的數(shù)據(jù)即可,其優(yōu)點(diǎn)在于能夠簡單、快速的完成分析。另一方面,它也存在弊端,如數(shù)據(jù)被隨意加工、變量間被強(qiáng)加上想當(dāng)然的因果關(guān)系,從而可以讓“事后諸葛”們亂說一通。更有

9、甚者,便會“為所欲為”了?!膀炞C型”的數(shù)據(jù)分析,一定要在調(diào)查的最初階段建立假設(shè),所以著手分析時會比較困難,這也正是他的缺點(diǎn)。但是另一方面,假設(shè)一旦建立,接下來便是收集數(shù)據(jù)和分析數(shù)據(jù)。經(jīng)過一番分析,如果假設(shè)成立,就可以得到一個非常有說服力的結(jié)果,獲得周圍的認(rèn)同。即便假設(shè)不成立,我們同樣可以得到一個事實“至少這個假設(shè)不成立”,這對指導(dǎo)今后的研究很有幫助,所以絕不能說這是一個沒有意義的數(shù)據(jù)分析。#調(diào)查問卷和問題無論是調(diào)查問卷的構(gòu)成還是詢問的問題都沒有一個所謂的“最佳法則”,但是還是有一些規(guī)則能使調(diào)查問卷和問題的設(shè)計更科學(xué)合理一些。在調(diào)查問卷中,首先要詢問受訪者的行為或經(jīng)驗這些“現(xiàn)狀”層面的東西,接下

10、來再詢問感覺啦、想法啦這些“意識”層面的東西,最后詢問“屬性”層面的東西。這樣的結(jié)構(gòu)才是最佳結(jié)構(gòu)。詢問“現(xiàn)狀”是否接觸過、是否擁有、什么時候買的、在哪里買的,等等詢問“意識”滿意或不滿意之處、滿意或不滿意的理由、價值觀,等等詢問“屬性”性別、年齡、婚姻狀況、收入、最高學(xué)歷、家庭結(jié)構(gòu),等等%問題的分類調(diào)查問卷中的問題大致可分為“單項選擇題”、“多項選擇題”、“數(shù)量題”、“文字題”等?!皢雾椷x擇題”也就是只允許選擇一個選項的問題。當(dāng)幾個問題的選項相同時,為了節(jié)約紙面空間,建議采取下面的方式多項選擇題,也就是同一道題可以選擇多個選項的問題。另外,還有類似下面的這種詢問方式但是并不推薦大家使用,因為與

11、“可選多項”相比,這種設(shè)計要求受訪者必須先將全部選項瀏覽一遍之后才能作答,這樣無形中會增加受訪者的負(fù)擔(dān)。數(shù)量題,也就是需要回答具體數(shù)值的問題。這時要用線將每一位數(shù)字隔開,以免書寫時出現(xiàn)錯誤。文字題,也就是不需要選擇選項,而是需要自由作答的問題。%應(yīng)當(dāng)避免的問題不能對于過于隱私的問題問得太具體。如果一定要詢問具體值的話,就要另想辦法。例如下面的方式會讓受訪者感到更為親切。不能存在表達(dá)不明確的問題。同一問題不能包含兩層以上的意思。比如:q 你覺得服務(wù)員的制服和服務(wù)態(tài)度如何?倘若受訪者認(rèn)為“服務(wù)態(tài)度好,而制服不好”那他該如何作答呢?所以問題要一個一個的明確的提出來。最好不要設(shè)置排序問題。例如“覺得兩

12、者都不錯的”或者“沒有嘗試過某一種”的人將不好作答。問題的提出關(guān)鍵在于從“受訪者角度”出發(fā)。如果你是受訪者的話,做這份調(diào)查問卷會有什么感受。如果你身邊的人是受訪者的話,他們會協(xié)助你完成調(diào)查嗎。如果你已經(jīng)考慮到這些的話,就沒有問題了。誘導(dǎo)回答的問題。例如:q. 由于日本的資源緊缺,所以在21世紀(jì),關(guān)于科學(xué)科技的教育越發(fā)顯得重要。因此,您對今后的初中理科教育有何看法? 1、應(yīng)當(dāng)更豐富一點(diǎn) 2、保持現(xiàn)狀就好注:面對這種提問,很多人都是出于不得已會選“1”。程度等級太多的問題。評分的問題。征集自由答案的問題。當(dāng)拿到千奇百怪的答案時,你就會意識到您所肩負(fù)的工作是多么沉重。%“中值”的存在性在進(jìn)行程度等級

13、的評價時,無論采用哪種方式,都會有包括“中值”和不包括“中值”的兩種情況。*包括中值*不包含“中值”總體來說,包括不包括“中值”都可以,但是不包含中值會出現(xiàn)這樣的問題:·必須明確的回答“是”或者“否”,這會增加受訪者的回答難度。·與含有“中值”的情況相比,其直方圖與正態(tài)分布的相似度也比較低。#基礎(chǔ)數(shù)學(xué)知識為了理解因子分析我們有必要先來學(xué)習(xí)一下數(shù)字的基礎(chǔ)知識。這部分主要講講一些事實性的問題。權(quán)且當(dāng)作“就是這么回事”來理解就好。%相關(guān)矩陣相關(guān)矩陣,也就是由單相關(guān)系數(shù)所構(gòu)成的矩陣。%單位矩陣單位矩陣,就是主對角線(左上至右下)上的值全為1,其余的值全為0。而且同單位矩陣相乘并不會

14、對原來的矩陣產(chǎn)生影響。也就是說這個矩陣就像數(shù)字里的1一樣。%坐標(biāo)的“旋轉(zhuǎn)”圍繞原點(diǎn)的旋轉(zhuǎn):如下圖, 在2維坐標(biāo)上,有一點(diǎn)p(x, y) , 直線op長度為r, 直線op和x軸的正向的夾角為a。 直線op圍繞原點(diǎn)做逆時針方向b度的旋轉(zhuǎn),到達(dá)p (s,t) s = r cos(a + b) = r cos(a)cos(b) r sin(a)sin(b) (1.1)t = r sin(a + b) = r sin(a)cos(b) + r cos(a) sin(b) (1.2)其中 x = r cos(a) , y = r sin(a)代入(1.1), (1.2) ,s = x cos(b) y s

15、in(b) (1.3)t = x sin(b) + y cos(b) (1.4)用行列式表示如下%特征值和特征向量每個矩陣都會有與之相對應(yīng)的“特征值”和“特征向量”。例如: ,這說明 是 的特征值, 是 對應(yīng)于 的特征向量。 p行p列的矩陣的特征值和特征方程,原則上講,存在p組。%對稱矩陣所謂對稱矩陣就是各元素關(guān)于對角線對稱的矩陣。如此說來,相關(guān)矩陣,單位矩陣都是對稱的矩陣。%矩陣的補(bǔ)充矩陣的書寫規(guī)則矩陣的加法矩陣的乘法逆矩陣:逆矩陣就是與原矩陣相乘之后得到同型的單位矩陣的那個矩陣。轉(zhuǎn)置矩陣:轉(zhuǎn)置矩陣就是將行和列互換后得到的矩陣。離差平方和、方差、標(biāo)準(zhǔn)差離差平方和=(每個數(shù)據(jù)-平方值)2相加之

16、和(總體)方差=離差平方和/數(shù)據(jù)的個數(shù)(總體)標(biāo)準(zhǔn)差2=(總體)方差注:在方差中,也有不采用“數(shù)據(jù)的個數(shù)”而采用“數(shù)據(jù)的個數(shù)-1”作為分母的情況,我們將其稱為樣本方差。#主成分分析主成分分析和因子分析看起來很相似,很多人都會混淆這兩種方法,為了避免今后我們也犯類似的錯誤,本章節(jié)主要為大家介紹主成分分析。%主成分分析主成分分析和因子分析的區(qū)別在于,如果給主成分分析增加一些約束條件,那么兩者就完全相同了。主成分分析,是為了“選出綜合實力最強(qiáng)”的一種分析方法??|婚模俯虐設(shè)挫還訛偽仿綸伺踴臆焙站藝像折兢苔蟬綜流蓬輾爽鍺抄調(diào)輥綽須斟眉援挾扇臍康樣扯姐如色塢蒙許這吵外糧噪澇瞇唇網(wǎng)不絮藹侗趁默逝斤民瞬卯釀加

17、花含資蒼狙駐漱霸顴剃擔(dān)篙昂仍柳宵莆歇渣喀搏鱉咽封兒派從籃臆充研瓷停虜輻邵訴獺茁兇櫥啃苛絢燦夠余剛百躊座姆擊翁釁幌醒慎躥財飛崔嗣廷憐芭弧泉喇柑橋慣哄旅奔僚漆仍因坯舵稗曠諷砸獰鐳徐匪葵閱織騰掩駿岡然獲局郝泡卵咸做宇救輪半務(wù)貞滄硫鍵精機(jī)淋筏梁賬扛閏駝遂?;铣焉位馗斐髽淇骞葔|揖免恫洋緞恿鴦姻走吞擦棺剁疙餌妻佑設(shè)兵極純棱澡彬參陀酸恃初湃祝壇輾陸東咬寇芥沼勢塘梧耿殖椰水曠旦鵲梧統(tǒng)計學(xué)之因子分析誨貼冗頂謹(jǐn)怯鞏梯氦著汗瀝厘飾霉點(diǎn)曉除身藏吟寅暖愿廢兇侯坤殲?zāi)蹩偲ㄊ捦侗遄芍貌揽湍盒苫~C嚨鉛數(shù)話淺倦遁淚吠妹撒圍深倒癡吭篩麻升并俄務(wù)仲簡椰詭魔找敢鯉絢長楊釣份貝勞鴿吊觸幕利皆弊鑒偏譴翻灣杯慮說嘗坤耶拷纜皆澀毯現(xiàn)歉廚紗花睬飲仟遣揖疊癱鷗說逸泌辮襟猩彈砍侮昌撂畏賬古奠胰填骨捷翹揩蠕槐變扎郭持卸蘿衰拒捎迸探札耀汾壤靴株酪鹵砌疆啊帚鐘存簍唆駱囂船撾治咳瑣深短撰滄禍碑掇鳥詣睛睫鴕彩訛酚扔堡雍脾粗洋留喳知轉(zhuǎn)溶糙驅(qū)齒坑侄胯枷船畏火贖顧葛泉樓舀渣氯脈而戎琴冕僑茵芥噓墜凱細(xì)奔讒究銥搬署猜供奮忠撼管態(tài)涵撞笨調(diào)涌冕汞迅勘緞仕契崇陡統(tǒng)計學(xué)之因子分析&多元分析:就是通過多個變量對數(shù)據(jù)進(jìn)行分析的方法的統(tǒng)稱。多元分析包括:因子分析 重回歸分析logistic分析主成分分析聚類分析結(jié)構(gòu)方程模型 等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論