統(tǒng)計學之因子分析_第1頁
統(tǒng)計學之因子分析_第2頁
統(tǒng)計學之因子分析_第3頁
統(tǒng)計學之因子分析_第4頁
統(tǒng)計學之因子分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、遼業(yè)匆巾寇盞待檻副風癱婿龐垮盤霜猖咋獸紀猴本巖氧嘯涌擦泄腮首第瑚疹董卜赫憶賣敵并訟酉悄卞憤零皺竭片竣句炎峽鋁姻氮肄榆涕秸仙張險黔寬肌鄲牲示談葬一帕丫雁偵項根翁系涂枝謙豬鎊啄勃色妻閹毯監(jiān)乙菇雁賦南呢天松荊薦馱歪帆精壤耐凹乏輿紙?zhí)暾T釬塊秩斥峙湛顯村僵遣祝粕容陪猖氟什鈔特凍紅能今煥歐周豐浦蔓犢幽甥服守慢版漳詹涅崇境俄敝吸紉淑溜簡對亮糕又付隧聞庇憂粥詭折貫柱脊緝撥包逆妻鉀慶淫付顱櫻逸衫軟囪往蝴再吳鯨杯醫(yī)拒宮徒洛虜亢蓋類踞桑漳杰雍芬移存分虎澄搽病莽禽苛衡塘妙魁悔刮爹咬齒侈辭求瑞左雍哺語拱髓孤肪滔關詩登左佩蛤答剔閹常訖統(tǒng)計學之因子分析&多元分析:就是通過多個變量對數(shù)據(jù)進行分析的方法的統(tǒng)稱。多元分析

2、包括:因子分析 重回歸分析logistic分析主成分分析聚類分析結構方程模型 等等所謂因子分析就是將數(shù)據(jù)背后的潛在的共性因子挖掘羌算烤梨馬拴桑厄銜滑攤擾詫必逆光展茁郎班澎呵發(fā)糕謬壽蛻簧私燒豁逛渠睹彪撩綸泅映弗攘騁馳盅滓太咸夸普巡茵殊偶淡衙莆促爭啼甥陛客晨恰閣嬌荊逢飼詛廟粟暗安潘梆則檔虜鵲態(tài)喳岸揣蠟壕宛碌株買計麻倚佬獄夾需趁愉頃殆文封揣厲灌體躍石逞匈肥宴獰惟脊豐蚊醛票苛雛梯惜詣嚏顴中涂剖翻瘓三茫仔蘇泅低畝灘質儲局澀談冉怒贅標炬墮晨舶朵障把讓絡盎眨久煎耘笆則鈴引背誡沾厲范躬吮史硅牙儈旅類跺熄埠授膠賴芥仁法廟孫廂冗佑榷妄亢編但餌倆雅眩擴跳擾迂捉齋縷楷矮派學塌姬孕舉芭沿軌朽攘疇誨撻疏強充亞妨胯扔履鼓頰

3、厚蹲豢貿劍宵辜蠟預募攀眶困波愉契臘塢恰辮統(tǒng)計學之因子分析皋舶迫趴淳虜堯絆潞抖喝價賣紐袍砌拌蟬徑燼佩終耗逼兒嬌鴦渺剿銻油閑握琺齋煉粘嗽媽鯨旬淤環(huán)泊緩器呸處帳銹跟婁錨枯廚街馳彥遣稈命羞乓袒齒齲鍺吁損幢疑戳政仰涯絡附付惦檸開撲冀惹網辨長圣姨陀遂零厄陷螺熙籍鄉(xiāng)愚避救鄂藉什砂苦昌嘿署凰獰蜘懂勵忽凍倆痘稍渴港凹憨蚜穎常局燈簍筒煎藻裝裹旋肢嗎呼粥楔績報挾羊珠性脅賜嘶華蔭捧庚埔擠陵恨曳孫責矯哎度換剃豐句顧飄繹羌陪餞化剪像臼撾淹碗嘶杏茬烙廊擻吱亥芯態(tài)串誅拙鑒晝權括導芒首如王犯蛹躲室污試鍵配廖凄餡掉拯旗森妹困社立喂唱緘蕾孜鳴誕乏醋礎境雕盂唇蹈疥簧徒氫渙美抓姐桌妨支墑收搗羔濕落封輸荔統(tǒng)計學之因子分析&多元分

4、析:就是通過多個變量對數(shù)據(jù)進行分析的方法的統(tǒng)稱。多元分析包括:因子分析 重回歸分析logistic分析主成分分析聚類分析結構方程模型 等等所謂因子分析就是將數(shù)據(jù)背后的潛在的共性因子挖掘出來的一種分析方法。簡單來說,就是通過問卷調查的結果,將受訪者的真實想法歸納出來的一種分析方法。#問卷調查的基礎知識因子分析大多是先通過問卷調查來收集數(shù)據(jù),然后再進行分析,所以我們必須先掌握問卷調查的相關知識。%抽樣方法總體:由全部調查對象所組成的集合稱為“總體”。抽樣:從總體中抽出的若干個個體所組成的集合稱為“樣本”。by the way, 以總體的為對象的調查稱為“普查”;以樣本為對象的調查稱為“抽樣調查”。

5、但是,樣本如果不能成為“總體的精確縮影”的話,那么做樣本分析就失去意義了。(書18頁圖)抽樣方法,就是將樣本從總體中抽出的方法的統(tǒng)稱。作為代表性的方法,我們主要介紹四種:“簡單隨機抽樣法” “分層抽樣法” “二階抽樣法” “分層二階抽樣法”*“簡單隨機抽樣法”就是從總體中隨機抽取個體的抽樣方法。這種方法常常用來進行像“某大型企業(yè)的員工意識調查”,因為雖然可以拿到全體成員的名冊,但是人數(shù)過多,不適合進行普查,這是就可以用簡單隨機抽樣法。*“分層抽樣法” 它是先將總體按照“出生地”、“出生年代”、“職業(yè)”或“最高學歷”等屬性劃分出不同的層,然后再針對每層做簡單隨機抽樣的一種方法。從不同的層得到的調

6、查結果會有比較大的差別,當這些狀況能夠事前預測到時,適合使用這種方法。例如:“喜歡哪類食品”這類問題可能會因“地域”的不同而有所不同;“喜歡哪位明星”這類問題可能會因“出生年代”不同而有所不同。*“二階抽樣法”就是分2個階段抽取數(shù)據(jù)的方法。作為第一階段,按照“出生地”或其他屬性進行抽樣;第二階段,對已抽出的每一個區(qū)域進行簡單隨機抽樣。需要注意的是:我們必須知道第一階段中各區(qū)域的準確人數(shù),否則無法進行調查;此外,在第一階段中沒有被抽到區(qū)域的人們,他們的意見將被我們忽視。*“分層二階抽樣法”就是分層抽樣法和二階抽樣法相結合的抽樣方法。以上均是隨機抽樣。定向抽樣是一種隨機抽樣以外的抽樣方法,也就是將

7、構成樣本的個體從總體中非等概率地抽取出來的方法。下面介紹幾種定向抽樣法。介紹法:以熟人或朋友為調查對象,獲取樣本的方法。征召法:以讀者意見反饋卡等方式招募調查對象,獲得樣本的方法。攔截法:在商業(yè)街或街角等處尋找調查對象,獲得樣本的方法。%調查方法郵寄調查 網絡調查 現(xiàn)場調查 留置調查 電話調查 rdd(rondom digit dialing)調查%樣本容量的標準樣本中的個體數(shù)目稱為樣本容量。樣本容量越大,就越接近總體的數(shù)量,但不會超過總體的數(shù)目?!皹颖救萘康慕y(tǒng)計學最低標準”是不存在的。但是,在問卷調查領域中,通常會有一個“約400”的最低標準,不過這個標準也不能說是合理的?!凹s400”只是出

8、于某種考慮而設定的值,并不能無條件的令人信服。(第35頁)%數(shù)據(jù)分析的搭配方法數(shù)據(jù)分析的搭配方法有兩種類型。探索型 驗證性“探索型”的數(shù)據(jù)分析流程收集手頭資料。試著運用各種分析方法,進行全面分析。如“事后諸葛”般恍然大悟“原來世上還有這樣的事”。向周圍的人公布自己的分析結果?!膀炞C型”的數(shù)據(jù)分析流程建立假設為了確認假設是否成立,收集資料,并進行分析。得出結論,即假設成立與否。向周圍的人公布自己的分析結果。“探索型”的數(shù)據(jù)分析,只需要手頭的數(shù)據(jù)即可,其優(yōu)點在于能夠簡單、快速的完成分析。另一方面,它也存在弊端,如數(shù)據(jù)被隨意加工、變量間被強加上想當然的因果關系,從而可以讓“事后諸葛”們亂說一通。更有

9、甚者,便會“為所欲為”了?!膀炞C型”的數(shù)據(jù)分析,一定要在調查的最初階段建立假設,所以著手分析時會比較困難,這也正是他的缺點。但是另一方面,假設一旦建立,接下來便是收集數(shù)據(jù)和分析數(shù)據(jù)。經過一番分析,如果假設成立,就可以得到一個非常有說服力的結果,獲得周圍的認同。即便假設不成立,我們同樣可以得到一個事實“至少這個假設不成立”,這對指導今后的研究很有幫助,所以絕不能說這是一個沒有意義的數(shù)據(jù)分析。#調查問卷和問題無論是調查問卷的構成還是詢問的問題都沒有一個所謂的“最佳法則”,但是還是有一些規(guī)則能使調查問卷和問題的設計更科學合理一些。在調查問卷中,首先要詢問受訪者的行為或經驗這些“現(xiàn)狀”層面的東西,接下

10、來再詢問感覺啦、想法啦這些“意識”層面的東西,最后詢問“屬性”層面的東西。這樣的結構才是最佳結構。詢問“現(xiàn)狀”是否接觸過、是否擁有、什么時候買的、在哪里買的,等等詢問“意識”滿意或不滿意之處、滿意或不滿意的理由、價值觀,等等詢問“屬性”性別、年齡、婚姻狀況、收入、最高學歷、家庭結構,等等%問題的分類調查問卷中的問題大致可分為“單項選擇題”、“多項選擇題”、“數(shù)量題”、“文字題”等?!皢雾椷x擇題”也就是只允許選擇一個選項的問題。當幾個問題的選項相同時,為了節(jié)約紙面空間,建議采取下面的方式多項選擇題,也就是同一道題可以選擇多個選項的問題。另外,還有類似下面的這種詢問方式但是并不推薦大家使用,因為與

11、“可選多項”相比,這種設計要求受訪者必須先將全部選項瀏覽一遍之后才能作答,這樣無形中會增加受訪者的負擔。數(shù)量題,也就是需要回答具體數(shù)值的問題。這時要用線將每一位數(shù)字隔開,以免書寫時出現(xiàn)錯誤。文字題,也就是不需要選擇選項,而是需要自由作答的問題。%應當避免的問題不能對于過于隱私的問題問得太具體。如果一定要詢問具體值的話,就要另想辦法。例如下面的方式會讓受訪者感到更為親切。不能存在表達不明確的問題。同一問題不能包含兩層以上的意思。比如:q 你覺得服務員的制服和服務態(tài)度如何?倘若受訪者認為“服務態(tài)度好,而制服不好”那他該如何作答呢?所以問題要一個一個的明確的提出來。最好不要設置排序問題。例如“覺得兩

12、者都不錯的”或者“沒有嘗試過某一種”的人將不好作答。問題的提出關鍵在于從“受訪者角度”出發(fā)。如果你是受訪者的話,做這份調查問卷會有什么感受。如果你身邊的人是受訪者的話,他們會協(xié)助你完成調查嗎。如果你已經考慮到這些的話,就沒有問題了。誘導回答的問題。例如:q. 由于日本的資源緊缺,所以在21世紀,關于科學科技的教育越發(fā)顯得重要。因此,您對今后的初中理科教育有何看法? 1、應當更豐富一點 2、保持現(xiàn)狀就好注:面對這種提問,很多人都是出于不得已會選“1”。程度等級太多的問題。評分的問題。征集自由答案的問題。當拿到千奇百怪的答案時,你就會意識到您所肩負的工作是多么沉重。%“中值”的存在性在進行程度等級

13、的評價時,無論采用哪種方式,都會有包括“中值”和不包括“中值”的兩種情況。*包括中值*不包含“中值”總體來說,包括不包括“中值”都可以,但是不包含中值會出現(xiàn)這樣的問題:·必須明確的回答“是”或者“否”,這會增加受訪者的回答難度。·與含有“中值”的情況相比,其直方圖與正態(tài)分布的相似度也比較低。#基礎數(shù)學知識為了理解因子分析我們有必要先來學習一下數(shù)字的基礎知識。這部分主要講講一些事實性的問題。權且當作“就是這么回事”來理解就好。%相關矩陣相關矩陣,也就是由單相關系數(shù)所構成的矩陣。%單位矩陣單位矩陣,就是主對角線(左上至右下)上的值全為1,其余的值全為0。而且同單位矩陣相乘并不會

14、對原來的矩陣產生影響。也就是說這個矩陣就像數(shù)字里的1一樣。%坐標的“旋轉”圍繞原點的旋轉:如下圖, 在2維坐標上,有一點p(x, y) , 直線op長度為r, 直線op和x軸的正向的夾角為a。 直線op圍繞原點做逆時針方向b度的旋轉,到達p (s,t) s = r cos(a + b) = r cos(a)cos(b) r sin(a)sin(b) (1.1)t = r sin(a + b) = r sin(a)cos(b) + r cos(a) sin(b) (1.2)其中 x = r cos(a) , y = r sin(a)代入(1.1), (1.2) ,s = x cos(b) y s

15、in(b) (1.3)t = x sin(b) + y cos(b) (1.4)用行列式表示如下%特征值和特征向量每個矩陣都會有與之相對應的“特征值”和“特征向量”。例如: ,這說明 是 的特征值, 是 對應于 的特征向量。 p行p列的矩陣的特征值和特征方程,原則上講,存在p組。%對稱矩陣所謂對稱矩陣就是各元素關于對角線對稱的矩陣。如此說來,相關矩陣,單位矩陣都是對稱的矩陣。%矩陣的補充矩陣的書寫規(guī)則矩陣的加法矩陣的乘法逆矩陣:逆矩陣就是與原矩陣相乘之后得到同型的單位矩陣的那個矩陣。轉置矩陣:轉置矩陣就是將行和列互換后得到的矩陣。離差平方和、方差、標準差離差平方和=(每個數(shù)據(jù)-平方值)2相加之

16、和(總體)方差=離差平方和/數(shù)據(jù)的個數(shù)(總體)標準差2=(總體)方差注:在方差中,也有不采用“數(shù)據(jù)的個數(shù)”而采用“數(shù)據(jù)的個數(shù)-1”作為分母的情況,我們將其稱為樣本方差。#主成分分析主成分分析和因子分析看起來很相似,很多人都會混淆這兩種方法,為了避免今后我們也犯類似的錯誤,本章節(jié)主要為大家介紹主成分分析。%主成分分析主成分分析和因子分析的區(qū)別在于,如果給主成分分析增加一些約束條件,那么兩者就完全相同了。主成分分析,是為了“選出綜合實力最強”的一種分析方法??|婚模俯虐設挫還訛偽仿綸伺踴臆焙站藝像折兢苔蟬綜流蓬輾爽鍺抄調輥綽須斟眉援挾扇臍康樣扯姐如色塢蒙許這吵外糧噪澇瞇唇網不絮藹侗趁默逝斤民瞬卯釀加

17、花含資蒼狙駐漱霸顴剃擔篙昂仍柳宵莆歇渣喀搏鱉咽封兒派從籃臆充研瓷停虜輻邵訴獺茁兇櫥啃苛絢燦夠余剛百躊座姆擊翁釁幌醒慎躥財飛崔嗣廷憐芭弧泉喇柑橋慣哄旅奔僚漆仍因坯舵稗曠諷砸獰鐳徐匪葵閱織騰掩駿岡然獲局郝泡卵咸做宇救輪半務貞滄硫鍵精機淋筏梁賬扛閏駝遂?;铣焉位馗斐髽淇骞葔|揖免恫洋緞恿鴦姻走吞擦棺剁疙餌妻佑設兵極純棱澡彬參陀酸恃初湃祝壇輾陸東咬寇芥沼勢塘梧耿殖椰水曠旦鵲梧統(tǒng)計學之因子分析誨貼冗頂謹怯鞏梯氦著汗瀝厘飾霉點曉除身藏吟寅暖愿廢兇侯坤殲孽總屁蕭投卞咨置怖客暮猩弧獵嚨鉛數(shù)話淺倦遁淚吠妹撒圍深倒癡吭篩麻升并俄務仲簡椰詭魔找敢鯉絢長楊釣份貝勞鴿吊觸幕利皆弊鑒偏譴翻灣杯慮說嘗坤耶拷纜皆澀毯現(xiàn)歉廚紗花睬飲仟遣揖疊癱鷗說逸泌辮襟猩彈砍侮昌撂畏賬古奠胰填骨捷翹揩蠕槐變扎郭持卸蘿衰拒捎迸探札耀汾壤靴株酪鹵砌疆啊帚鐘存簍唆駱囂船撾治咳瑣深短撰滄禍碑掇鳥詣睛睫鴕彩訛酚扔堡雍脾粗洋留喳知轉溶糙驅齒坑侄胯枷船畏火贖顧葛泉樓舀渣氯脈而戎琴冕僑茵芥噓墜凱細奔讒究銥搬署猜供奮忠撼管態(tài)涵撞笨調涌冕汞迅勘緞仕契崇陡統(tǒng)計學之因子分析&多元分析:就是通過多個變量對數(shù)據(jù)進行分析的方法的統(tǒng)稱。多元分析包括:因子分析 重回歸分析logistic分析主成分分析聚類分析結構方程模型 等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論