常用數(shù)據(jù)分析方法有那些_第1頁
常用數(shù)據(jù)分析方法有那些_第2頁
常用數(shù)據(jù)分析方法有那些_第3頁
常用數(shù)據(jù)分析方法有那些_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、.常用數(shù)據(jù)分析方法有那些文章來源:ECP數(shù)據(jù)分析時間:2013/6/28 13:35:06發(fā)布者:常用數(shù)據(jù)分析(關(guān)注:554)標簽: 本文包括:常用數(shù)據(jù)分析方法:聚類分析、因子分析、相關(guān)分析、對應(yīng)分析、回歸分析、方差分析;問卷調(diào)查常用數(shù)據(jù)分析方法:描述性統(tǒng)計分析、探索性因素分析、Cronbacha信度系數(shù)分析、結(jié)構(gòu)方程模型分析(structural equations modeling) 。數(shù)據(jù)分析常用的圖表方法:柏拉圖(排列圖)、直方圖(Histogram)、散點圖(scatter diagram)、魚骨圖(Ishikawa)、FMEA、點圖、柱狀圖、雷達圖、趨勢圖。數(shù)據(jù)分析統(tǒng)計工具:SPS

2、S、minitab、JMP。常用數(shù)據(jù)分析方法:1、聚類分析(Cluster Analysis)聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標準,聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動進行分類。聚類分析所使用方法的不同,常常會得到不同的結(jié)論。不同研究者對于同一組數(shù)據(jù)進行聚類分析,所得到的聚類數(shù)未必一致。2、因子分析(Factor Analysis)因子分析是指研究從變量群中提取共性因子的

3、統(tǒng)計技術(shù)。因子分析就是從大量的數(shù)據(jù)中尋找內(nèi)在的聯(lián)系,減少決策的困難。因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發(fā)抽因法、拉奧典型抽因法等等。這些方法本質(zhì)上大都屬近似方法,是以相關(guān)系數(shù)矩陣為基礎(chǔ)的,所不同的是相關(guān)系數(shù)矩陣對角線上的值,采用不同的共同性2估值。在社會學(xué)研究中,因子分析常采用以主成分分析為基礎(chǔ)的反覆法。3、相關(guān)分析(Correlation Analysis)相關(guān)分析(correlation analysis),相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度。相關(guān)關(guān)系是一種非確定性的關(guān)系,例如,以X和Y

4、分別記一個人的身高和體重,或分別記每公頃施肥量與每公頃小麥產(chǎn)量,則X與Y顯然有關(guān)系,而又沒有確切到可由其中的一個去精確地決定另一個的程度,這就是相關(guān)關(guān)系。4、對應(yīng)分析(Correspondence Analysis)對應(yīng)分析(Correspondence analysis)也稱關(guān)聯(lián)分析、R-Q型因子分析,通過分析由定性變量構(gòu)成的交互匯總表來揭示變量間的聯(lián)系??梢越沂就蛔兞康母鱾€類別之間的差異,以及不同變量各個類別之間的對應(yīng)關(guān)系。對應(yīng)分析的基本思想是將一個聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點的形式在較低維的空間中表示出來。5、回歸分析研究一個隨機變量Y對另一個(X)或一組(X1,X2,Xk)變

5、量的相依關(guān)系的統(tǒng)計分析方法?;貧w分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。6、方差分析(ANOVA/Analysis of Variance)又稱“變異數(shù)分析”或“F檢驗”,是R.A.Fisher發(fā)明的,用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗。由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結(jié)果形成影響的可控因

6、素。方差分析是從觀測變量的方差入手,研究諸多控制變量中哪些變量是對觀測變量有顯著影響的變量。數(shù)據(jù)分析常用的圖表方法有:柏拉圖(排列圖)排列圖是分析和尋找影響質(zhì)量主原因素的一種工具,其形式用雙直角坐標圖,左邊縱坐標表示頻數(shù)(如件數(shù)金額等),右邊縱坐標表示頻率(如百分比表示)。分折線表示累積頻率,橫坐標表示影響質(zhì)量的各項因素,按影響程度的大?。闯霈F(xiàn)頻數(shù)多少)從左向右排列。通過對排列圖的觀察分析可抓住影響質(zhì)量的主原因素。直方圖將一個變量的不同等級的相對頻數(shù)用矩形塊標繪的圖表(每一矩形的面積對應(yīng)于頻數(shù))。直方圖(Histogram)又稱柱狀圖、質(zhì)量分布圖。是一種統(tǒng)計報告圖,由一系列高度不等的縱向條紋

7、或線段表示數(shù)據(jù)分布的情況。 一般用橫軸表示數(shù)據(jù)類型,縱軸表示分布情況。散點圖(scatter diagram)散點圖表示因變量隨自變量而變化的大致趨勢,據(jù)此可以選擇合適的函數(shù)對數(shù)據(jù)點進行擬合。用兩組數(shù)據(jù)構(gòu)成多個坐標點,考察坐標點的分布,判斷兩變量之間是否存在某種關(guān)聯(lián)或總結(jié)坐標點的分布模式。魚骨圖(Ishikawa)魚骨圖是一種發(fā)現(xiàn)問題“根本原因”的方法,它也可以稱之為“因果圖”。其特點是簡捷實用,深入直觀。它看上去有些象魚骨,問題或缺陷(即后果)標在魚頭外。FMEAFMEA是一種可靠性設(shè)計的重要方法。它實際上是FMA(故障模式分析)和FEA(故障影響分析)的組合。它對各種可能的風(fēng)險進行評價、分

8、析,以便在現(xiàn)有技術(shù)的基礎(chǔ)上消除這些風(fēng)險或?qū)⑦@些風(fēng)險減小到可接受的水平。數(shù)據(jù)分析統(tǒng)計工具:SPSS:SPSS是世界上最早采用圖形菜單驅(qū)動界面的統(tǒng)計軟件,它最突出的特點就是操作界面極為友好,輸出結(jié)果美觀漂亮。它將幾乎所有的功能都以統(tǒng)一、規(guī)范的界面展現(xiàn)出來,使用Windows的窗口方式展示各種管理和分析數(shù)據(jù)方法的功能,對話框展示出各種功能選擇項。用戶只要掌握一定的Windows操作技能,粗通統(tǒng)計分析原理,就可以使用該軟件為特定的科研工作服務(wù)。minitab:MINITAB功能菜單包括:假設(shè)檢驗(參數(shù)檢驗和非參數(shù)檢驗),回歸分析(一元回歸和多元回歸、線性回歸和非線性回歸),方差分析(單因子、多因子、一

9、般線性模型等),時間序列分析,圖表(散點圖、點圖、矩陣圖、直方圖、莖葉圖、箱線圖、概率圖、概率分布圖、邊際圖、矩陣圖、單值圖、餅圖、區(qū)間圖、Pareto、Fishbone、運行圖等)、蒙特卡羅模擬和仿真、SPC(Statistical Process Control -統(tǒng)計過程控制)、可靠性分析(分布擬合、檢驗計劃、加速壽命測試等)、MSA(交叉、嵌套、量具運行圖、類型I量具研究等)等。JMP:JMP的算法源于SAS,特別強調(diào)以統(tǒng)計方法的實際應(yīng)用為導(dǎo)向,交互性、可視化能力強,使用方便,尤其適合非統(tǒng)計專業(yè)背景的數(shù)據(jù)分析人員使用,在同類軟件中有較大的優(yōu)勢。JMP的應(yīng)用領(lǐng)域包括業(yè)務(wù)可視化、探索性數(shù)據(jù)

10、分析、六西格瑪及持續(xù)改善(可視化六西格瑪、質(zhì)量管理、流程優(yōu)化)、試驗設(shè)計、生存及可靠性、統(tǒng)計分析與建模、交互式數(shù)據(jù)挖掘、分析程序開發(fā)等。JMP是六西格瑪軟件的鼻祖,當年摩托羅拉開始推六西格瑪?shù)臅r候,用的就是JMP軟件,目前有非常多的全球頂尖企業(yè)采用JMP作為六西格瑪軟件,包括陶氏化學(xué)、惠而浦、鐵姆肯、招商銀行、美國銀行、中國石化等等。問卷調(diào)查常用數(shù)據(jù)分析方法:1描述性統(tǒng)計分析 包括樣本基本資料的描述,作各變量的次數(shù)分配及百分比分析,以了解樣本的分布情況。此外,以平均數(shù)和標準差來描述市場導(dǎo)向、競爭優(yōu)勢、組織績效等各個構(gòu)面,以了解樣本企業(yè)的管理人員對這些相關(guān)變量的感知,并利用t檢驗及相關(guān)分析對背景

11、變量所造成的影響做檢驗。2Cronbacha信度系數(shù)分析信度是指測驗結(jié)果的一致性、穩(wěn)定性及可靠性,一般多以內(nèi)部一致性(consistency)來加以表示該測驗信度的高低。信度系數(shù)愈高即表示該測驗的結(jié)果愈一致、穩(wěn)定與可靠。針對各研究變量的衡量題項進行Cronbacha信度分析,以了解衡量構(gòu)面的內(nèi)部一致性。一般來說,Cronbacha僅大于07為高信度,低于035為低信度(Cuieford,1965),05為最低可以接受的信度水準(Nunnally,1978)。3探索性因素分析(exploratory factor analysis)和驗訌性因素分析(confirmatory factor ana

12、lysis)用以測試各構(gòu)面衡量題項的聚合效度(convergent validity)與區(qū)別效度(discriminant validity)。因為僅有信度是不夠的,可信度高的測量,可能是完全無效或是某些程度上無效。所以我們必須對效度進行檢驗。效度是指工具是否能測出在設(shè)計時想測出的結(jié)果。收斂效度的檢驗根據(jù)各個項目和所衡量的概念的因素的負荷量來決定;而區(qū)別效度的檢驗是根據(jù)檢驗性因素分析計算理論上相關(guān)概念的相關(guān)系數(shù),檢定相關(guān)系數(shù)的95信賴區(qū)間是否包含10,若不包含10,則可確認為具有區(qū)別效度(Anderson,1987)。4結(jié)構(gòu)方程模型分析(structural equations modelin

13、g)由于結(jié)構(gòu)方程模型結(jié)合了因素分析(factor analysis)和路徑分析(path analysis),并納入計量經(jīng)濟學(xué)的聯(lián)立方程式,可同時處理多個因變量,容許自變量和因變量含測量誤差,可同時估計因子結(jié)構(gòu)和因子關(guān)系。容許更大彈性的測量模型,可估計整個模型的擬合程度(Bollen和Long,1993),因而適用于整體模型的因果關(guān)系。在模型參數(shù)的估計上,采用最大似然估計法(Maximum Likelihood,ML);在模型的適合度檢驗上,以基本的擬合標準(preliminary fit criteria)、整體模型擬合優(yōu)度(overall model fit)以及模型內(nèi)在結(jié)構(gòu)擬合優(yōu)度(fit of internal structure of model)(Bagozzi和Yi,1988)三個方面的各項指標作為判定的標準。在評價整體模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論