數(shù)據(jù)分析與統(tǒng)計學(xué)基礎(chǔ)V0.2_第1頁
數(shù)據(jù)分析與統(tǒng)計學(xué)基礎(chǔ)V0.2_第2頁
數(shù)據(jù)分析與統(tǒng)計學(xué)基礎(chǔ)V0.2_第3頁
數(shù)據(jù)分析與統(tǒng)計學(xué)基礎(chǔ)V0.2_第4頁
數(shù)據(jù)分析與統(tǒng)計學(xué)基礎(chǔ)V0.2_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)分析與統(tǒng)計學(xué)基礎(chǔ)數(shù)據(jù)分析的重要性制定具有針對性的營銷策略幫助產(chǎn)品定位、生命周期管理與銷售分析深層次研究競爭分析理解市場動向與趨勢為管理、經(jīng)濟以及投資決策提供依據(jù)我司目前數(shù)據(jù)分析的現(xiàn)狀第五階段第四階段第三階段第二階段第一階段(我司現(xiàn)狀)分析競爭型分析型企業(yè)擁有數(shù)據(jù)分析意向有限采用數(shù)據(jù)分析法數(shù)據(jù)分析法利用薄弱如何提升我司數(shù)據(jù)分析能力統(tǒng)計學(xué)基礎(chǔ)參數(shù)估計假設(shè)檢驗方差分析回歸-線性回歸

-方差回歸

-邏輯回歸

-定序回歸

-生存回歸提升數(shù)據(jù)分析兩大方法數(shù)據(jù)分析軟件Excel——初級SPSS——中級SAS——高級默認(rèn)所有人都學(xué)過《概率論與數(shù)理統(tǒng)計》

統(tǒng)計學(xué)的基本概念——話術(shù)總體樣本總體:所研究的全部個體的集合樣本:總體中的一部分元素參數(shù)統(tǒng)計量參數(shù):描述總體特征的概括性數(shù)字度量統(tǒng)計量:描述樣本特征的概括性數(shù)字度量變量分類變量:說明事物類別的一個名稱順序變量:說明事物有序類別的一個名稱數(shù)值型變量:說明事物數(shù)字特征的一個名稱統(tǒng)計學(xué)的基本概念——度量集中趨勢的度量眾數(shù)(分類)

一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值中位數(shù)(順序)

一組數(shù)據(jù)排序后處于中間位置上的變量值四分位數(shù)(順序)

一組數(shù)據(jù)排序后處于25%和75%位置上的值平均數(shù)(數(shù)值)異眾比率(分類)

非眾數(shù)組的頻數(shù)占總頻數(shù)的比例四分位差(順序)

上四分位與下四分位數(shù)之差方差與標(biāo)準(zhǔn)差(數(shù)值)離散程度的度量偏態(tài)及其測度

數(shù)據(jù)分布對稱性的測度,記作SK。

SK>1或SK<-1稱為高度偏態(tài);

0.5<SK<1或-1<SK<-0.5稱為中度偏態(tài);

SK越接近0偏斜度越低峰態(tài)及其測度

數(shù)據(jù)分布平峰或尖峰程度,記作K。

K>0尖峰,K<0扁平偏態(tài)與峰態(tài)的度量123統(tǒng)計學(xué)基礎(chǔ)123參數(shù)估計與假設(shè)檢驗方差分析回歸分析統(tǒng)計學(xué)基礎(chǔ)123參數(shù)估計與假設(shè)檢驗方差分析回歸分析參數(shù)估計的基本原理與置信區(qū)間參數(shù)估計:用樣本統(tǒng)計量去估計總體的參數(shù)參數(shù)估計的方法:點估計和區(qū)間估計置信度為95%置信度為99%95%的區(qū)間包含總體參數(shù)的真值99%的區(qū)間包含總體參數(shù)的真值置信區(qū)間的理解置信度95%指有95%的區(qū)間包含總體參數(shù)的真值,5%則不包含;通過樣本求得的區(qū)間是固定的、已知的,而總體是未知的、隨機的;在實際問題中,我們希望構(gòu)造的區(qū)間是包含總體真值其中的一個區(qū)間。一個總體參數(shù)的區(qū)間估計*Z

α/2=1.96(置信度95%)兩個總體參數(shù)的區(qū)間估計*Z

α/2=1.96(置信度95%)通過Excel獲得參數(shù)估計所需的參數(shù)某公司3個月電腦銷售數(shù)量(臺)234159187155172183182177163158143198141167194225177189196203187160214168173178184209176188161152149211196234185189196206150161178168174153186190160171228162223170165179186175197208153163218180175144178191197192166196179171233179187173174210154164215233175188237194198168174226180172190172187189200211156165175210207181205195201172203165196172176182188195202213描述統(tǒng)計【數(shù)據(jù)】->【數(shù)據(jù)分析】->【描述統(tǒng)計】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“匯總統(tǒng)計”選擇“平均置信度”為95%描述統(tǒng)計平均184.566667標(biāo)準(zhǔn)誤差1.97915373中位數(shù)182眾數(shù)196標(biāo)準(zhǔn)差21.6805429方差470.045938峰度-0.2243562偏度0.40528478區(qū)域96最小值141最大值237求和22148觀測數(shù)120置信度(95.0%)3.91892206假設(shè)檢驗的基本原理及思路

假設(shè)檢驗舉例

Excel:【插入】->【函數(shù)】->NORM.S.DIST統(tǒng)計學(xué)基礎(chǔ)123參數(shù)估計與假設(shè)檢驗方差分析回歸分析方差分析基本原理及概念通過誤差來判斷分類型自變量對數(shù)值型因變量的影響原理:SST(總誤差)=SSE(組內(nèi)誤差)+SSA(組間誤差)誤差:通過假設(shè)檢驗,利用誤差分布或概率來檢驗各總體的均值是否相等。如果各總體的均值相等無影響,不相等則有影響思路:基本原理及概念方差分析表的一般形式及含義誤差來源平方和SS自由度df均方MSF值P值F臨界值組間(因素影響)SSAk-1MSA=SSA/k-1MSA/MSE組內(nèi)(誤差)SSEn-kMSE=SSE/n-k總和SSTn-1SSA:反映自變量對因變量的影響。SSE:反映除自變量對因變量的影響之外,其他因素對因變量的影響。SST:反映自變量和殘差變量的共同影響。MSE和MSA:組內(nèi)和組間均方差,為了計算F值。F值:統(tǒng)計決策。F值>F臨界值,拒絕原假設(shè),表明所檢驗因素對觀測值有顯著影響;F值<F臨界值,不拒絕原假設(shè),表明所檢驗因素對觀測值沒有顯著影響。方差分析的強度測量與多重比較

強度測量

多重比較用Excel實現(xiàn)單雙因素方差分析單因素方差分析選擇【數(shù)據(jù)】選擇【數(shù)據(jù)分析】選擇【方差分析:單因素方差分析】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“α:0.05”【輸出區(qū)域】:輸出區(qū)域雙因素方差分析選擇【數(shù)據(jù)】選擇【數(shù)據(jù)分析】選擇【方差分析:無重復(fù)雙因素方差分析】or【方差分析:有重復(fù)雙因素方差分析】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“α:0.05”【輸出區(qū)域】:輸出區(qū)域雙因素方差分析舉例

地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品

素品牌1365350343340323品牌2345368363330333品牌3358323353343308品牌42882802982602984個品牌的彩電在5個地區(qū)的銷售數(shù)量數(shù)據(jù)方差分析:無重復(fù)雙因素分析SUMMARY觀測數(shù)求和平均方差行151721344.2233.7行251739347.8295.7行351685337442.5行451424284.8249.2列1413563391224.667列241321330.251464.25列341357339.25822.9167列441273318.251538.917列541262315.5241.6667方差分析差異源SSdfMSFP-valueFcrit行13004.5534334.8518.107779.46E-053.490295列2011.74502.9252.1008460.1436653.259167誤差2872.712239.3917總計17888.9519(kr-1)

雙因素方差分析【數(shù)據(jù)】->【數(shù)據(jù)分析】->【方差分析:無重復(fù)雙因素方差分析】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“α:0.05”統(tǒng)計學(xué)基礎(chǔ)123參數(shù)估計與假設(shè)檢驗方差分析回歸分析我司可能用到的回歸及應(yīng)用場合線性回歸方差回歸邏輯回歸定序回歸生存回歸數(shù)值型因變量與自變量品質(zhì)型因變量與數(shù)值型自變量邏輯型因變量與自變量順序型因變量與自變量生存周期與自變量線性回歸的基本概念

回歸的由來線性回歸模型起源:回歸源于高爾頓的豌豆實驗現(xiàn)象:一個總體中在某一時期具有某一極端特性的個體在未來的某一時期將減弱它的極端性y=β0+

β1x1+

β2x2+

β3x3+……+βixi+ε

Excel輸出回歸分析結(jié)果SUMMARYOUTPUT回歸統(tǒng)計MultipleR0.914430892RSquare0.836183857AdjustedRSquare0.803420628標(biāo)準(zhǔn)誤差1.600268457觀測值25方差分析

dfSSMSFSignificanceF回歸分析4261.433265.358325.522021.30295E-07殘差2051.217182.560859總計24312.6504

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept-1.1855948160.696385-1.70250.104155-2.6382284520.26703882XVariable10.0342482220.0071564.7858830.0001130.0193208750.049175569XVariable20.2179018930.0650753.3484590.00320.0821572410.353646545XVariable30.0017078160.0737460.0231580.981754-0.1521244880.15554012XVariable4-0.0205045590.012704-1.613990.122197-0.04700520.005996081常規(guī)統(tǒng)計量,回歸方程的擬合優(yōu)度對回歸方程的線性關(guān)系進行顯著性檢驗回歸參數(shù)估計相關(guān)內(nèi)容回歸方程的擬合優(yōu)度回歸統(tǒng)計MultipleR0.914430892RSquare0.836183857AdjustedRSquare0.803420628標(biāo)準(zhǔn)誤差1.600268457觀測值25方差分析

dfSSMSFSignificanceF回歸分析4261.433265.358325.522021.30295E-07殘差2051.217182.560859總計24312.6504

擬合優(yōu)度:回歸直線與各觀測點的接近程度,需計算判定系數(shù)R2或調(diào)整的R2。

回歸方程的顯著性檢驗方差分析

dfSSMSFSignificanceF回歸分析4261.433265.358325.522021.30295E-07殘差2051.217182.560859總計24312.6504

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept-1.1855948160.696385-1.70250.104155-2.6382284520.26703882XVariable10.0342482220.0071564.7858830.0001130.0193208750.049175569XVariable20.2179018930.0650753.3484590.00320.0821572410.353646545XVariable30.0017078160.0737460.0231580.981754-0.1521244880.15554012XVariable4-0.0205045590.012704-1.613990.122197-0.04700520.005996081顯著性檢驗:檢驗線性回歸方程是否能真實反映變量x和y之間的關(guān)系。顯著性檢驗分為兩部分:線性關(guān)系和回歸系數(shù)。線性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論