




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)基礎(chǔ)數(shù)據(jù)分析的重要性制定具有針對(duì)性的營銷策略幫助產(chǎn)品定位、生命周期管理與銷售分析深層次研究競爭分析理解市場動(dòng)向與趨勢為管理、經(jīng)濟(jì)以及投資決策提供依據(jù)我司目前數(shù)據(jù)分析的現(xiàn)狀第五階段第四階段第三階段第二階段第一階段(我司現(xiàn)狀)分析競爭型分析型企業(yè)擁有數(shù)據(jù)分析意向有限采用數(shù)據(jù)分析法數(shù)據(jù)分析法利用薄弱如何提升我司數(shù)據(jù)分析能力統(tǒng)計(jì)學(xué)基礎(chǔ)參數(shù)估計(jì)假設(shè)檢驗(yàn)方差分析回歸-線性回歸
-方差回歸
-邏輯回歸
-定序回歸
-生存回歸提升數(shù)據(jù)分析兩大方法數(shù)據(jù)分析軟件Excel——初級(jí)SPSS——中級(jí)SAS——高級(jí)默認(rèn)所有人都學(xué)過《概率論與數(shù)理統(tǒng)計(jì)》
統(tǒng)計(jì)學(xué)的基本概念——話術(shù)總體樣本總體:所研究的全部個(gè)體的集合樣本:總體中的一部分元素參數(shù)統(tǒng)計(jì)量參數(shù):描述總體特征的概括性數(shù)字度量統(tǒng)計(jì)量:描述樣本特征的概括性數(shù)字度量變量分類變量:說明事物類別的一個(gè)名稱順序變量:說明事物有序類別的一個(gè)名稱數(shù)值型變量:說明事物數(shù)字特征的一個(gè)名稱統(tǒng)計(jì)學(xué)的基本概念——度量集中趨勢的度量眾數(shù)(分類)
一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值中位數(shù)(順序)
一組數(shù)據(jù)排序后處于中間位置上的變量值四分位數(shù)(順序)
一組數(shù)據(jù)排序后處于25%和75%位置上的值平均數(shù)(數(shù)值)異眾比率(分類)
非眾數(shù)組的頻數(shù)占總頻數(shù)的比例四分位差(順序)
上四分位與下四分位數(shù)之差方差與標(biāo)準(zhǔn)差(數(shù)值)離散程度的度量偏態(tài)及其測度
數(shù)據(jù)分布對(duì)稱性的測度,記作SK。
SK>1或SK<-1稱為高度偏態(tài);
0.5<SK<1或-1<SK<-0.5稱為中度偏態(tài);
SK越接近0偏斜度越低峰態(tài)及其測度
數(shù)據(jù)分布平峰或尖峰程度,記作K。
K>0尖峰,K<0扁平偏態(tài)與峰態(tài)的度量123統(tǒng)計(jì)學(xué)基礎(chǔ)123參數(shù)估計(jì)與假設(shè)檢驗(yàn)方差分析回歸分析統(tǒng)計(jì)學(xué)基礎(chǔ)123參數(shù)估計(jì)與假設(shè)檢驗(yàn)方差分析回歸分析參數(shù)估計(jì)的基本原理與置信區(qū)間參數(shù)估計(jì):用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)參數(shù)估計(jì)的方法:點(diǎn)估計(jì)和區(qū)間估計(jì)置信度為95%置信度為99%95%的區(qū)間包含總體參數(shù)的真值99%的區(qū)間包含總體參數(shù)的真值置信區(qū)間的理解置信度95%指有95%的區(qū)間包含總體參數(shù)的真值,5%則不包含;通過樣本求得的區(qū)間是固定的、已知的,而總體是未知的、隨機(jī)的;在實(shí)際問題中,我們希望構(gòu)造的區(qū)間是包含總體真值其中的一個(gè)區(qū)間。一個(gè)總體參數(shù)的區(qū)間估計(jì)*Z
α/2=1.96(置信度95%)兩個(gè)總體參數(shù)的區(qū)間估計(jì)*Z
α/2=1.96(置信度95%)通過Excel獲得參數(shù)估計(jì)所需的參數(shù)某公司3個(gè)月電腦銷售數(shù)量(臺(tái))234159187155172183182177163158143198141167194225177189196203187160214168173178184209176188161152149211196234185189196206150161178168174153186190160171228162223170165179186175197208153163218180175144178191197192166196179171233179187173174210154164215233175188237194198168174226180172190172187189200211156165175210207181205195201172203165196172176182188195202213描述統(tǒng)計(jì)【數(shù)據(jù)】->【數(shù)據(jù)分析】->【描述統(tǒng)計(jì)】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“匯總統(tǒng)計(jì)”選擇“平均置信度”為95%描述統(tǒng)計(jì)平均184.566667標(biāo)準(zhǔn)誤差1.97915373中位數(shù)182眾數(shù)196標(biāo)準(zhǔn)差21.6805429方差470.045938峰度-0.2243562偏度0.40528478區(qū)域96最小值141最大值237求和22148觀測數(shù)120置信度(95.0%)3.91892206假設(shè)檢驗(yàn)的基本原理及思路
假設(shè)檢驗(yàn)舉例
Excel:【插入】->【函數(shù)】->NORM.S.DIST統(tǒng)計(jì)學(xué)基礎(chǔ)123參數(shù)估計(jì)與假設(shè)檢驗(yàn)方差分析回歸分析方差分析基本原理及概念通過誤差來判斷分類型自變量對(duì)數(shù)值型因變量的影響原理:SST(總誤差)=SSE(組內(nèi)誤差)+SSA(組間誤差)誤差:通過假設(shè)檢驗(yàn),利用誤差分布或概率來檢驗(yàn)各總體的均值是否相等。如果各總體的均值相等無影響,不相等則有影響思路:基本原理及概念方差分析表的一般形式及含義誤差來源平方和SS自由度df均方MSF值P值F臨界值組間(因素影響)SSAk-1MSA=SSA/k-1MSA/MSE組內(nèi)(誤差)SSEn-kMSE=SSE/n-k總和SSTn-1SSA:反映自變量對(duì)因變量的影響。SSE:反映除自變量對(duì)因變量的影響之外,其他因素對(duì)因變量的影響。SST:反映自變量和殘差變量的共同影響。MSE和MSA:組內(nèi)和組間均方差,為了計(jì)算F值。F值:統(tǒng)計(jì)決策。F值>F臨界值,拒絕原假設(shè),表明所檢驗(yàn)因素對(duì)觀測值有顯著影響;F值<F臨界值,不拒絕原假設(shè),表明所檢驗(yàn)因素對(duì)觀測值沒有顯著影響。方差分析的強(qiáng)度測量與多重比較
強(qiáng)度測量
多重比較用Excel實(shí)現(xiàn)單雙因素方差分析單因素方差分析選擇【數(shù)據(jù)】選擇【數(shù)據(jù)分析】選擇【方差分析:單因素方差分析】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“α:0.05”【輸出區(qū)域】:輸出區(qū)域雙因素方差分析選擇【數(shù)據(jù)】選擇【數(shù)據(jù)分析】選擇【方差分析:無重復(fù)雙因素方差分析】or【方差分析:有重復(fù)雙因素方差分析】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“α:0.05”【輸出區(qū)域】:輸出區(qū)域雙因素方差分析舉例
地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品
牌
因
素品牌1365350343340323品牌2345368363330333品牌3358323353343308品牌42882802982602984個(gè)品牌的彩電在5個(gè)地區(qū)的銷售數(shù)量數(shù)據(jù)方差分析:無重復(fù)雙因素分析SUMMARY觀測數(shù)求和平均方差行151721344.2233.7行251739347.8295.7行351685337442.5行451424284.8249.2列1413563391224.667列241321330.251464.25列341357339.25822.9167列441273318.251538.917列541262315.5241.6667方差分析差異源SSdfMSFP-valueFcrit行13004.5534334.8518.107779.46E-053.490295列2011.74502.9252.1008460.1436653.259167誤差2872.712239.3917總計(jì)17888.9519(kr-1)
雙因素方差分析【數(shù)據(jù)】->【數(shù)據(jù)分析】->【方差分析:無重復(fù)雙因素方差分析】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“α:0.05”統(tǒng)計(jì)學(xué)基礎(chǔ)123參數(shù)估計(jì)與假設(shè)檢驗(yàn)方差分析回歸分析我司可能用到的回歸及應(yīng)用場合線性回歸方差回歸邏輯回歸定序回歸生存回歸數(shù)值型因變量與自變量品質(zhì)型因變量與數(shù)值型自變量邏輯型因變量與自變量順序型因變量與自變量生存周期與自變量線性回歸的基本概念
回歸的由來線性回歸模型起源:回歸源于高爾頓的豌豆實(shí)驗(yàn)現(xiàn)象:一個(gè)總體中在某一時(shí)期具有某一極端特性的個(gè)體在未來的某一時(shí)期將減弱它的極端性y=β0+
β1x1+
β2x2+
β3x3+……+βixi+ε
Excel輸出回歸分析結(jié)果SUMMARYOUTPUT回歸統(tǒng)計(jì)MultipleR0.914430892RSquare0.836183857AdjustedRSquare0.803420628標(biāo)準(zhǔn)誤差1.600268457觀測值25方差分析
dfSSMSFSignificanceF回歸分析4261.433265.358325.522021.30295E-07殘差2051.217182.560859總計(jì)24312.6504
Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept-1.1855948160.696385-1.70250.104155-2.6382284520.26703882XVariable10.0342482220.0071564.7858830.0001130.0193208750.049175569XVariable20.2179018930.0650753.3484590.00320.0821572410.353646545XVariable30.0017078160.0737460.0231580.981754-0.1521244880.15554012XVariable4-0.0205045590.012704-1.613990.122197-0.04700520.005996081常規(guī)統(tǒng)計(jì)量,回歸方程的擬合優(yōu)度對(duì)回歸方程的線性關(guān)系進(jìn)行顯著性檢驗(yàn)回歸參數(shù)估計(jì)相關(guān)內(nèi)容回歸方程的擬合優(yōu)度回歸統(tǒng)計(jì)MultipleR0.914430892RSquare0.836183857AdjustedRSquare0.803420628標(biāo)準(zhǔn)誤差1.600268457觀測值25方差分析
dfSSMSFSignificanceF回歸分析4261.433265.358325.522021.30295E-07殘差2051.217182.560859總計(jì)24312.6504
擬合優(yōu)度:回歸直線與各觀測點(diǎn)的接近程度,需計(jì)算判定系數(shù)R2或調(diào)整的R2。
回歸方程的顯著性檢驗(yàn)方差分析
dfSSMSFSignificanceF回歸分析4261.433265.358325.522021.30295E-07殘差2051.217182.560859總計(jì)24312.6504
Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%Intercept-1.1855948160.696385-1.70250.104155-2.6382284520.26703882XVariable10.0342482220.0071564.7858830.0001130.0193208750.049175569XVariable20.2179018930.0650753.3484590.00320.0821572410.353646545XVariable30.0017078160.0737460.0231580.981754-0.1521244880.15554012XVariable4-0.0205045590.012704-1.613990.122197-0.04700520.005996081顯著性檢驗(yàn):檢驗(yàn)線性回歸方程是否能真實(shí)反映變量x和y之間的關(guān)系。顯著性檢驗(yàn)分為兩部分:線性關(guān)系和回歸系數(shù)。線性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中建自動(dòng)施工方案
- 《物理競賽題解析與物理競賽輔導(dǎo)教學(xué)方案》
- 汽車車門施工方案
- 內(nèi)墻保溫板施工方案
- 農(nóng)村拆除施工方案范本
- 揚(yáng)州脫硫煙囪施工方案
- 古詩二首(東溪和蠶麥)閱讀練習(xí)
- 建筑工程臨時(shí)用工合同
- 包頭中招試題數(shù)學(xué)試卷
- 污泥干化機(jī)更換施工方案
- 湖北省武漢市2024-2025學(xué)年高三2月調(diào)研考試英語試題
- 教科版三年級(jí)下冊科學(xué)全冊同步練習(xí)(一課一練)
- 內(nèi)蒙古機(jī)電職業(yè)技術(shù)學(xué)院單獨(dú)招生(機(jī)電類)考試題(附答案)
- 2025年南京信息職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫參考答案
- 2025年度共享辦公空間轉(zhuǎn)租合作協(xié)議
- 2025年公益項(xiàng)目合作協(xié)議
- 【凱度】2025年生鮮消費(fèi)新趨勢
- 人教版(2024)七下 第二單元第1課《精彩瞬間》課件-七年級(jí)美術(shù)下冊(人教版)
- 2024天津高考英語試題及答案
- 2024中華人民共和國農(nóng)村集體經(jīng)濟(jì)組織法詳細(xì)解讀課件
- 注射用艾司奧美拉唑鈉報(bào)告及中試總結(jié)
評(píng)論
0/150
提交評(píng)論