如何寫好數(shù)據(jù)分析報(bào)告-方法篇_第1頁(yè)
如何寫好數(shù)據(jù)分析報(bào)告-方法篇_第2頁(yè)
如何寫好數(shù)據(jù)分析報(bào)告-方法篇_第3頁(yè)
如何寫好數(shù)據(jù)分析報(bào)告-方法篇_第4頁(yè)
如何寫好數(shù)據(jù)分析報(bào)告-方法篇_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

如何寫一份好的數(shù)據(jù)分析報(bào)告分類(Classify)聚類(Cluster)常用分析算法AB預(yù)測(cè)(Predication)D相關(guān)(Correlation)CK-means、K-medoids回歸、slopeone……貝葉斯、K-NN……Pearson、歐式……在互聯(lián)網(wǎng)的數(shù)據(jù)挖掘中,爬蟲類算法〔深度優(yōu)先、廣度優(yōu)先、最正確優(yōu)先〕也經(jīng)常被用于數(shù)據(jù)采集工作什么是分類?鳥類占50%以上所以把這個(gè)群體定義為鳥什么是聚類?物以類聚什么是相關(guān)?喙相關(guān)性強(qiáng)喙相關(guān)性強(qiáng)喙相關(guān)性弱經(jīng)典算法描述——貝葉斯待分類內(nèi)容拆分關(guān)鍵字分類字庫(kù)分類完成自我學(xué)習(xí)①②③④⑤經(jīng)典算法描述——K-means隨機(jī)選K個(gè)點(diǎn)作為臨時(shí)中心點(diǎn)①把每一個(gè)點(diǎn)配給最近的中心,并計(jì)算新的中心②N次循環(huán)第2步完成最終聚類③經(jīng)典算法描述——slopeone?篩選數(shù)據(jù)源①衡定內(nèi)容間關(guān)系②?≈預(yù)測(cè)結(jié)果③分析常用圖形散點(diǎn)圖善于發(fā)現(xiàn)因果關(guān)系用于探索性數(shù)據(jù)分析目的是探索自變量和因變量之間的關(guān)系直方圖不僅能夠度量被計(jì)量事物的數(shù)目、頻數(shù),還能表達(dá)各個(gè)區(qū)間所代表的整個(gè)數(shù)據(jù)集的百分比雷達(dá)圖善于描述某實(shí)物各個(gè)屬性的強(qiáng)弱分布除此以外,一些組合圖也常用于分析描述,如柱-線圖,柱-餅圖……

年份

XXX普及率1月2月3月4月5月6月7月8月9月10月11月12月2008年74.01%78.45%72.66%72.11%75.64%74.25%73.64%74.42%74.97%73.11%72.51%74.00%2009年79.04%74.91%72.06%71.71%73.34%71.58%73.11%72.50%70.80%71.80%69.27%69.99%2010年71.05%75.31%70.95%69.58%70.50%70.94%71.81%72.22%71.12%69.75%68.18%68.64%2011年69.99%74.08%69.26%

?

案例分析下表為X省XXX普及率,08-10年,及11年1-3月數(shù)據(jù)。從往年數(shù)據(jù)明顯看出,普及率逐年、逐月都在呈下降趨勢(shì),為使11年4月普及率能保持環(huán)比/同比不下降,預(yù)計(jì)需要開展多少0活動(dòng)用戶?確定分解評(píng)估決策普及率開展趨勢(shì)?普及率=?普及率到達(dá)效果?活動(dòng)客戶數(shù)/總客戶數(shù)逐年逐月下降環(huán)比持平〔69.26%〕自問自答確定分解評(píng)估決策

年份

XXX普及率平均1月2月3月4月5月6月7月8月9月10月11月12月2008年74.01%78.45%72.66%72.11%75.64%74.25%73.64%74.42%74.97%73.11%72.51%74.00%74.15%2009年79.04%74.91%72.06%71.71%73.34%71.58%73.11%72.50%70.80%71.80%69.27%69.99%72.51%2010年71.05%75.31%70.95%69.58%70.50%70.94%71.81%72.22%71.12%69.75%68.18%68.64%70.84%2011年69.99%74.08%69.26%

?

平均73.52%75.69%71.23%71.13%73.16%72.26%72.85%73.05%72.30%71.55%69.99%70.88%普及率在2月有大幅提升,處全年最高年均下降1.65%確定分解評(píng)估決策圖表為月平均普及率散點(diǎn)圖,趨勢(shì)線為一次線性回歸擬合線,并通過回歸統(tǒng)計(jì)分析,計(jì)算擬合系數(shù)及調(diào)整擬合系數(shù)均遠(yuǎn)低于標(biāo)準(zhǔn)置信度0.95。因此普及率呈非線性趨勢(shì)。因此試選用slope

one算法,處理個(gè)性化的預(yù)測(cè)分析?;貧w統(tǒng)計(jì)MultipleR0.566194RSquare0.320576AdjustedRSquare-1.22222標(biāo)準(zhǔn)誤差0.013286觀測(cè)值11月2月3月4月5月6月7月8月9月10月11月12月2010真實(shí)71.05%75.31%70.95%69.58%70.50%70.94%71.81%72.22%71.12%69.75%68.18%68.64%2010預(yù)測(cè)73.22%74.50%70.16%69.46%71.59%70.56%71.14%71.31%70.59%69.91%68.34%69.27%經(jīng)評(píng)預(yù)測(cè)平局,10年全年預(yù)測(cè)誤差0.0092,去掉1、2月波動(dòng)后誤差0.0065〔即0.65%〕經(jīng)過SLOPEONE預(yù)測(cè),11年4月普及率=67.97%±0.65%確定分解評(píng)估決策經(jīng)過以上分析及預(yù)測(cè),XX省

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論