版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、目錄模式筆記模式本周進入課程的最后一部分數(shù)據(jù)分析項目實戰(zhàn),在這一節(jié)中我們將綜合運用前五周所學知識和技能完成數(shù)據(jù)分析實戰(zhàn)項目。首先來回顧一下本門課程學習內容與數(shù)據(jù)分析流程的對應關系:在本周的綜合項目一節(jié)中,通過共享單車公司數(shù)據(jù)分析項目案例將學到的知識模塊和技能應用到具體的分析和解決問題中。另外,同學們需要注意!請認真學習綜合項目,并根據(jù)數(shù)據(jù)分析流程及所學知識完成本課程最后一個作業(yè)畢業(yè)設計- 人力數(shù)據(jù)分析。本周導讀(第 1 頁/共 1 頁)作業(yè)目錄模式筆記模式R-markdown是這樣一款,它可以將你所寫的代碼和一些描述性的分析詞語整一個文件,并且以 HTML 或 PDF 等多種形式輸出。本節(jié)課學
2、習 R-Markdown 的使用。請大家認真聽課并且完成思考作業(yè)。問題反饋課間思考作業(yè)請同學們根據(jù)下面的代碼截圖,生成一個與截圖相同的 HTLM 頁面。截圖:上一節(jié)1/1下一節(jié)1. R-markdown (第 1 頁/共 1 頁)作業(yè)上圖中 R 代碼塊的代碼是:希望同學通過本題熟練掌握 dplyr 軟件包的使用方法。注!本題不批改,答案詳見作業(yè)小提示?;卮饘懽鳂I(yè)作業(yè)小提示上一節(jié)1/1下一節(jié)2. dplyr(第 1 頁/共 1 頁)目錄模式筆記模式在數(shù)據(jù)分析工作中,經常需要對原始的數(shù)據(jù)集進行、整理以及變換,例如,特定分析變量的選取、按某一個或幾個變量排序、對原始變量進行處理并生成新的變量等。本章
3、介紹的。dplyr軟件包正是高效完成上述工作的課程示例代碼:【dplyr】示例代碼.zip問題反饋課間思考作業(yè)本周示例數(shù)據(jù):dplyr 示例數(shù)據(jù).zip請同學在本周示例數(shù)據(jù)的基礎上,利用 dplyr 計算得到:2019 年上半年亞洲 各個市場 的總銷售量目標是多少?平均每一個銷售機會需要多高的 單價 才能同時滿足銷售額目標?1.2.請同學們把全部代碼到作業(yè)提交區(qū),并上傳運行結果截圖。希望同學通過本題熟練掌握 dplyr 軟件包的使用方法。注!本題不批改,詳見作業(yè)小提示。作業(yè)回答寫作業(yè)作業(yè)小提示上一節(jié)1/1下一節(jié)3. 數(shù)據(jù)探索工作指導(第 1 頁/共 1 頁)目錄模式筆記模式相信大家一定都還記得
4、我們從第一章就已經在講的數(shù)據(jù)分析全流程圖:在整個流程中,數(shù)據(jù)探索是一個相對更加復雜和靈活的環(huán)節(jié),本周,我們就將專門抽出一個小章節(jié),來展開講“數(shù)據(jù)探索”這個環(huán)節(jié)的內容。相信大家學習完本節(jié)之后,能夠補足這部分的知識并且任務!完成一個完整的數(shù)據(jù)分析工作問題反饋上一節(jié)1/1作業(yè)目錄模式筆記模式恭喜大家已經學完了本門課程中大部分的知識,在這一小節(jié),學的知識完成一個完整的項目。利用已本節(jié)課程中使用的數(shù)據(jù):customer survey data.zip survey score data.zip本節(jié)課程中使用的代碼:Project week7.zip問題反饋在做線性回歸分析時,我們還可以變量之間的相關性來
5、識別多重共線性。我們可以將各個變量之間的相關關系做一個可視化(如下圖所示),同學需要調用軟件包GGally,在這個軟件包中有一個非常好用的函數(shù)ggpairs,用于表示變量之間的相互關系。實現(xiàn)代碼:library(ggplot2) library(GGally)survey.sample.data - read.csv(file=Shared Bike Sample Data - M下一節(jié)4. 綜合項目(第 1 頁/共 1 頁)作業(yè)L.csv)ggpairs(survey.sample.data, columns = c(分數(shù), 組別, 城區(qū), 車齡, 采訪小時, 月收入), 在這張圖中,行和列
6、分別對應于不同的變量名稱,不同變量之間的關系可以用不同的圖形和數(shù)值來表示。紅框內的數(shù)值表示相關系數(shù)(Corr.),相關系 數(shù)的平方即為決定系數(shù) R2。相關系數(shù)和決定系數(shù)都可以用于識別多重共線性。在本數(shù)據(jù)中,我們可以看到計算和車齡的相關系數(shù)為 0.996,基本上接近于 1,所以我們說基于如此高的相關系數(shù)和車齡是兩個強相關的變量。上一節(jié)1/1下一節(jié)目錄模式筆記模式數(shù)據(jù)分析師在完成項目之后,往往需要將項目結果呈現(xiàn)給或者是業(yè)務的同事,這種工作場景下,PPT 展示是一個重要的呈現(xiàn)方式。在本節(jié)內容中, 承接上一部分的的案例,為大家講解如何做 PPT 的呈現(xiàn),以及在這個過程中有哪些需要注意的細節(jié)。問題反饋目
7、錄模式筆記模式上一節(jié)1/1下一節(jié)作業(yè)六數(shù)據(jù)探索作業(yè)(第 1 頁/共 1 頁)作業(yè)5. 項目分析報告 PPT 呈現(xiàn)示例(第 1 頁/共 1 頁)作業(yè)某房地產公司的銷售團隊近期對該公司西湖區(qū)在售。在拿到調研數(shù)據(jù)后,銷售團隊想了解 不同樓型房屋單價的分布情況 以及 房屋單價與其他變量之間的關系。該房地產公司【西湖區(qū)房屋情況】數(shù)據(jù): 數(shù)據(jù)探索項目.zip。在接到需求和數(shù)據(jù)后,數(shù)據(jù)分析師小 A 認為可以使用 R 處理數(shù)據(jù)并進行可視化,展現(xiàn)不同樓型房屋單價的分布情況以及房屋單價與其他變量之間的關系。請同學們作業(yè)數(shù)據(jù),并在 R 中完成本次分析工作。測試一下【單選題】基于房地產數(shù)據(jù)集,以下哪種圖形更適合了解房
8、屋單價和總價的關系?測試一下【單選題】基于房地產數(shù)據(jù)集,如果想了解房屋單價和朝向之間的關系,采用下面哪種圖形更合適呢?測試一下【單選題】基于房地產數(shù)據(jù)集,以下哪種圖形更適合了解房屋總價和掛牌時間之間的關系呢?A 直方圖B 箱型圖C 小提琴圖D 散點圖A 散點圖B 箱型圖C 小提琴圖D 直方圖A 箱型圖B 直方圖C 散點圖D 小提琴圖提交提交課間思考作業(yè)請同學探索該數(shù)據(jù),并完成銷售團隊的需求,展現(xiàn)不同樓型房屋單價的分布情況以及房屋單價與其他變量之間的關系。分析思路提示:步驟 1步驟 2步驟 3 常值; 步驟 4 序; 步驟 5*獲取數(shù)據(jù):查看數(shù)據(jù)的結構、類型;-數(shù)據(jù)數(shù)據(jù):可將“價格(萬元)”、”面積(平米)”變量變?yōu)閿?shù)值型;:預覽數(shù)據(jù)后發(fā)現(xiàn)有異常值,建議剔除輕度異常值和極度異數(shù)據(jù)轉換:使用 dplyr 包創(chuàng)建新變量“單價”,按照“掛牌時間”升序排-數(shù)據(jù)探索(數(shù)據(jù)可視化):可以繪制箱型圖、小提琴圖等展示不同樓型房屋單價的分布情況; 可以通過散點圖展示房屋單價與其他變量之間的關系(比如可探討單-價與面積、掛牌時間、朝向等的關系);步驟 6:數(shù)據(jù)探索(美化圖形):*切分多個子圖;設置散點;設置圖形標題及位置; 修改橫縱坐標;.(其他請參考課程講解)分析呈現(xiàn):根據(jù)可視化結果展開分析,可以從圖形中探索單價分布規(guī)步驟 7 -律、單價與其他變量關系等;完成本次分析后,請同學提交:1、不同樓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國大型振動試驗機行業(yè)市場分析報告
- 2024-2030年中國即時通訊(im)行業(yè)競爭格局及投資創(chuàng)新模式分析報告
- 眉山職業(yè)技術學院《電子商務概論》2023-2024學年第一學期期末試卷
- 2024年度食品代加工與產品質量追溯協(xié)議3篇
- 2024年標準化物業(yè)租賃協(xié)議模板匯編版B版
- 2024年物聯(lián)網(wǎng)農業(yè)技術開發(fā)與合作合同
- 2024年標準股權轉讓協(xié)議一
- 馬鞍山師范高等??茖W?!冬F(xiàn)場節(jié)目主持實踐》2023-2024學年第一學期期末試卷
- 2024年城市綜合體土地房屋股權轉讓與建設合同范本3篇
- 2024年度特色民宿商品房承包銷售合同3篇
- YY/T 0251-1997微量青霉素試驗方法
- YC/T 559-2018煙草特征性成分生物堿的測定氣相色譜-質譜聯(lián)用法和氣相色譜-串聯(lián)質譜法
- GB/T 29309-2012電工電子產品加速應力試驗規(guī)程高加速壽命試驗導則
- 齊魯工業(yè)大學信息管理學成考復習資料
- 公務員面試-自我認知與職位匹配課件
- 中頻電治療儀操作培訓課件
- 柔弱的人課文課件
- 動物寄生蟲病學課件
- 電梯曳引系統(tǒng)設計-畢業(yè)設計
- 三度房室傳導阻滯護理查房課件
- 講課比賽精品PPT-全概率公式貝葉斯公式-概率論與數(shù)理統(tǒng)計
評論
0/150
提交評論