版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
電子商務(wù)數(shù)據(jù)分析(慕課版)項(xiàng)目二
采集與處理電子商務(wù)數(shù)據(jù)
任務(wù)一采集電子商務(wù)數(shù)據(jù)任務(wù)二處理采集的電子商務(wù)數(shù)據(jù)同步實(shí)訓(xùn)活動(dòng)一初識(shí)電子商務(wù)數(shù)據(jù)采集3橋梁上的壓力傳感器數(shù)據(jù)采集簡(jiǎn)單來(lái)說(shuō)就是收集和獲取數(shù)據(jù)的過(guò)程。電子商務(wù)數(shù)據(jù)的采集過(guò)程更加方便,只需通過(guò)各種渠道獲得相關(guān)的數(shù)據(jù),然后將其整理到Excel、PowerBI等分析工具中即可?;顒?dòng)一初識(shí)電子商務(wù)數(shù)據(jù)采集4(1)電子商務(wù)數(shù)據(jù)采集的原則采集環(huán)節(jié)得到的數(shù)據(jù)能否為分析環(huán)節(jié)所用,關(guān)鍵在于采集數(shù)據(jù)時(shí)是否遵循以下原則。精確性及時(shí)性合法性(2)電子商務(wù)數(shù)據(jù)采集的渠道電子商務(wù)數(shù)據(jù)的采集渠道較多,為了便于學(xué)習(xí),可以按照不同的數(shù)據(jù)來(lái)劃分。0102內(nèi)部數(shù)據(jù)的采集渠道外部數(shù)據(jù)的采集渠道國(guó)家統(tǒng)計(jì)局、艾瑞咨詢、生意參謀活動(dòng)二明確電子商務(wù)數(shù)據(jù)采集的方法與工具5(1)電子商務(wù)數(shù)據(jù)采集的方法對(duì)于內(nèi)部數(shù)據(jù)而言,采集時(shí)只需從數(shù)據(jù)庫(kù)中復(fù)制或調(diào)用到數(shù)據(jù)分析工具中就可以使用;對(duì)于外部實(shí)地調(diào)查的數(shù)據(jù)而言,如果是紙質(zhì)問(wèn)卷調(diào)查表,則需要通過(guò)掃描或手工錄入的方式獲取數(shù)據(jù),如果是電子問(wèn)卷調(diào)查表,則可以復(fù)制其中的數(shù)據(jù)到分析工具中;對(duì)于外部網(wǎng)絡(luò)數(shù)據(jù),主要的獲取方法則是復(fù)制、下載和爬取3種。通過(guò)下載的方式采集數(shù)據(jù)招聘信息頁(yè)面活動(dòng)二明確電子商務(wù)數(shù)據(jù)采集的方法與工具6(2)電子商務(wù)數(shù)據(jù)采集的工具利用生意參謀采集數(shù)據(jù)利用京東商智采集數(shù)據(jù)利用店偵探采集數(shù)據(jù)利用八爪魚采集器采集數(shù)據(jù)利用火車采集器采集數(shù)據(jù)活動(dòng)三手動(dòng)采集電子商務(wù)數(shù)據(jù)7(2)企業(yè)與企業(yè)之間的電子商務(wù)手動(dòng)采集電子商務(wù)數(shù)據(jù)是指通過(guò)復(fù)制、下載等方式獲取需要的數(shù)據(jù)。查看店鋪商品的類別分布情況導(dǎo)出數(shù)據(jù)活動(dòng)三手動(dòng)采集電子商務(wù)數(shù)據(jù)8(2)企業(yè)與企業(yè)之間的電子商務(wù)下載數(shù)據(jù)查看采集的數(shù)據(jù)活動(dòng)四使用工具采集電子商務(wù)數(shù)據(jù)9在八爪魚采集器中對(duì)采集任務(wù)進(jìn)行了適當(dāng)設(shè)置,然后開始采集所需的數(shù)據(jù)。(1)采集設(shè)置設(shè)置并保存采集任務(wù)選擇采集方式活動(dòng)四使用工具采集電子商務(wù)數(shù)據(jù)10開始自動(dòng)識(shí)別網(wǎng)頁(yè)數(shù)據(jù)顯示采集的數(shù)據(jù)效果取消自動(dòng)識(shí)別并獲取登錄信息活動(dòng)四使用工具采集電子商務(wù)數(shù)據(jù)11(2)采集數(shù)據(jù)采用本地采集模式保存設(shè)置并開始采集停止采集正在采集數(shù)據(jù)活動(dòng)四使用工具采集電子商務(wù)數(shù)據(jù)12去重?cái)?shù)據(jù)導(dǎo)出數(shù)據(jù)設(shè)置保存名稱和位置設(shè)置導(dǎo)出類型任務(wù)一采集電子商務(wù)數(shù)據(jù)任務(wù)二處理采集的電子商務(wù)數(shù)據(jù)同步實(shí)訓(xùn)活動(dòng)一認(rèn)識(shí)數(shù)據(jù)分類與處理14數(shù)據(jù)分類與處理在電子商務(wù)數(shù)據(jù)分析中起著承上啟下的作用,它可以提升并優(yōu)化采集到的數(shù)據(jù)的價(jià)值,可以為數(shù)據(jù)分析提供更加精準(zhǔn)的數(shù)據(jù)信息,可以簡(jiǎn)化數(shù)據(jù)分析的工作內(nèi)容。54321客觀性原則針對(duì)性原則便捷性原則完整性原則嚴(yán)謹(jǐn)性原則活動(dòng)二分類統(tǒng)計(jì)數(shù)據(jù)15(1)分類匯總利用Excel的分類匯總功能匯總上周不同流量來(lái)源的支付總額,其具體操作如下。排列數(shù)據(jù)設(shè)置分類匯總數(shù)據(jù)分類統(tǒng)計(jì)是根據(jù)統(tǒng)計(jì)目的將采集到的原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)歸類。查看匯總結(jié)果活動(dòng)二分類統(tǒng)計(jì)數(shù)據(jù)16(2)合并計(jì)算使用合并計(jì)算功能按不同流量來(lái)源統(tǒng)計(jì)兩周各個(gè)指標(biāo)的數(shù)據(jù)結(jié)果,其具體操作如下。添加數(shù)據(jù)區(qū)域引用數(shù)據(jù)區(qū)域設(shè)置標(biāo)簽位置完成合并計(jì)算活動(dòng)二分類統(tǒng)計(jì)數(shù)據(jù)17(3)函數(shù)的應(yīng)用函數(shù)是Excel預(yù)先定義的特定計(jì)算公式,它通過(guò)使用指定格式的參數(shù)來(lái)完成數(shù)據(jù)計(jì)算。函數(shù)與公式都必須以等號(hào)“=”開始,后面緊跟函數(shù)名以及對(duì)應(yīng)的用小括號(hào)包括的參數(shù)。函數(shù)與公式的結(jié)構(gòu)在編輯欄中輸入函數(shù)選擇函數(shù)活動(dòng)二分類統(tǒng)計(jì)數(shù)據(jù)18利用求和函數(shù)、條件求和函數(shù)、求平均值函數(shù)、計(jì)數(shù)函數(shù)、條件計(jì)數(shù)函數(shù)、求最大值函數(shù)和求最小值函數(shù),來(lái)完成對(duì)店鋪數(shù)據(jù)的統(tǒng)計(jì),其具體操作如下。統(tǒng)計(jì)交易總額選擇函數(shù)設(shè)置函數(shù)參數(shù)活動(dòng)二分類統(tǒng)計(jì)數(shù)據(jù)19統(tǒng)計(jì)訂單交易數(shù)量為1件的交易總額統(tǒng)計(jì)平均交易額設(shè)置函數(shù)參數(shù)選擇參數(shù)統(tǒng)計(jì)訂單交易數(shù)量活動(dòng)二分類統(tǒng)計(jì)數(shù)據(jù)20統(tǒng)計(jì)交易金額大于100元的訂單數(shù)統(tǒng)計(jì)訂單最小交易金額統(tǒng)計(jì)訂單最大交易金額活動(dòng)二分類統(tǒng)計(jì)數(shù)據(jù)21(4)數(shù)據(jù)透視表的應(yīng)用數(shù)據(jù)透視表可以對(duì)數(shù)據(jù)進(jìn)行匯總、篩選和重組,快速生成簡(jiǎn)潔清晰的匯總報(bào)表,并能隨時(shí)調(diào)整報(bào)表內(nèi)容,可以幫助我們更好地理解和分析數(shù)據(jù)。其具體操作如下。創(chuàng)建數(shù)據(jù)透視表全年不同類目商品的銷售額統(tǒng)計(jì)活動(dòng)二分類統(tǒng)計(jì)數(shù)據(jù)22篩選數(shù)據(jù)各類目上半年的銷量統(tǒng)計(jì)活動(dòng)三清洗數(shù)據(jù)23定位空值(1)處理缺失值當(dāng)采集的數(shù)據(jù)中存在缺失值時(shí),應(yīng)根據(jù)實(shí)際情況選擇不同的方式進(jìn)行處理。修補(bǔ)缺失值刪除缺失值修補(bǔ)缺失的數(shù)據(jù),其具體操作如下。補(bǔ)全空值活動(dòng)三清洗數(shù)據(jù)24(2)修復(fù)錯(cuò)誤值Excel會(huì)顯示錯(cuò)誤信息,以提醒用戶及時(shí)修復(fù)錯(cuò)誤值,通過(guò)這些信息就能知道錯(cuò)誤產(chǎn)生的原因,以便解決錯(cuò)誤。Excel常見錯(cuò)誤信息匯總活動(dòng)三清洗數(shù)據(jù)25輸入公式修復(fù)錯(cuò)誤值活動(dòng)三清洗數(shù)據(jù)26設(shè)置日期格式(3)統(tǒng)一數(shù)據(jù)格式統(tǒng)一數(shù)據(jù)格式可以有效提高所采集數(shù)據(jù)的質(zhì)量。在Excel中,可以利用數(shù)據(jù)類型設(shè)置和查找與替換功能來(lái)統(tǒng)一數(shù)據(jù)格式,其具體操作如下。查找并替換數(shù)據(jù)1查找并替換數(shù)據(jù)2活動(dòng)三清洗數(shù)據(jù)27(4)修復(fù)邏輯錯(cuò)誤數(shù)據(jù)的邏輯錯(cuò)誤主要是指違反了邏輯規(guī)律產(chǎn)生的錯(cuò)誤,這需要數(shù)據(jù)分析人員具備認(rèn)真細(xì)致的工作態(tài)度和可靠的專業(yè)知識(shí),才能更容易地找到邏輯問(wèn)題??傮w而言,數(shù)據(jù)出現(xiàn)的邏輯錯(cuò)誤主要有3種常見情況。01PRAT02PRAT03PRAT數(shù)據(jù)不合理數(shù)據(jù)自相矛盾數(shù)據(jù)不符合規(guī)則活動(dòng)三清洗數(shù)據(jù)28設(shè)置規(guī)則設(shè)置標(biāo)記格式標(biāo)記出的邏輯錯(cuò)誤數(shù)據(jù)以店鋪流量數(shù)據(jù)為例,通過(guò)標(biāo)記店鋪來(lái)訪數(shù)據(jù)中的店內(nèi)跳轉(zhuǎn)人數(shù)和跳出本店人數(shù)給小艾介紹條件格式功能的示意方法,其具體操作如下:活動(dòng)三清洗數(shù)據(jù)29(5)清洗重復(fù)數(shù)據(jù)當(dāng)采集的數(shù)據(jù)量較大時(shí),可以利用Excel的刪除重復(fù)值功能,去掉數(shù)據(jù)中可能存在的重復(fù)記錄,其具體操作如下。設(shè)置檢查的字段檢查并刪除重復(fù)數(shù)據(jù)活動(dòng)四轉(zhuǎn)化數(shù)據(jù)30(1)轉(zhuǎn)換數(shù)據(jù)行與列數(shù)據(jù)行列的轉(zhuǎn)換在Excel中稱為“轉(zhuǎn)置”,指的是將原來(lái)各條數(shù)據(jù)記錄的首列內(nèi)容轉(zhuǎn)置為數(shù)據(jù)的各個(gè)項(xiàng)目,將原來(lái)的各個(gè)項(xiàng)目轉(zhuǎn)置為數(shù)據(jù)記錄的首列內(nèi)容,從而實(shí)現(xiàn)將當(dāng)前各列內(nèi)容轉(zhuǎn)置為橫向的各條數(shù)據(jù)記錄。在Excel中可以直接使用選擇性粘貼功能來(lái)完成轉(zhuǎn)換,其具體操作如下。檢查并刪除重復(fù)數(shù)據(jù)數(shù)據(jù)需要進(jìn)行一定的轉(zhuǎn)化,如行列數(shù)據(jù)互換、數(shù)據(jù)內(nèi)容提取、數(shù)據(jù)分列顯示、數(shù)據(jù)重新排列等,這些情況同樣可以在Excel中加以解決。活動(dòng)四轉(zhuǎn)化數(shù)據(jù)31刪除原有數(shù)據(jù)轉(zhuǎn)換行與列后的效果活動(dòng)四轉(zhuǎn)化數(shù)據(jù)32(2)提取數(shù)據(jù)內(nèi)容通過(guò)數(shù)據(jù)提取操作,可以將采集到的數(shù)據(jù)中有用的部分提取出來(lái)。在Excel中可以使用LEFT函數(shù)、MID函數(shù)和RIGHT函數(shù)來(lái)實(shí)現(xiàn)數(shù)據(jù)提取工作,其具體操作如下。完善數(shù)據(jù)提取數(shù)據(jù)活動(dòng)四轉(zhuǎn)化數(shù)據(jù)33(3)分列數(shù)據(jù)在Excel中可以將指定的列按某種符號(hào)或特定的寬度進(jìn)行分隔,將其分成若干列,這需要利用Excel的“分列”功能,并根據(jù)“文本分列向?qū)А睂?duì)話框的提示處理。現(xiàn)將“搜索值屬性”列分為“搜索指”列和“屬性”列,其具體操作如下。設(shè)置分列方式分列后的效果指定分列位置活動(dòng)四轉(zhuǎn)化數(shù)據(jù)34(4)排列數(shù)據(jù)為了更好地分析采集到的數(shù)據(jù),有時(shí)需要對(duì)數(shù)據(jù)重新排列,如查看銷量較好的商品數(shù)據(jù),查看投訴較多的客服人員數(shù)據(jù)等。Excel提供有多種排列數(shù)據(jù)的方法,包括快速排序、關(guān)鍵字排序、自定義排序等,以便滿足實(shí)際工作中數(shù)據(jù)排列的需求。關(guān)鍵字排序的設(shè)置界面添加排序依據(jù)活動(dòng)四轉(zhuǎn)化數(shù)據(jù)35設(shè)置排序主要關(guān)鍵字排序后的效果設(shè)置排序次要關(guān)鍵字活動(dòng)五計(jì)算數(shù)據(jù)36(1)常規(guī)計(jì)算常規(guī)計(jì)算包括公式計(jì)算與函數(shù)計(jì)算,大多數(shù)的電子商務(wù)數(shù)據(jù)均可通過(guò)常規(guī)計(jì)算完成。Excel的公式結(jié)構(gòu)如果公式中含有單元格引用,則移動(dòng)、復(fù)制公式時(shí)會(huì)涉及單元格引用的問(wèn)題?;旌弦媒^對(duì)引用相對(duì)引用活動(dòng)五計(jì)算數(shù)據(jù)37將幾個(gè)門店上半年的銷售與投入數(shù)據(jù)采集下來(lái),使用公式計(jì)算各門店上半年的銷售總額與投入產(chǎn)出比,其具體操作如下。輸入公式計(jì)算銷售總額活動(dòng)五計(jì)算數(shù)據(jù)38輸入公式計(jì)算投入產(chǎn)出比活動(dòng)五計(jì)算數(shù)據(jù)39(2)日期計(jì)算日期計(jì)算在電子商務(wù)數(shù)據(jù)處理中也較為常見,借助Excel中的日期函數(shù)解決該問(wèn)題。DAYS函數(shù)DATEDIF函數(shù)TODAY函數(shù)在Excel中計(jì)算這些客戶下單的間隔天數(shù)和月數(shù),其具體操作如下。輸入函數(shù)計(jì)算間隔天數(shù)輸入函數(shù)計(jì)算間隔月數(shù)活動(dòng)五計(jì)算數(shù)據(jù)40(3)加權(quán)計(jì)算加權(quán)計(jì)算需要在數(shù)據(jù)的基礎(chǔ)上與權(quán)重(即系數(shù))相乘,這也是電子商務(wù)數(shù)據(jù)計(jì)算中常見的操作。在Excel中可以借助SUMPRODUCT函數(shù)來(lái)進(jìn)行加權(quán)計(jì)算,利用SUMPRODUCT函數(shù)對(duì)各渠道進(jìn)行評(píng)分計(jì)算,其具體操作如下。輸入函數(shù)計(jì)算綜合得分活動(dòng)五計(jì)算數(shù)據(jù)41轉(zhuǎn)化為絕對(duì)引用填充函數(shù)任務(wù)一采集電子商務(wù)數(shù)據(jù)任務(wù)二處理采集的電子商務(wù)數(shù)據(jù)同步實(shí)訓(xùn)同步實(shí)訓(xùn)一
采集男裝休閑褲數(shù)據(jù)43小宇想在京東商城開設(shè)一家專賣男裝休閑褲的店鋪,為更好地了解京東商城銷量較好的休閑褲及其價(jià)格,他準(zhǔn)備使用八爪魚采集器采集京東商城上的一些相關(guān)商品數(shù)據(jù)。實(shí)訓(xùn)描述同步實(shí)訓(xùn)一
采集男裝休閑褲數(shù)據(jù)44操作指南復(fù)制網(wǎng)址生成采集設(shè)置保存并開始采集同步實(shí)訓(xùn)一
采集男裝休閑褲數(shù)據(jù)45停止采集導(dǎo)出數(shù)據(jù)保存數(shù)據(jù)文件選擇導(dǎo)出類型同步實(shí)訓(xùn)一采集男裝休閑褲數(shù)據(jù)46實(shí)訓(xùn)評(píng)價(jià)同步實(shí)訓(xùn)二
處理采集到的數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024出版發(fā)行委托合同
- 2024年工程保修責(zé)任合同
- 2024年工程造價(jià)咨詢合同范本
- 04學(xué)校實(shí)驗(yàn)室搬遷及安裝合同
- 2024大型無(wú)人機(jī)制造與商業(yè)應(yīng)用合同
- 2024醫(yī)院信息化管理系統(tǒng)定制合同
- 2024年園林綠化工程承攬協(xié)議
- 2024年安全門安裝標(biāo)準(zhǔn)合同
- 2023年文山州硯山縣阿猛中心衛(wèi)生院招聘考試真題
- 2024年大宗貨物長(zhǎng)途運(yùn)輸協(xié)議
- 人教部編版語(yǔ)文八年級(jí)上冊(cè)第六單元 第26課 詩(shī)詞五首(教材解讀)
- 湖北省武漢市漢陽(yáng)區(qū)2023-2024學(xué)年九年級(jí)上學(xué)期期中考試英語(yǔ)試卷
- 智慧教育發(fā)展趨勢(shì)智慧課堂
- 大酒店勞務(wù)派遣服務(wù)專項(xiàng)方案
- 醫(yī)院培訓(xùn)課件:《病室環(huán)境管理》
- 中國(guó)感染性休克指南
- 2021年初中部漢語(yǔ)聽寫大賽題庫(kù)
- 大數(shù)據(jù)治理與服務(wù)管理解決數(shù)據(jù)孤島問(wèn)題的關(guān)鍵措施
- 帶電作業(yè)規(guī)程課件
- 建筑工程《擬投入本項(xiàng)目的主要施工設(shè)備表及試驗(yàn)檢測(cè)儀器設(shè)備表》
- 三年級(jí)上冊(cè)數(shù)學(xué)估算練習(xí)200題及答案
評(píng)論
0/150
提交評(píng)論