重復(fù)數(shù)據(jù)處理_第1頁(yè)
重復(fù)數(shù)據(jù)處理_第2頁(yè)
重復(fù)數(shù)據(jù)處理_第3頁(yè)
重復(fù)數(shù)據(jù)處理_第4頁(yè)
重復(fù)數(shù)據(jù)處理_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

主講教師:張?chǎng)握憬?jīng)貿(mào)職業(yè)技術(shù)學(xué)院數(shù)據(jù)采集與處理重復(fù)數(shù)據(jù)處理案例導(dǎo)入重復(fù)數(shù)據(jù)的定義重復(fù)數(shù)據(jù)的查找重復(fù)數(shù)據(jù)的處理010203041、案例導(dǎo)入小明在一家大型的電商企業(yè)做數(shù)據(jù)分析師工作,近期,他接到一個(gè)要分析企業(yè)銷售額為什么會(huì)下降的任務(wù),首先,小明通過外部以及內(nèi)部數(shù)據(jù)采集工具對(duì)銷售相關(guān)數(shù)據(jù)進(jìn)行了采集,但是,他發(fā)現(xiàn)采集得到的數(shù)據(jù)中,有很多條數(shù)據(jù)重復(fù)了,對(duì)此,他要對(duì)重復(fù)數(shù)據(jù)進(jìn)行處理。2、重復(fù)數(shù)據(jù)的定義簡(jiǎn)單來(lái)說(shuō)就是數(shù)據(jù)的值出現(xiàn)了重復(fù),在數(shù)據(jù)庫(kù)中,屬性值相同的記錄被認(rèn)為是重復(fù)記錄。要從海量的數(shù)據(jù)中,一下子找到重復(fù)數(shù)據(jù)并不是一件容易的事,下面,我們使用EXCEL軟件為大家演示一下如何使用軟件查找重復(fù)數(shù)據(jù)。3、重復(fù)數(shù)據(jù)的查找我們來(lái)看,這是一張商品銷售表,總共有兩列,一列是商品的ID,一列是商品銷售數(shù)量:有什么不同?3、重復(fù)數(shù)據(jù)的查找(1)使用函數(shù)這里我們主要用到的是COUNTIF(range,criterial)條件計(jì)數(shù)函數(shù)。這個(gè)函數(shù)比較簡(jiǎn)單,在使用時(shí)主要用到兩個(gè)參數(shù)。一個(gè)參數(shù)是range,一個(gè)參數(shù)是criterialRange是指要計(jì)數(shù)的單元格范圍Criterial是指要計(jì)數(shù)的條件3、重復(fù)數(shù)據(jù)的查找(1)使用函數(shù)首先,我們?cè)贒2單元格中輸入函數(shù):=COUNTIF($A$2:$A$15,A2),然后下拉至D15。3、重復(fù)數(shù)據(jù)的查找(1)使用函數(shù)然后我們便可以看出,重復(fù)的商品ID的計(jì)數(shù)變成了3,沒有重復(fù)的還是1。通過這種方式,我們便可以很快找到重復(fù)的單元格數(shù)據(jù)以及重復(fù)的次數(shù)和位置。3、重復(fù)數(shù)據(jù)的查找(2)條件格式首先選中所要查詢的列,然后在【開始】功能區(qū)找到【條件格式】,然后在【突出顯示單元格規(guī)則】下找到【重復(fù)值】。3、重復(fù)數(shù)據(jù)的查找(2)條件格式對(duì)重復(fù)值的單元格設(shè)置格式,這里選擇默認(rèn)為:淺紅填充色深紅色文本。點(diǎn)擊確定后我們可以看到如下效果:3、重復(fù)數(shù)據(jù)的查找(3)數(shù)據(jù)透視表Excel中的數(shù)據(jù)透視表功能非常強(qiáng)大,我們可以通過數(shù)據(jù)透視表來(lái)進(jìn)行重復(fù)值的查找,在【插入】功能選項(xiàng)卡中,我們插入一個(gè)數(shù)據(jù)透視表3、重復(fù)數(shù)據(jù)的查找(3)數(shù)據(jù)透視表然后我們將商品ID分別加入到行標(biāo)簽和數(shù)值中(圖左),然后我們可以看到數(shù)據(jù)透視表(圖右)中A023221的計(jì)數(shù)是3,意味著該值重復(fù)了三次。3、重復(fù)數(shù)據(jù)的查找是不是非常簡(jiǎn)單,重復(fù)數(shù)據(jù)被找到了,接下來(lái)該怎么進(jìn)行操作呢?4、重復(fù)數(shù)據(jù)的處理通常的操作方法:合并或者清除。通過判斷記錄間的屬性值是否相等來(lái)檢測(cè)記錄是否相等,相等的記錄合并為一條記錄,并將重復(fù)的數(shù)據(jù)進(jìn)行清除。4、重復(fù)數(shù)據(jù)的處理在Excel中,有一個(gè)功能可以幫我們快速實(shí)現(xiàn)重復(fù)值的刪除。就在Excel【數(shù)據(jù)】功能選項(xiàng)卡下面,有一個(gè)【刪除重復(fù)項(xiàng)】選項(xiàng)。首先我們選中A

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論