版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)采集與處理
重復(fù)值清洗數(shù)據(jù)采集與處理課程教學(xué)團(tuán)隊(duì)識(shí)別重復(fù)數(shù)據(jù)刪除重復(fù)數(shù)據(jù)(1)函數(shù)法(2)高級(jí)篩選法(3)條件格式法(4)數(shù)據(jù)透視法(1)通過菜單刪除重復(fù)項(xiàng)(2)通過排序刪除重復(fù)項(xiàng)(3)通過篩選刪除重復(fù)項(xiàng)(4)通過Powerquery刪除重復(fù)項(xiàng)識(shí)別重復(fù)數(shù)據(jù)(1)函數(shù)法函數(shù):=countif(范圍,條件)可以看出在列字段為A的范圍內(nèi),“男”重復(fù)4次,“女”重復(fù)4次。識(shí)別重復(fù)數(shù)據(jù)在countif函數(shù)中調(diào)節(jié)范圍即可:=COUNTIF(A$2:A2,A2)----------A$2固定從A列的第二行開始,A2會(huì)變動(dòng),下拉時(shí)會(huì)變成A3,A4,A5...;||A$2:Ai:范圍從A的第2行到第i行??梢訡2:男出現(xiàn)一次,C3:當(dāng)下,男出現(xiàn)2次,C4:自此,男出現(xiàn)3次。C5:女第一次出現(xiàn),C6:自此,女出現(xiàn)兩次了。識(shí)別重復(fù)數(shù)據(jù)該函數(shù)的語(yǔ)法規(guī)則如下:countif(range,criteria)參數(shù):range要計(jì)算其中非空單元格數(shù)目的區(qū)域參數(shù):criteria以數(shù)字、表達(dá)式或文本形式定義的條件用法編輯(1)求真空單元格個(gè)數(shù):=COUNTIF(數(shù)據(jù)區(qū),"=")(2)非真空單元格個(gè)數(shù):=COUNTIF(數(shù)據(jù)區(qū),"<>")相當(dāng)于counta()函數(shù)(3)文本型單元格個(gè)數(shù):=COUNTIF(數(shù)據(jù)區(qū),"*")假空單元格也是文本型單元格(4)區(qū)域內(nèi)所有單元格個(gè)數(shù):=COUNTIF(數(shù)據(jù)區(qū),"<>"""),如果數(shù)據(jù)區(qū)內(nèi)有",該公式不成立.(5)邏輯值為TRUE的單元格數(shù)量=COUNTIF(數(shù)據(jù)區(qū),TRUE)Countif用法識(shí)別重復(fù)數(shù)據(jù)(2)高級(jí)篩選法開始--排序與篩選--篩選(高級(jí))結(jié)果是:為什么會(huì)出現(xiàn)兩個(gè)“男”呢?識(shí)別重復(fù)數(shù)據(jù)第一次做高級(jí)篩選時(shí),沒有表頭,此時(shí)進(jìn)行,會(huì)將第一個(gè)單元格的內(nèi)容作為表頭一起復(fù)制過去。識(shí)別重復(fù)數(shù)據(jù)(3)條件格式法選擇區(qū)域--開始--條件格式--重復(fù)值選擇自己需要的標(biāo)識(shí)方式。選第一種,可以看到,有重復(fù)的標(biāo)紅了。識(shí)別重復(fù)數(shù)據(jù)(4)數(shù)據(jù)透視法插入--數(shù)據(jù)透視表--創(chuàng)建數(shù)據(jù)透視表:選擇用的區(qū)域和透視表放置區(qū)域---設(shè)置透視表:把表頭拖到行和列的字段選擇在當(dāng)前的工作表匯總匯總透視表識(shí)別重復(fù)數(shù)據(jù)透視表框架出現(xiàn)在框架的最右邊,可以設(shè)置透視表的行、列字段。將行字段設(shè)置為表頭對(duì)應(yīng)的內(nèi)容,不難看出,每行的字段將為:男、女和未知。將列字段設(shè)置為表頭的內(nèi)容,列字段對(duì)應(yīng)的是計(jì)數(shù)項(xiàng),所以內(nèi)容應(yīng)為男、女和未知對(duì)應(yīng)的個(gè)數(shù)。識(shí)別重復(fù)數(shù)據(jù)數(shù)據(jù)透視表創(chuàng)建成功:可以看出:“男”的重復(fù)個(gè)數(shù)為4,“女”的重復(fù)個(gè)數(shù)為14,“未知”的為1,總個(gè)數(shù)為19.識(shí)別重復(fù)數(shù)據(jù)數(shù)據(jù)透視表創(chuàng)建成功:可以看出:“男”的重復(fù)個(gè)數(shù)為4,“女”的重復(fù)個(gè)數(shù)為14,“未知”的為1,總個(gè)數(shù)為19.識(shí)別重復(fù)數(shù)據(jù)函數(shù)法:根據(jù)范圍選擇不同,可以看到重復(fù)的個(gè)數(shù),也可以得到這是第幾個(gè)重復(fù)值。高級(jí)篩選法:將多余的去除,只留下唯一一個(gè)。條件格式法:將有重復(fù)項(xiàng)的標(biāo)記,可以直觀看出哪些有重復(fù)項(xiàng)。缺點(diǎn)是只能看到該內(nèi)容是重復(fù)的,不能區(qū)分不同的內(nèi)容的重復(fù)項(xiàng)。但可以靈活運(yùn)用,如果重復(fù)項(xiàng)過多,將條件設(shè)為找唯一項(xiàng),可以很快找唯一項(xiàng)也不錯(cuò)。數(shù)據(jù)透視法:將計(jì)算重復(fù)項(xiàng)這個(gè)工作直接做成表格,可以直觀看到每個(gè)字段的重復(fù)個(gè)數(shù)??偨Y(jié):刪除重復(fù)數(shù)據(jù)數(shù)據(jù)--數(shù)據(jù)工具--刪除重復(fù)項(xiàng)可包括表頭,共有20行,表頭還是作為表頭,內(nèi)容為19個(gè),結(jié)果是刪除了16個(gè)重復(fù)值,留下了唯一值:男、女、和未知。(高級(jí)篩選法也可以有這個(gè)效果)(1)通過菜單刪除重復(fù)項(xiàng)刪除重復(fù)數(shù)據(jù)排序--刪除(2)通過排序刪除重復(fù)項(xiàng)對(duì)第一列,也就是我們想刪除重復(fù)項(xiàng)的內(nèi)容排序,將相同內(nèi)容放在一起,通過countif,標(biāo)記每個(gè)內(nèi)容是第幾個(gè)重復(fù)值,這幾個(gè)重復(fù)值就是我們所需的第一列排序的效果是,女全在前面,男全在后面,countif的結(jié)果排序,效果是女列或者男這列,它們按屬于第幾個(gè)重復(fù)值排好序刪除重復(fù)數(shù)據(jù)
刪除大于1的
;同理刪除“女”的大于1的刪除重復(fù)數(shù)據(jù)countif排序---排序--篩選--刪除重復(fù)項(xiàng)(3)通過篩選刪除重復(fù)項(xiàng)具體如下:通過countif,標(biāo)記每個(gè)內(nèi)容是第幾個(gè)重復(fù)值,這幾個(gè)重復(fù)值就是我們所需的數(shù)據(jù)--排序和篩選:排序點(diǎn)擊排序,出現(xiàn)下拉格刪除重復(fù)數(shù)據(jù)因?yàn)榭康谌凶龊Y選,所以點(diǎn)擊第三列下拉框,會(huì)出現(xiàn)下面選項(xiàng),把除了1以外的全部去掉留下的就是唯一的了,把灰色篩選那個(gè)點(diǎn)一下,就變成不是灰色了,結(jié)果就出來(lái)了。刪除重復(fù)數(shù)據(jù)數(shù)據(jù)---從表格—Powerquery編輯器(4)通過powerquery刪除重復(fù)項(xiàng)選擇“區(qū)域”列,刪除重復(fù)項(xiàng)刪除重復(fù)數(shù)據(jù)通過菜單刪除重復(fù)項(xiàng):快
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年消防器材智能化改造升級(jí)服務(wù)合同2篇
- 2024租賃合同簽訂程序及條件
- 2025年拓展訓(xùn)練合同范本大全:企業(yè)團(tuán)隊(duì)凝聚力提升計(jì)劃3篇
- 二零二四年度2024年三人健身產(chǎn)業(yè)合作合同6篇
- 2025年洗車場(chǎng)車輛停放管理及承包合同3篇
- 2025版航空航天專用鋁合金采購(gòu)合同書4篇
- 二零二四年云服務(wù)器租賃與智能運(yùn)維合同3篇
- 個(gè)人汽車租賃合同樣本 2024年版版B版
- 2025年度臨時(shí)臨時(shí)設(shè)施租賃合同標(biāo)準(zhǔn)范本4篇
- 2025年無(wú)償使用政府辦公樓場(chǎng)地舉辦會(huì)議合同范本3篇
- 非誠(chéng)不找小品臺(tái)詞
- 2024年3月江蘇省考公務(wù)員面試題(B類)及參考答案
- 患者信息保密法律法規(guī)解讀
- 老年人護(hù)理風(fēng)險(xiǎn)防控PPT
- 充電樁采購(gòu)安裝投標(biāo)方案(技術(shù)方案)
- 醫(yī)院科室考勤表
- 鍍膜員工述職報(bào)告
- 春節(jié)期間化工企業(yè)安全生產(chǎn)注意安全生產(chǎn)
- 保險(xiǎn)行業(yè)加強(qiáng)清廉文化建設(shè)
- Hive數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與應(yīng)用
- 數(shù)字的秘密生活:最有趣的50個(gè)數(shù)學(xué)故事
評(píng)論
0/150
提交評(píng)論