清洗字段類型錯誤_第1頁
清洗字段類型錯誤_第2頁
清洗字段類型錯誤_第3頁
清洗字段類型錯誤_第4頁
清洗字段類型錯誤_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

主講教師:羅倩倩無錫商業(yè)職業(yè)技術(shù)學院數(shù)據(jù)可視化清洗字段類型錯誤數(shù)據(jù)清洗必要性“價格”字段清洗“評價數(shù)”字段清洗010203

在Excel中,由于對單元格并不存在嚴格的類型限制,有可能出現(xiàn)字段類型錯誤,例如:將“價格”、“數(shù)量”等數(shù)值類型的數(shù)據(jù)以文本類型進行存放。因此,在數(shù)據(jù)統(tǒng)計分析前需要將這些字段進行相應的轉(zhuǎn)換。下面我們以“手機采集原始數(shù)據(jù).xlsx”為例,來對數(shù)據(jù)源中的字段類型錯誤進行處理。清洗字段類型錯誤的必要性

打開Tableau,連接“MicrosoftExcel”數(shù)據(jù)源,選擇“手機采集原始數(shù)據(jù).xlsx”文件并打開,如圖所示,“價格”字段上方為文本類型“Abc”標識符。當需要求各類型手機的平均價格時,就無法對該字段進行數(shù)值統(tǒng)計。“價格”字段清洗

“價格”字段清洗

Tableau中使用計算字段可以將價格轉(zhuǎn)換成數(shù)值類型,在圖2-6的“價格”字段名上右擊鼠標,在彈出的快捷菜單中選擇“重命名”,圖如2-7所示,將“價格”重命名為“_價格”。右擊“_價格”字段后彈出快捷菜單如圖2-8所示,選擇“創(chuàng)建計算字段”,打開計算字段編輯界面,如圖2-9所示,在編輯區(qū)輸入公式:float([_價格]),即可以將字符型轉(zhuǎn)換成數(shù)值型。

“價格”字段清洗轉(zhuǎn)換后的結(jié)果如圖所示,“價格”字段前原來的“Abc”字符串符合變成了數(shù)值型“#”符號?!霸u價數(shù)”字段清洗

現(xiàn)在來觀察一下“評價數(shù)”這個字段,它的轉(zhuǎn)換比較復雜,因為評價數(shù)位于兩個括號中間,后面有“+”號,而且超過1萬的評價數(shù),還使用“1.3萬”這樣的表示方式。這個復雜的例子需要用到更多的字符串函數(shù)。首先,將“評價數(shù)”重命名為“_評價數(shù)”。接下來,使用字符串函數(shù)截取中間的數(shù)字部分。處理公式是:REPLACE(mid([_評價數(shù)],FIND([_評價數(shù)],'(')+1,FIND([_評價數(shù)],')')-FIND([_評價數(shù)],'(')-1),'+','')“評價數(shù)”字段清洗

有了字符串處理公式,我們創(chuàng)建一個“評價_1”的計算字段,在編輯區(qū)輸入上面的字符串處理公式,如圖所示。最后,原始評價字段中的數(shù)字部分全部截取成功。

但是,計算字段“_評價1”,仍然是字符串,而且由于評價數(shù)高于1萬的,顯示“xx萬”這種樣式,所以還需要高于1萬的進行判斷,轉(zhuǎn)換后再計算,低于1萬則直接進行類型轉(zhuǎn)換。這個計算字段需要邏輯函數(shù)的參與。因此,在“_評價1”字段上,需要設計下面的輸入公式:IFENDSWITH([評價_1],'萬')THENFLOAT(LEFT([評價_1],FIND([評價_1],'萬')-1))*10000ELSEFLOAT([評價_1])END“評價

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論