版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
項目一
了解商務數據可視化
——認識PowerBI本項目分為兩個部分,分別是商務數據可視化的介紹和商務數據可視化工具MicrosoftPowerBI(以下簡稱PowerBI)的介紹。通過對商務數據可視化的基本情況進行學習,讀者將會了解到商務數據可視化的意義、熟悉PowerBI界面,為將來從事數據可視化與分析工作打下基礎
職業(yè)能力目標
1目錄任務一初識商務數據可視化2任務二認識PowerBI軟件項目一任務一初識商務數據可視化1典型工作任務技術知識儲備商務實戰(zhàn)演練任務一初識商務數據可視化典型工作任務
2018年天貓“雙11”活動除了一直同步跳動最后定格在2135億元的銷售數據讓人們印象深刻,“全球屏”“新零售屏”“城市屏”也備受關注。這種通過技術手段實現實時數據可視化的數據投屏技術讓媒體、消費者與阿里巴巴公司第一次在數據層面實現了信息對稱。從那以后,數據大屏就成為“雙11”活動進行媒體信息發(fā)布不可或缺的一部分。請你根據對商務數據可視化的理解,搜索出1~2個商務數據可視化的案例2典型工作任務技術知識儲備商務實戰(zhàn)演練任務一初識商務數據可視化一、數據可視化在生活中的體現人們在日常生活中,無時無刻不在面對著大量的數據,諸如反映身體健康的體征數據、反映鍛煉強度的步行數據、反映家庭經濟情況的收支數據、反映企業(yè)發(fā)展的銷量數據、反映國家發(fā)展的宏觀經濟數據
“小米運動”中的運動數據
二、數據可視化的意義
(一)數據可視化方便數據的閱讀隨著大數據時代的來臨,海量的數據撲面而來,數據使用者可以更便捷地獲取數據,為進一步分析打下基礎。但是采集后的數據處理與分析卻在一定程度上困擾著數據使用者,數據可視化將復雜的數據進行整理后呈現出來,為數據使用者讀取與閱讀數據提供了幫助
國家數據可視化產品
二、數據可視化的意義
(二)數據可視化方便數據的分析數據可視化并不是簡單地將數據轉換為圖表,它不僅能夠更直觀地呈現數據,還可以通過簡單的邏輯和視覺效果使數據的規(guī)律呈現出來,方便數據的分析
以城鎮(zhèn)新增就業(yè)人數為例,觀察圖1-1-4中的變化規(guī)律,便可以得出2015年和2016年城鎮(zhèn)新增就業(yè)人數相較于2014年出現了一定的下降,2017年和2018年再次上升,雖然同樣是增長,但是對比2016—2017年和2017—2018年的曲線斜率,便可以得出2017年增加的速度更快一些
三、什么是商務數據可視化數據可視化是指借助不同的可視化工具,將繁雜的數據轉換成易于識別和分析的圖表,幫助數據使用者快速完成海量數據的整理與歸納工作,實現更進一步的數據分析。在商務活動中,企業(yè)將面對紛繁復雜的商業(yè)數據,自家產品的成本與銷量、往來客戶的新增與流失、銷售團隊的業(yè)績、競爭對手的調價等都是企業(yè)需要關注的數據四、商務數據可視化的常用工具(一)常用的數據可視化工具
Tableau:全球知名度很高的數據可視化工具。用戶可以輕松地將數據轉化成想要的形
式。Tableau具有非常強大、安全、靈活的分析平臺,支持多人協作。用戶還可以通過
Tableau軟件、網頁,甚至移動設備來隨時瀏覽已生成的圖表,或將這些圖表嵌入報告、網頁
或軟件中,或嵌入Salesforce、SharePoint和Jive等應用程序中,實現實時交互。另外,
Tableau還支持數據挖掘。
QlikView:一個完整的商業(yè)分析軟件,主要用戶是企業(yè)用戶,用戶可以輕松地分析內部數
據,并且使用QlikView的分析和企業(yè)報告功能進行決策。當輸入要搜索的關鍵字時,QlikView
可以自動整合數據,幫助用戶找到數據間的關系。
Plotly:知名的、功能強大的數據可視化框架。Plotly可以根據輸入定制的二維和三維圖
表,構建交互式圖形,創(chuàng)建豐富多樣的圖表和地圖。
PowerBI:微軟開發(fā)的商業(yè)分析工具,可以很好地集成微軟的Office辦公軟件。其操作界
面相對比較熟悉,新用戶很容易上手和使用。用戶可以自由導入文件、文件夾和數據庫等多種
數據,自定義創(chuàng)建報告;同時,PowerBI還可以實現自然語言問答,并支持使用PowerBI軟
件、網頁、手機應用來查看數據
四、商務數據可視化的常用工具(二)為什么要選擇PowerBI作為本書的數據可視化工具
1.操作界面熟悉
本書的商務數據可視化工作以PowerBI為分析工具,首先是因為PowerBI是微軟開發(fā)的
工具,對于經常使用Word、Excel、PPT等Office軟件的學生而言,操作界面熟悉且比較容易上手;而且PowerBI可以直接將Excel查詢、數據模型和報表連接到PowerBI儀表板上,這有助于以新的方式快速收集、分析、發(fā)布和共享Excel業(yè)務數據。
2.軟件免費獲取
PowerBIDesktop是免費獲取的,即使學生將來使用Pro版(專業(yè)版),每個月需要支付的費用也相對較低。專業(yè)版更加易于學生下載并使用,方便學生在課后進行練習。
3.不斷更新迭代
PowerBI軟件自身和自定義可視化圖表都還在不斷地進行更新,其官網會對產品更新的功能進行講解,學生在掌握了基礎的操作后,還可以擁有很大的提升空間,如果即將從事數據分析工作,在未來的工作崗位中使用該軟件進行數據分析將會對自己有一定的幫助。4.擁有智能問答與快速見解功能
在借助PowerBI對大量數據進行數據可視化時,剛接觸數據分析的學生可能對于規(guī)律的挖掘有一定困難,這時借助PowerBI的智能問答和快速見解功能,利用MicrosoftAI的最新進展,可構建機器學習模型,從而達到快速找到見解的目的,會更易于對數據進行挖掘與分析。
項目一任務二認識PowerBI軟件1典型工作任務技術知識儲備商務實戰(zhàn)演練任務一初識商務數據可視化借助PowerBI生成的針對小米手環(huán)3用戶評價的可視化圖表,請通過對軟件不同視圖的學習,在報表視圖下觀察該可視化對象,找出用戶最關心的小米手環(huán)3的五個功能,并在數據視圖下找到對“屏幕”進行評價的具體內容
2典型工作任務技術知識儲備商務實戰(zhàn)演練任務一初識商務數據可視化一、PowerBI的軟件界面
PowerBI界面由三個區(qū)域組成(見圖1-2-2),分別是導航欄、報表畫布和報表編輯器(以PowerBI2.73.5586.802版本為例)
一、PowerBI的軟件界面
(一)導航欄
與其他Office軟件類似,PowerBI的導航欄也位于頂部,包括“文件”“主頁”“視圖”“建模”“幫助”。單擊“文件”按鈕,將會出現“新建”“打開”“保存”“另存為”等熟悉的操作選項“主頁”選項卡(見圖1-2-3)下包括“剪貼板”“外部數據”“插入”“自定義視覺對
象”“主題”“關系”“計算”與“共享”。其中,“外部數據”是進行數據連接和數據編輯的功能區(qū);“插入”可以在報表畫布上新建頁面和進行視覺對象或文本框等元素的插入;“自定義視覺對象”可以在官網下載新的自定義視覺對象,增加可以生成的圖表形式;“主題”則可進行各種配色的選擇;“關系”是用來管理各表格中字段的關系的;“計算”可以新建度量值,更多是對數據進行處理。
一、PowerBI的軟件界面
“視圖”選項卡(見圖1-2-4)可以對頁面的大小和手機端布局進行調整,同時可以添加
網格線等工具輔助報表的制作
“建?!边x項卡(見圖1-2-5)可以管理數據關系、創(chuàng)建計算列、優(yōu)化數據模型,還可以
創(chuàng)建計算度量值和計算表等。
一、PowerBI的軟件界面
(二)報表畫布
PowerBI界面中最大的區(qū)域便是報表畫布,這也是使用PowerBI時最主要的工作區(qū)域。借助右側的報表編輯器生成的視覺對象,將在此區(qū)域中進行顯示一、PowerBI的軟件界面
(三)報表編輯器
報表編輯器由“字段”窗格、“可視化”窗格、“篩選器”窗格三個窗格組成。
1.“字段”窗格
“字段”窗格是用來顯示當前可以使用的數據表和字段的。勾選某個字段,將其添加進可視化對象,便可生成可視化圖表
一、PowerBI的軟件界面
2.“可視化”窗格
3.“篩選器”窗格“篩選器”窗格主要用于查看、設置和修改不同級別的篩選.篩選器有三種級別,分別是視覺級篩選器、頁面級篩選器和報告級篩選器。視覺級篩選器是對本視覺對象進行篩選的,即圖1-2-8(b)頂部的“此視覺對象上的篩選器”。頁面級篩選器是對當前報表頁面的所有對象進行篩選的,即圖1-2-8(b)中部的“此頁上的篩選器”。報告級篩選器則是針對整個報表進行篩選的,即圖1-2-8(b)底部的“所有頁面上的篩選器”。
二、PowerBI的三種視圖
PowerBI有三個視圖界面,分別是報表視圖、數據視圖和關系視圖,切換的按鈕在界面最左側,如圖1-2-9所示,單擊即可完成切換,同時以黃色豎線標注當前視圖,當前頁面停留在報表視圖界面。
二、PowerBI的三種視圖
(一)報表視圖
在報表視圖中,使用者可以借助“可視化”窗格中的可視化對象,在若干報表頁面上創(chuàng)建
可視化內容,制作可視化報表。在此視圖下,使用者可以對可視化對象及報表頁面進行復制、
粘貼等處理。
由于畫布區(qū)域有限,當在一頁報表中無法放置所有需要的可視化對象時,便需要在報表視
圖底部單擊按鈕新建頁面。當然也可以對當前頁面進行復制、重命名、刪除或隱藏(見
圖1-2-10)等操作。
二、PowerBI的三種視圖
(二)數據視圖
數據視圖是指針對所需要的數據進行處理與檢查,單擊按鈕便可進入數據視圖。
在數據視圖下,可以顯示選中的表,并可以對其中的所有行和列進行操作。值得注意的
是,當有數據列在報表視圖中隱藏時,在數據視圖下仍可以看見數據,此時該列以灰色顯示,在右側的字段里也會變成灰色。圖1-2-11所示的出版時間便是隱藏列,以灰色顯示
二、PowerBI的三種視圖
1.導航欄
在數據視圖中,可以利用頂部的導航欄“主頁”選項卡完成數據的連接和數據的輸入等,在“建?!边x項卡下完成管理關系、新建度量值和新建列等操作。如果想要修改列的數據類型,也可以在“建?!边x項卡下完成。
2.公式欄
在導航欄和數據網格之間有一行是公式欄,在此處可以輸入度量值,也可以輸入計算列的DAX公式。
3.數據網格
數據網格中顯示的便是當前選中表格的全部數據,如圖1-2-12(a)所示,單擊列名旁邊的按鈕可以完成數據的篩選。用鼠標右鍵單擊該按鈕會出現快捷菜單,如圖1-2-12(b)所示,可以像Excel一樣完成升序、降序、新建列、重命名列等操作,也可以完成復制表、新建度量值、編輯查詢等其他操作。
二、PowerBI的三種視圖
4.字段列表
數據視圖右側為字段列表,在字段列表中用鼠標右鍵單擊字段(見圖1-2-13)將可以完成新建層次結構以及新建度量值等操作。通過頂部的搜索框,可以對所有的表格和字段進行搜索。
5.查詢編輯器單擊導航欄或者用鼠標右鍵單擊菜單中的“編輯查詢”都會啟動查詢編輯器。二、PowerBI的三種視圖
(三)關系視圖
關系視圖是指針對模型中的關系進行管理。當模型中有很多表格且各表格關系復雜時,借助關系模型進行管理十分重要。單擊按鈕便可進入關系視圖,如圖1-2-15所示。
二、PowerBI的三種視圖
項目小結
通過本項目的學習,讀者應重點掌握以下知識。
(1)讀者對商務數據可視化具備初步認知,能夠理解商務數據可視化有利于數據的閱讀與分析,能夠認識到借助數據可視化可以更形象生動地呈現潛在信息。
(2)讀者能夠熟悉商務數據可視化工具PowerBI的軟件界面及三種不同的視圖,并能夠進行簡單操作,為后續(xù)項目的學習奠定基礎。
項目二商務數據預處理
——查詢編輯器1
任務二數據清洗目錄任務一獲取并合并每個月的銷量數據21典型工作任務技術知識儲備商務實戰(zhàn)演練任務一獲取并合并每個月的銷量數據典型工作任務我國至少有1.5億條寵物,寵物經濟的市場潛力也達到了250億人民幣,寵物用品蘊藏著巨大的商機。光亮也趁熱在淘寶開了一家寵物用品店,為了制訂更好的營銷策略,每個月都要將新增的店內數據與歷史數據進行匯總,如何高效快速的完成這個重復工作呢?2典型工作任務技術知識儲備商務實戰(zhàn)演練任務一獲取并合并每個月的銷量數據一、數據源類型PowerBI可連接多種不同類型的數據源,打開PowerBIDesktop,在“主頁”選項卡中單擊“獲取數據”下拉按鈕,將會顯示最常見的幾種數據源類型,如圖2-1-1所示。一、數據源類型在下拉列表中單擊“更多”選項,將會在打開的“獲取數據”對話框中列出了PowerBI可連接的所有數據源類型:文件、數據庫、PowerPlatform、Azure、聯機服務和其他。其中“全部”即包括所有類別的可連接數據源,如圖2-1-2所示。二、連接文件對于“文件”類型的數據,PowerBI提供了Excel、文本/CSV、XML、JSON和文件夾等數據源連接方式。如圖2-1-3所示。二、連接文件(一)連接Excel文件在“主頁”選項卡中單擊“獲取數據”下拉按鈕,在打開的下拉列表中單擊“Excel”選項,彈出“打開”對話框,選擇“商品基本信息表.xlsx”數據文件并打開,如圖2-1-4所示。二、連接文件彈出的“導航器”對話框中會顯示數據表信息,在左窗格中選中一個表時,在右窗格中就會出現該數據表的數據預覽,如圖2-1-5所示。二、連接文件通常結構化的數據可以直接加載,需要清洗的數據則使用轉換數據進入查詢編輯器(PowerQuery,PQ)界面。單擊“加載”按鈕,數據加載到PowerBI后,將會在報表視圖右側的“字段”窗格中顯示該表及其列名稱,如圖2-1-6所示。二、連接文件(二)連接文件夾文件夾可作為一種特殊的數據源,PowerBI可將文件夾中所有文件的文件名、創(chuàng)建日期、文件內容等相關信息作為記錄導入數據表。打開PowerBIDesktop,在“主頁”選項卡中單擊“獲取數據”下拉按鈕,在下拉列表中單擊“更多”選項,在“文件”類型列表中單擊“文件夾”選項,打開文件夾對話框,單擊“瀏覽…”按鈕選擇文件夾的位置,如圖2-1-7所示二、連接文件單擊“確定”按鈕后,會彈出如圖2-1-8所示的對話框,從中可以查詢到該文件夾下的所有文件。二、連接文件在對話框的底部有一個“組合”按鈕,因為我們的任務是要將該文件夾下的3個文件合并匯總到一張表中,所以單擊該按鈕,選擇合并并轉換數據。在彈出的“合并文件”對話框中會詢問要選擇以哪個文件作為示例文件,也就是說要合并的3個文件要以示例文件的格式為樣本來追加內容。通常匯總文件夾中的數據的前提是文件夾中的文件格式要保持一致,如果有文件格式不一致,則需要盡量把每個文件格式修改一致后再做合并匯總。由于本案例中每個案例格式都是相同的,所以默認就以第一個文件作為示例文件,單擊左窗格中的表“sheet1”,如圖2-1-9所示。二、連接文件單擊“確定”按鈕,進入到PQ界面,能看到2張表的信息都匯總到了一張表中,如圖2-1-10所示。三、連接到數據庫PowerBI可連接各種類型的數據庫,如SQLServer數據庫、MySQL數據庫和OracleDatabase等,如圖2-1-11所示。三、連接到數據庫(一)連接SQLServer數據庫在“主頁”選項卡中單擊“獲取數據”下拉按鈕,在打開的下拉列表中選擇“SQLServer”選項,如圖2-1-12所示。三、連接到數據庫在打開的“SQLServer數據庫”對話框中,輸入服務器地址和數據庫名稱,如圖2-1-13所示。三、連接到數據庫單擊“確定”按鈕,將會打開“加密支持”對話框,如圖2-1-14所示。單擊“確定”按鈕,打開“導航器”對話框,在左窗格中選中“商品分析表”,同樣在右窗格中會出現該數據表的數據預覽,如圖2-1-15所示。三、連接到數據庫單擊“加載”按鈕,PowerBI會顯示“加載”對話框,如圖2-1-16所示。數據庫中的“商品分析表”加載到PowerBI后,會在PowerBI的報表視圖右側的“字段”窗格中顯示該表及其列名稱,如圖2-1-17所示。對于其他類型的數據庫,操作方法類似,這里就不逐一介紹了。四、連接Web數據PowerBI不僅能從本地獲取數據,還能從網頁上抓取實時數據。在“主頁”選項卡中單擊“獲取數據”下拉按鈕,在打開的下拉列表中選擇“Web”選項,如圖2-1-18所示。在彈出的“從Web”對話框的“URL”文本框中輸入網址,如圖2-1-19所示。四、連接Web數據單擊確定按鈕,將建立與網頁的連接,打開“導航器”對話框,左窗格中會顯示網頁上可用表的列表,選中Table0,右窗格中會出現該數據表的數據預覽,如圖2-1-20所示。四、連接Web數據單擊“加載”按鈕,數據表加載到PowerBI后,同樣會在PowerBI的報表視圖右側的“字段”窗格中顯示該表及其列名稱,如圖2-1-21所示。這里需要注意的是,不是所有網頁上的數據都可以直接被獲取,這主要取決于網頁上數據的格式是否以表格形式提供,PowerBI能從網頁中識別表格數據,然后將其導入。3典型工作任務技術知識儲備商務實戰(zhàn)演練任務一獲取并合并每個月的銷量數據任務一獲取并合并每個月的銷量數據通過以上的操作,我們發(fā)現只要把每個月的銷售表放到同一個文件夾中,例如,我們將光亮8、9兩個月的銷售表放進“銷售量”這個文件夾內,在PowerBI連接數據源時選擇“銷售量”這個文件夾,就能快速地將兩個工作簿的數據匯總到一張表上。更簡單的是,當下個月又有銷售表更新的時候,例如,現在又增加了10月份的銷售明細表,那么只需要將10月份的銷售明細表同樣加入到“銷售量”這個文件夾內,如圖2-1-22所示。任務一獲取并合并每個月的銷量數據在PQ界面直接單擊“刷新預覽”按鈕,如圖2-1-23所示。10月份的數據瞬間就被添加進來了,如圖2-1-24所示。這個過程基本上是全自動化完成,對光亮來說,以后每個月要做的事情就是把新的數據文件放到“銷售量”中,然后單擊“刷新預覽”按鈕即可。1典型工作任務技術知識儲備商務實戰(zhàn)演練任務二數據清洗典型工作任務一年一度的“雙11”即將到來,作為一家新店經營者,光亮面臨的首要問題就是選擇哪些商品去參加雙十一活動?請利用查詢編輯器強大的數據清洗功能幫助光亮挑選出店內的爆款商品。2典型工作任務技術知識儲備商務實戰(zhàn)演練任務二數據清洗一、查詢編輯器的介紹查詢編輯器可連接一個或多個數據源,根據用戶的需要調整和轉換數據。在PowerBI“主頁”選項卡中單擊“編輯查詢”下拉按鈕,選擇“編輯查詢”,如圖2-2-1所示。一、查詢編輯器的介紹沒有數據連接時,查詢編輯器顯示為空白窗格,如圖2-2-2所示。在查詢編輯器“主頁”選項卡中單擊“新建源”下拉按鈕,選中“Excel”導入案例數據“2019年8月銷售量”,如圖2-2-3所示。一、查詢編輯器的介紹建立數據連接后,查詢編輯器中顯示的界面主要由四部分組成:功能區(qū)、“查詢”窗格、中間窗格、“查詢設置”窗格。一、查詢編輯器的介紹(一)功能區(qū)功能區(qū)包含“文件”菜單和5個選項卡:“主頁”“轉換”“添加列”“視圖”“幫助”。1.“文件”菜單“文件”菜單如圖2-2-5所示,菜單中各命令的含義如下:關閉并應用:關閉查詢編輯器并應用所做的更改。應用:應用所做的更改,但不關閉查詢編輯器。關閉:關閉查詢編輯器,但不關閉查詢編輯器。保存:保存當前所做的更改。另存為:將查詢另取一個名稱保存。選項和設置:可以在子菜單中選擇管理PowerBI的環(huán)境選項和數據源設置。幫助:可在子菜單中選擇查看各種輔助學習資源。一、查詢編輯器的介紹2.“主頁”選項卡“主頁”選項卡提供了常見的查詢功能,如圖2-2-6所示。3.“轉換”選項卡“轉換”選項卡提供了對數據的相關轉換操作,如圖2-2-7所示一、查詢編輯器的介紹4.“添加列”選項卡“添加列”選項卡提供了各種添加列的功能,如圖2-2-8所示。5.“視圖”選項卡“視圖”選項卡提供了查詢編輯器界面相關的選項設置,如圖2-2-9所示。一、查詢編輯器的介紹6.“幫助”選項卡“幫助”選項卡提供了相關的學習輔助資源,如圖2-2-10所示。一、查詢編輯器的介紹(二)查詢窗格“查詢”窗格用于顯示PowerBI當前獲取數據時使用的所有查詢,如圖2-2-11所示。在PowerBI中,一個查詢導入的數據為一個數據表(簡稱為表)。當從“查詢”窗格中選擇一個查詢后,其數據顯示在中間窗格的中間窗格中。我們選中“sheet1”,用鼠標右鍵單擊將查詢重命名為“2019年8月銷售量”。一、查詢編輯器的介紹(三)中間窗格中間窗格用于顯示已選擇的查詢中的數據,如圖2-2-12所示。一、查詢編輯器的介紹(四)查詢設置窗格“查詢設置”窗格包含兩個部分:屬性和應用的步驟,如圖2-2-13所示。1.屬性:單擊“所有屬性”選項,可打開“查詢屬性”對話框,如圖2-2-14所示一、查詢編輯器的介紹2.應用的步驟“應用的步驟”列出了當前查詢所包含的基本步驟。在圖2-2-13所示“應用的步驟”包含了以下4個步驟:源、導航、提升的標題和更改的類型。這4個步驟是按順序執(zhí)行的,單擊某一個步驟,中間窗格就會顯示該步驟對應的數據預覽。查詢編輯器打開后,中間窗格默認會顯示“應用的步驟”中最后一個操作時的數據,也是最終加載到PowerBI中的數據。二、數據清洗(一)數據轉換數據轉換主要是對查詢中的數據執(zhí)行進一步的加工。1.將第一行用作標題在Excel中,通常第一行為標題行,從第二行開始才是數據,但在PQ界面中,從第一行開始就需要是數據記錄,標題要在數據之上。因此從Excel導入數據的第一步就是要提升標題,通常這個操作在PowerBI中會自動完成。如圖2-2-15所示。二、數據清洗在本示例中,由于“2019年8月銷售量.xlsx”中前兩行都不是數據,還需要再一次提升標題。在“轉換”選項卡中單擊“將第一行用作標題”下拉按鈕,在下拉列表中選擇“將第一行用作標題”命令(見圖2-2-16),完成標題提升,如圖2-2-17所示。二、數據清洗2.修改數據類型在“轉換”選項卡中單擊“數據類型”下拉按鈕,可查看到PQ中常用的數據類型,如圖2-2-18所示。二、數據清洗通常查詢能自動識別源數據的數據類型,但不一定準確。例如,在圖2-2-17中,“訂單號”和“商品ID”被識別為整數,顯然不適用。單擊“訂單號”左側的數據類型按鈕,在下拉列表中選擇“文本”,如圖2-2-19所示。二、數據清洗在打開的“更改列類型”對話框中選擇“替換當前轉換”,表示在當前步驟中即完成數據類型的更改,如圖2-2-20所示。按同樣的方法將“商品ID”數據類型也更改為“文本”,完成數據類型轉換后的數據預覽結果如按同樣的方法將“商品ID”數據類型也更改為“文本”,將“下單時間”數據類型由“日期/時間”更改成“日期”,完成數據類型轉換后的數據預覽結果如圖2-2-21所示。二、數據清洗3.數據篩選使用標題列右側的篩選按鈕,可以剔除不需要的信息行。例如,我們要查看2019/8/1日的銷售數據,單擊“下單時間”右側的篩選按鈕,只選中2019/8/1,如圖2-2-22所示。篩選后的數據預覽結果,如圖2-2-23所示。二、數據清洗4.刪除空值導入后的數據中可能會有空值,單擊“商品名稱”右側的篩選按鈕,在彈出的篩選條件中選擇“刪除空”,如圖2-2-24所示,則可以將示例查詢中的空值刪除。二、數據清洗5.日期提取PQ中日期格式比較特殊,我們可以按年、月、日等不同顆粒度的組合去提取時間,比如我們要提取月份,選中“下單時間”列,在“轉換”選項卡中單擊“時間”下拉按鈕,在下拉列表中選中“月份”中的“月份名稱”,如圖2-2-25所示?!跋聠螘r間”列中的日期數據就會顯示對應的月份“八月”,如圖2-2-26所示。二、數據清洗6.透視與逆透視逆透視就是把表中的列轉換成了值,而透視則是把值變成了列,且在透視過程中還可以選擇對值進行聚合函數的運算。(1)在“主頁”選項卡中單擊“選擇列”下拉按鈕,選擇“選擇列”選項,如圖2-2-27所示。二、數據清洗(2)在彈出的“選擇列”對話框中選中“商品數量”“商品名稱”“下單時間”,如圖2-2-28所示。(3)選中列的數據預覽結果如圖2-2-29所示。二、數據清洗(4)選中“商品名稱”列,在“轉換”選項卡中單擊“透視列”按鈕,如圖2-2-30所示。二、數據清洗(5)在彈出的“透視列”對話框里,默認的“值列”是商品數量,展開“高級選項”,可以看到默認的“聚合值函數”是“求和”如圖2-2-31所示,單擊“確定”按鈕.(6)數據透視表就完成了,如圖2-2-32所示。二、數據清洗(7)在這個透視表中,我們可以清楚的看到每個商品在八月份的累計銷量。逆透視就是反過來操作,選中“下單時間”,單擊“逆透視列”下拉按鈕,在下拉列表中選擇“逆透視其他列”,如圖2-2-33所示。二、數據清洗(8)逆透視后的表如圖2-2-34所示。二、數據清洗7.轉置轉置就是把列變成行,行變成列,單擊“轉置”命令,轉置后的表如圖2-2-35所示。二、數據清洗在以上的數據轉換中,我們會發(fā)現,所有的操作都會被記錄在“應用的步驟”面板中,如圖2-2-35所示,其中帶有設置標記“”的,都是可以更改的。我們也可以刪除某一個步驟,單擊步驟名左側的“”按鈕,就可以刪除該步驟。我們還可以移動步驟,互換操作的順序。例如,我們可以把“提取月份名稱”移動到“刪除其他列”的后面,如圖2-2-36所示。二、數據清洗
需要注意的是,并不是所有的步驟都可以調換順序的,在進行移動步驟操作時,要避免前后步驟出現沖突。例如,我們把“刪除其他列”移動到操作步驟“更改的類型1”前面,在執(zhí)行“更改的類型1”這個操作時,系統(tǒng)就會報錯,如圖2-2-37所示。因為在“刪除其他列”這個操作中,我們已經把“訂單號”列刪除了,再執(zhí)行對它的類型修改自然就找不到這一列了。二、數據清洗(二)數據豐富通常在做數據分析的時候,我們還需要在原有數據的基礎上增加一些輔助數據。例如,加入一些新列、新行,或是從其他表中添加更多維度的數據,這就是數據豐富。1.索引列在“添加列”選項卡中單擊“索引列”下拉按鈕,如圖2-2-38所示,可以添加一個從0或者1開頭的序號列。這個序號列在后期的數據分析中可以用來排序或者快速的定位到我們想要的行。二、數據清洗2.條件列“添加列”命令是一個與Excel中的if函數作用相似的方法,如圖2-2-39所示。如果要把“下單時間”分為3個區(qū)間:“八月上旬”“八月中旬”“八月下旬”,在“添加條件列”對話框中添加如圖2-2-40的設置即可。二、數據清洗圖2-2-41所示為添加的條件列,使用這種方法的好處是我們能夠清楚的設置多重條件,避免使用If函數進行嵌套。二、數據清洗3.追加查詢追加查詢就是把多張表縱向的匯總到一起,用來匯總的表必須具有相同的字段屬性,與之前在用文件夾導入數據實現多個文件合并在一起的功能是一樣的,不同的是在追加查詢中我們需要將要合并的表先添加到PQ中。例如,我們要獲取9月到10月的銷售量數據,我們先將“2019年9月銷售量”“2019年10月銷售量”添加到PQ中,選中“2019年9月銷售量”,單擊“追加查詢”下拉按鈕,下拉列表中有以下兩個子命令。“追加查詢”是指在當前選中表的基礎上追加其他表?!皩⒉樵冏芳訛樾虏樵儭笔侵赴炎芳雍蟮慕Y果生成一張新表。二、數據清洗首先選擇“將查詢追加為新查詢”命令(見圖2-2-42),在彈出的“追加”對話框中選擇要追加到主表的表“2019年10月銷售量”(見圖2-2-43),單擊“確定”按鈕后,如圖2-2-44所示,便完成了將兩張表匯總到一張表的操作。二、數據清洗二、數據清洗4.合并查詢合并查詢是指橫向的匯總多張表,需要注意的是合并查詢的表之間必須有相互關聯的字段。例如,我們要在“2019年8月的銷售量”表中添加商品類別信息,首先我們在PQ中導入“商品類別表”,使用第一行作為標題如圖2-2-45所示。二、數據清洗在查詢窗格先選中“2019年8月的銷售量”,單擊“合并查詢”下拉按鈕,選擇“合并查詢”命令,如圖2-2-46所示。在彈出的“合并”對話框中選擇“商品類別”表,并選中兩張表的關聯列“商品名稱”,聯接種類采用默認的“左外部”,此時系統(tǒng)會自動識別出“所選內容匹配第一個表中的20行(共23行)”,如圖2-2-47所示。二、數據清洗單擊“確定”按鈕后,在“2019年8月銷售量”表的右側會增加一個新列“商品類別表”,單擊其右上角的圖標,會顯示可以擴展的列,因為“商品名稱”在原表中已經存在了,因此可以不選中此列,只選擇“商品類別”這列,如圖2-2-48所示。二、數據清洗單擊“確定”按鈕后可以看到合并的結果,如圖2-2-49所示。可以看到添加進來的“商品類別”列中有空值,原因是因為在聯接的時候使用的是“左外部”,所以左側表中的所有行都會被保存下來,但是擴展和合并列并沒有匹配項,所以顯示為空值。二、數據清洗聯接種類有以下幾種,如圖2-2-50所示。如果在剛剛的合并查詢中使用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年企業(yè)文員崗位工作標準及流程合同3篇
- 2025中國鐵塔總部直屬單位春季校園招聘18人高頻重點提升(共500題)附帶答案詳解
- 2025中國移動上海公司招聘高頻重點提升(共500題)附帶答案詳解
- 2025中國電信上海公司校園招聘高頻重點提升(共500題)附帶答案詳解
- 2025中國民航科學技術研究院公開招聘應屆畢業(yè)生11人(第二期)高頻重點提升(共500題)附帶答案詳解
- 2025中國農業(yè)科學院農業(yè)信息研究所公開招聘10人高頻重點提升(共500題)附帶答案詳解
- 2025下半年黑龍江通信管理局事業(yè)單位招聘6人歷年高頻重點提升(共500題)附帶答案詳解
- 2025下半年江蘇鹽城市阜寧縣事業(yè)單位招聘工作人員13人高頻重點提升(共500題)附帶答案詳解
- 2025下半年安徽省馬鞍山含山縣事業(yè)單位招聘13人歷年高頻重點提升(共500題)附帶答案詳解
- 2025下半年四川廣元市利州區(qū)考試招聘事業(yè)單位工作人員76人高頻重點提升(共500題)附帶答案詳解
- 23秋國家開放大學《法律職業(yè)倫理》形考任務1-3參考答案
- 2024年中南出版?zhèn)髅郊瘓F股份有限公司招聘筆試參考題庫含答案解析
- 2023-2024學年福建省廈門市思明區(qū)重點中學七年級(上)期末數學試卷(含解析)
- 預防血栓藥物課件
- 2022讀《整本書閱讀的六項核心技術》有感
- 2023年高考英語真題題源解密(新高考卷)專題03 閱讀理解C篇(說明文)(原題版)
- 公司駕駛員安全駕駛培訓
- 常用工具軟件Win
- 音響的創(chuàng)業(yè)計劃書
- 2024版幼兒園課件《兒童的一百種語言》
- 注塑制品市場需求分析報告
評論
0/150
提交評論