![數(shù)據(jù)可視化與分析基礎課件整本書電子教案全套教學教程課件_第1頁](http://file4.renrendoc.com/view7/M02/1F/17/wKhkGWbngWuAfppUAAGmRVN8YQw420.jpg)
![數(shù)據(jù)可視化與分析基礎課件整本書電子教案全套教學教程課件_第2頁](http://file4.renrendoc.com/view7/M02/1F/17/wKhkGWbngWuAfppUAAGmRVN8YQw4202.jpg)
![數(shù)據(jù)可視化與分析基礎課件整本書電子教案全套教學教程課件_第3頁](http://file4.renrendoc.com/view7/M02/1F/17/wKhkGWbngWuAfppUAAGmRVN8YQw4203.jpg)
![數(shù)據(jù)可視化與分析基礎課件整本書電子教案全套教學教程課件_第4頁](http://file4.renrendoc.com/view7/M02/1F/17/wKhkGWbngWuAfppUAAGmRVN8YQw4204.jpg)
![數(shù)據(jù)可視化與分析基礎課件整本書電子教案全套教學教程課件_第5頁](http://file4.renrendoc.com/view7/M02/1F/17/wKhkGWbngWuAfppUAAGmRVN8YQw4205.jpg)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
概述DataVisualizationandAnalysisBasis
數(shù)據(jù)可視化與分析基礎教師:張丹玨Email:zdj@Add:實驗樓9103課程簡介22024年9月16日上海杉達學院信息技術基礎教學部隨著大數(shù)據(jù)時代的來臨,大數(shù)據(jù)分析也應運而生,本課程使用Oracle和Modeler軟件作為數(shù)據(jù)可視化與分析工具,該兩款軟件是商業(yè)智能與數(shù)據(jù)分析軟件,能夠滿足企業(yè)與科研絕大多數(shù)的分析需求,相比于專業(yè)軟件,它入門簡單且功能強大,通過拖、拉、點擊等操作即可完成,無需太多的專業(yè)背景(無需編程),每個人都可以輕松掌握,真正實現(xiàn)了“親自上陣”,“所見即所得”。課程內容主要包含數(shù)據(jù)可視化與分析概述、數(shù)據(jù)整理與連接、可視化圖表、數(shù)據(jù)計算、分類決策、關聯(lián)分析和數(shù)據(jù)報告撰寫等。針對我校學生的特點,本課程適合非計算機專業(yè)的學生學習,對于以后的工作和學習都有很好的實用性。課程目標32024年9月16日上海杉達學院信息技術基礎教學部具備基本的數(shù)據(jù)可視化與分析概念;熟練掌握OracleAD(OracleAnalyticsDesktop)應用軟件,具備使用該軟件對數(shù)據(jù)進行可視化圖表制作及數(shù)據(jù)分析的能力;初步掌握IBMSPSSModeler應用軟件,具備使用該軟件對數(shù)據(jù)進行挖掘分析能力;能夠根據(jù)數(shù)據(jù)分析結果撰寫數(shù)據(jù)分析報告。課程安排42024年9月16日上海杉達學院信息技術基礎教學部第1周 概述第2、3周 數(shù)據(jù)可視化初步第4、5周 數(shù)據(jù)圖表制作第6周 數(shù)據(jù)公式與函數(shù)第7、8周
數(shù)據(jù)可視化案例智慧樹網(wǎng)址:/課程號:K841938QQ學習群名稱:數(shù)據(jù)可視化與分析基礎(群號:1134040744)群文件中將共享課程中所使用的課件等學習資料。注:群中共享的文件僅限學習使用,不能用于其它用途。第9、10周 數(shù)據(jù)挖掘第11、12周
數(shù)據(jù)分析報告第13、14周
數(shù)據(jù)分析案例第15周
數(shù)據(jù)庫基本操作第16周
課程考核軟件說明52024年9月16日上海杉達學院信息技術基礎教學部Oracle可視化軟件安裝Windows系統(tǒng):運行Oracle_Analytics_Desktop-5.5.0.exeMac系統(tǒng):運行Oracle_Analytics_Desktop-5.5.0.pkg
【注意】如系統(tǒng)中已安裝360等防護軟件,可能會將OracleAD隔離,需要設置為信任文件。Oracle可視化官網(wǎng):/technetwork/cn/middleware/oracle-data-visualization/index.html軟件說明62024年9月16日上海杉達學院信息技術基礎教學部IBMSPSSModeler安裝程序(64位):modeler18.zip1、解壓modeler18.zip。2、運行SPSS_Modeler_18中的setup.exe應用程序,完成后不啟動。3、運行SPSS_Modeler_18_Premium中的setup.exe應用程序,完成后不啟動。4、打開SPSS_Modeler_18破解目錄,將文件“l(fā)servrc”復制到安裝文件夾內,并覆蓋原文件。默認安裝文件夾:C:\ProgramFiles\IBM\SPSS\Modeler\18.0\bin\IBMSPSSModeler主頁:
/cn-zh/marketplace/spss-modeler課程考核72024年9月16日上海杉達學院信息技術基礎教學部總評成績=平時成績(40%)+期末考核成績(60%)平時成績:包含考勤、上課表現(xiàn)、課堂練習等。
期末考核:包含數(shù)據(jù)分析報告、演講等。每組3-4人,每組5分鐘演講+5分鐘現(xiàn)場制作。補考以考試形式進行:
現(xiàn)場制作4張圖表和1個數(shù)據(jù)挖據(jù)流程。編號項目要求分值1演講的儀表、儀態(tài)等
52演示文檔要有封面、分析過程和結論53可視化圖表人均>=5張,形式多樣204數(shù)據(jù)挖據(jù)每組至少一個數(shù)據(jù)建模105數(shù)據(jù)分析條理性、合理性206報告撰寫結構合理、排版正確人均字數(shù)>=1000字207現(xiàn)場制作
20
10001大數(shù)據(jù)簡介大數(shù)據(jù)簡介2024年9月16日上海杉達學院信息技術基礎教學部9大數(shù)據(jù)(bigdata),又稱巨量資料,是指需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應海量、高增長率和多樣化的信息資產。大數(shù)據(jù)具有4V特征:4VVolume(大量)Velocity(高速)Variety(多樣)Value(價值)50x35ZB20202010全球80%
數(shù)據(jù)為非結構性超過300億RFID感測裝置價值密度的高低與數(shù)據(jù)總量的大小成反比。如何通過強大的機器算法迅速地完成數(shù)據(jù)的價值“提純”是目前大數(shù)據(jù)背景下亟待解決的難題。02數(shù)據(jù)可視化數(shù)據(jù)可視化112024年9月16日上海杉達學院信息技術基礎教學部數(shù)據(jù)可視化主要旨在借助于圖形化手段,清晰有效地傳達數(shù)據(jù)中蘊含的信息.本質是將復雜的數(shù)據(jù)用視覺展示的方式增強用戶對數(shù)據(jù)的理解,以準確、形象、快速的傳達方式凸顯數(shù)據(jù)的含義。數(shù)據(jù)可視化綜合應用計算機科學、圖形學、可視化設計、心理學等多個領域的知識,運用符合人類視覺系統(tǒng)的方式為用戶提供簡潔、直觀、形象、有趣、易于理解的數(shù)據(jù)展示,從而幫助用戶了解數(shù)據(jù),應用數(shù)據(jù)。數(shù)據(jù)可視化2024年9月16日上海杉達學院信息技術基礎教學部12數(shù)據(jù)可視化軟件:OracleAD:Oracle推出的一款數(shù)據(jù)可視化產品,也是OracleBI產品BIEE的一部分。它不僅支持本地部署,也可以在云端方便地訪問,甚至在個人的桌面端,用戶也可以隨時隨地自如地分析來自個人或企業(yè)內部的數(shù)據(jù)。PowerBI:微軟旗下的一款一體化的BI和分析平臺。可視化能夠直接從報告中創(chuàng)建,可以同整個組織的用戶共享。除了大量的內置可視化樣式外,也可以在AppSource社區(qū)不斷創(chuàng)建新的可視化樣式,或者如果你想自己編碼,那么可以使用開發(fā)人員工具(DeveloperTools)從頭開始創(chuàng)建并與其他用戶共享。它還包括一個自然語言界面,允許通過簡單的搜索詞建立不同復雜度的可視化。Tableau:Tableau公司開發(fā)的能夠幫助用戶查看并理解數(shù)據(jù)的商業(yè)智能軟件,具有分析快速、簡單易用、不限數(shù)據(jù)源、智能儀表板、自動更新、瞬時共享等特點。收費版功能較多,有TableauDesktop、TableauPrep、TableauOnline、TableauServer等多個版本。數(shù)據(jù)可視化工具:Echarts(/zh/index.html)、GAPMINDER、D3、RAWGraphs、Datawrapper、TableauOnline、Plotly、VisualizeFree等。數(shù)據(jù)挖掘03數(shù)據(jù)挖掘2024年9月16日上海杉達學院信息技術基礎教學部14數(shù)據(jù)挖掘(Datamining),又譯為資料探勘、數(shù)據(jù)采礦,一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘通常與計算機科學有關,并通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)和模式識別等諸多方法來實現(xiàn)上述目標。數(shù)據(jù)挖掘常見的分析方法:分類、估計、預測、相關性分組或關聯(lián)規(guī)則、聚類復雜數(shù)據(jù)類型挖掘等。數(shù)據(jù)挖掘軟件和工具:IBMSPSSModeler、R、OracleDataMining、Weka、RapidMiner、KNIME等。數(shù)據(jù)分析04數(shù)據(jù)分析162024年9月16日上海杉達學院信息技術基礎教學部數(shù)據(jù)分析的概念簡單來說,對數(shù)據(jù)進行分析。較為專業(yè)的說法,指用適當?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行分析,將它們加以匯總和理解并消化,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析的目的把隱藏在大批看似雜亂無章的數(shù)據(jù)背后的信息集中和提煉出來,總結出所研究對象的內在規(guī)律,幫助管理者進行有效的判斷和決策。數(shù)據(jù)分析的分類描述性數(shù)據(jù)分析:側重于概括和表述數(shù)據(jù)的整體狀況。探索性數(shù)據(jù)分析:側重于在數(shù)據(jù)中發(fā)現(xiàn)新的特征。驗證性數(shù)據(jù)分析:側重于驗證已有假設的真?zhèn)巍?shù)據(jù)分析的作用現(xiàn)狀分析:描述過去發(fā)生了什么。原因分析:描述現(xiàn)狀為什么發(fā)生。預測分析:描述將來會發(fā)生什么。數(shù)據(jù)分析分為以下3大類:描述性數(shù)據(jù)分析、探索性數(shù)據(jù)分析、驗證性數(shù)據(jù)分析。數(shù)據(jù)分析數(shù)據(jù)通過處理和分析,用圖形,如柱形圖、餅圖、折線圖等進行展現(xiàn),能讓人們一目了然地發(fā)現(xiàn)數(shù)據(jù)的本質以及作用。數(shù)據(jù)展現(xiàn)數(shù)據(jù)分析的最后一步,是整個數(shù)據(jù)分析過程的總結,是給決策者的一種參考,為決策者提供科學、嚴謹?shù)臎Q策依據(jù)。報告撰寫明確分析目的和思路有助于幫助分析者提供清晰的指引方向,保證數(shù)據(jù)分析的有效進行。明確分析目的和思路為數(shù)據(jù)分析提供基礎,一般數(shù)據(jù)來源于4種渠道:權威機構、互聯(lián)網(wǎng)、市場調查、企業(yè)數(shù)據(jù)庫。數(shù)據(jù)收集對收集到的數(shù)據(jù)進行加工整理,形成適合數(shù)據(jù)分析的樣式,其目的是從大量的、雜亂無章、難以理解的數(shù)據(jù)中,抽取并導出對解決問題有價值、有意義的數(shù)據(jù),從而提高數(shù)據(jù)分析的效率。數(shù)據(jù)預處理172024年9月16日上海杉達學院信息技術基礎教學部數(shù)據(jù)分析步驟數(shù)據(jù)分析方法/05數(shù)據(jù)分析方法論2024年9月16日上海杉達學院信息技術基礎教學部19數(shù)據(jù)分析方法論是從宏觀角度出發(fā),指導數(shù)據(jù)分析師進行一個完整的數(shù)據(jù)分析的過程,它是一個指南針,為數(shù)據(jù)分析師指明數(shù)據(jù)分析的正確方向。數(shù)據(jù)分析方法論是指數(shù)據(jù)分析的思路,是數(shù)據(jù)分析的前期規(guī)劃,指導著后期數(shù)據(jù)分析工作的開展,數(shù)據(jù)分析方法論好比裝修設計圖,它為數(shù)據(jù)分析工作提供了工作框架和指引,而數(shù)據(jù)分析方法好比裝修的工具和技術,它為數(shù)據(jù)分析提供技術的方法和保障。數(shù)據(jù)分析方法論——PEST分析202024年9月16日上海杉達學院信息技術基礎教學部PEST分析:政治環(huán)境(Political)經(jīng)濟環(huán)境(Economic)社會環(huán)境(Social)技術環(huán)境(Technological)以中國互聯(lián)網(wǎng)行業(yè)分析為例,采用PEST分析法整理分析思路,構建中國互聯(lián)網(wǎng)行業(yè)分析框架。數(shù)據(jù)分析方法論——5W2H分析(七何分析)212024年9月16日上海杉達學院信息技術基礎教學部5W2H分析:Why、What、Who、When、Where、How、Howmuch以用戶購買行為分析為例,我們需要了解公司產品的用戶購買行為是怎么樣的數(shù)據(jù)分析方法論——4P營銷理論222024年9月16日上海杉達學院信息技術基礎教學部4P營銷理論:產品(Product)價格(Price)渠道(Place)宣傳(Promotion)公司業(yè)務分析數(shù)據(jù)分析方法論——用戶行為理論232024年9月16日上海杉達學院信息技術基礎教學部用戶行為是指用戶為獲取、使用物品或者服務所采取的各種活動,用戶對產品首先需要有一個認知、熟悉的過程,然后試用,再決定是否繼續(xù)消費使用,最后成為忠誠用戶。可以利用用戶行為理論,把用戶在網(wǎng)站上的訪問、瀏覽、搜索、注冊、登錄、訂購等關鍵指標的邏輯關系進行梳理與分析。數(shù)據(jù)分析方法論——邏輯樹分析法242024年9月16日上海杉達學院信息技術基礎教學部邏輯樹又稱問題樹、演繹樹或分解樹等。將問題的所有子問題分層羅列,從最高層開始,并逐步向下擴展,邏輯樹主要是幫助數(shù)據(jù)分析師理清自己的思路,避免進行重復和無關的思考。針對公司利潤增長緩慢的問題進行分析。常見數(shù)據(jù)分析法則/06數(shù)據(jù)分析法則——帕累托法則262024年9月16日上海杉達學院信息技術基礎教學部帕累托法則,也叫二八定律、關鍵少數(shù)法則、不平衡原則等,被廣泛應用于社會學及企業(yè)管理學等。19世紀末20世紀初意大利經(jīng)濟學家帕累托發(fā)現(xiàn),在任何一組東西中,最重要的只占其中一小部分,約20%,其余80%盡管是多數(shù),卻是次要的。帕累托法則272024年9月16日上海杉達學院信息技術基礎教學部總而言之,在原因和結果、投入和產出、努力和報酬之間存在的這種不平衡關系,可以分為兩種不同類型:多數(shù),它們只能造成少許的影響;少數(shù),它們造成主要的、重大的影響。管理學:通常一個企業(yè)80%的利潤來自它20%的項目。經(jīng)濟學:20%的人手里掌握著80%的財富。心理學:20%的人身上集中了人類80%的智慧。日常生活中的“二八法則”:20%的人成功,80%的人不成功;20%的罪犯的罪行占所有犯罪行為的80%;20%的汽車狂人,引起80%的交通事故;20%的已婚者,占離婚人口的80%;世界上大約80%的資源,是由世界上20%的人口所消耗;20%的產品或20%的客戶,為企業(yè)賺得約80%的銷售額。數(shù)據(jù)分析法則2024年9月16日上海杉達學院信息技術基礎教學部28四象限法則:指通過對兩種維度的劃分,運用坐標的方式表達出想要的價值,由價值直接轉變?yōu)椴呗?,從而進行一些項目的推動。四象限法是一種策略驅動的思維,廣泛應用于戰(zhàn)略分析,產品分析,市場分析,客戶管理,用戶管理,商品管理等,其優(yōu)點是直觀,清晰,可以對數(shù)據(jù)進行人工的劃分,劃分結果可以直接應用于策略。通過運用四象限法則分析數(shù)據(jù),可以快速的找到問題的共性原因,建立分組優(yōu)化策略。同期群分析:指按時間維度對用戶建立分組,觀察分組用戶的行為特征表現(xiàn),其目的在于透過現(xiàn)象找到結果。以時間維度建立同期群,除按時間維度考慮,也可以對來源渠道等維度建立同期群。假設分析:在沒有直觀數(shù)據(jù)或者線索能分析的情況下,可以采用假設分析的方法進行綜合考慮,以假設先行的方法進行推斷,通過人工設置一個變量或者比率來進行反證。如:新產品的預期銷量、未來某段時間內的景區(qū)熱門度之類的。假設分析是一種啟發(fā)思考驅動的思維,它更多的是一種思考方法,即假設、驗證、并加以判斷。數(shù)據(jù)分析法則2024年9月16日上海杉達學院信息技術基礎教學部29指數(shù)法:主要有線性加權、反比例、log三種方法,是一種目標驅動的思維,是將無法利用的數(shù)據(jù)加工成可利用的,從而進行分析。指數(shù)法的優(yōu)點是目標驅動力強,直觀,簡潔,有效,對業(yè)務有一定的指導作用,一旦設立指數(shù)不易頻繁變動。對比法:對比分析在基于相同數(shù)據(jù)標準下,由其他影響因素所導致的數(shù)據(jù)差異,而對比分析的目的在于找出差異后進一步挖掘差異背后的原因,從而找到優(yōu)化的方法。漏斗分析:能夠科學反映用戶行為狀態(tài)以及從起點到終點各階段用戶轉化率情況的重要分析模型。其最常用的是轉化率和流失率兩個互補型指標。案例展示07啤酒+尿布312024年9月16日上海杉達學院信息技術基礎教學部美國沃爾瑪根據(jù)顧客的消費數(shù)據(jù)得到以下信息:男士被妻子派去買尿布的時候,他們就會順手為自己買些啤酒。
銷售時,可在尿布的銷售區(qū)域附近擺放些啤酒,這樣既能更好地滿足消費者需求,也使銷量大幅增長。亞馬遜的購物推薦322024年9月16日上海杉達學院信息技術基礎教學部亞馬遜會根據(jù)用戶瀏覽和購買的產品信息,向用戶推薦產品,為他們購買產品提供參考。亞馬遜根據(jù)用戶的喜好推薦合適的產品,以及與喜好有關聯(lián)的貨物,這樣不僅能滿足用戶需求,還能增加銷量。Google的流感預測332024年9月16日上海杉達學院信息技術基礎教學部MBAonline網(wǎng)站發(fā)布了一張題為“互聯(lián)網(wǎng)的一天”的圖表,表明人們在網(wǎng)上活動留下了大量的數(shù)據(jù)。2009年流感爆發(fā)時,Google通過分析5000萬條美國人最頻繁檢索的詞條,例如“咳嗽和發(fā)燒應該用哪些藥物”等,通過建模得到一個比官方數(shù)據(jù)更及時有效的檢測機制,通過與美國政府巳有的原始數(shù)據(jù)進行比對,提前半個月預測出流感的爆發(fā)時間和傳播途徑?!都埮莆荨返膭?chuàng)作342024年9月16日上海杉達學院信息技術基礎教學部制作《紙牌屋》的公司并不是一家影視公司,而是一家純粹的信息科技公司,該公司擁有一個網(wǎng)絡平臺,每天用戶會產生高達3000多萬個行為、400萬個用戶評價、300萬次搜索記錄。根據(jù)用戶的喜好制作的影視劇能帶來龐大的觀劇人群,也能在廣告的投放上做到快速有效。大數(shù)據(jù)誤區(qū)352024年9月16日上海杉達學院信息技術基礎教學部《芳華》的觀眾比《戰(zhàn)狼2》消費了更多的熱飲???在某行業(yè)會議,某航母級互聯(lián)網(wǎng)影業(yè)的發(fā)言人說:“通過大數(shù)據(jù)挖掘,我們發(fā)現(xiàn)不同觀眾的相關賣品偏好。比如《芳華》的觀眾比《戰(zhàn)狼2》消費了更多的熱飲。這些都是以前我們所不知道的,也無法預測的?!碑斶@一番言論出來之后,潛臺詞就是:中年人比年輕人消費了更多的熱飲。
可是,有人就提出了異議,《戰(zhàn)狼2》是7月底夏天上映,《芳華》12月15日冬季上映,冬天熱飲的需求誰都知道會比夏天的大的多得多。所以,數(shù)據(jù)分析的時候要考慮到多種影響因素,否則就會得到錯誤的結果。THANKYOUzdj@Oracle可視化概述Datavisualizationandanalysisbasis
數(shù)據(jù)可視化與分析基礎甲骨文(Oracle)簡介2024/9/168:52上海杉達學院信息技術基礎教學部38甲骨文公司,全稱甲骨文股份有限公司(甲骨文軟件系統(tǒng)有限公司),是全球有名的企業(yè)級軟件公司,總部位于美國加利福尼亞州。甲骨文公司向一百多個國家的用戶提供數(shù)據(jù)庫、工具和應用軟件以及相關的咨詢、培訓和支持服務。全球數(shù)據(jù)庫排行榜,Oracle排名第一,1989年正式進入中國市場。據(jù)統(tǒng)計,2015年中國數(shù)據(jù)庫市場,Oracle市場占有份額高達56%,而在全球Oracle占有率為43.9%。Oracle數(shù)據(jù)可視化應用軟件,是一款集數(shù)據(jù)整理、數(shù)據(jù)可視化、數(shù)據(jù)挖掘(機器學習)為一體的敏捷數(shù)據(jù)分析軟件,于2015年正式發(fā)布。Oracle項目保存在C盤,如需備份可將項目導出到D盤,導出的文件格式為.dva。Oracle可視化工作流程2024/9/168:52上海杉達學院信息技術基礎教學部39創(chuàng)建項目添加數(shù)據(jù)添加畫布分析制作圖表匯總敘述主頁2024/9/168:52上海杉達學院信息技術基礎教學部40打開Oracle可視化軟件會顯示“主頁”,其中包含了新增內容、項目、數(shù)據(jù)集、數(shù)據(jù)流等類別。鼠標單擊“主頁”右上角“頁菜單”按鈕中的“定制主頁…”,用戶可以根據(jù)自己的喜好對主頁中顯示的類別進行自定義。鼠標單擊“主頁”左上角“導航器”按鈕可以切換“目錄”、“數(shù)據(jù)”等欄目。導入數(shù)據(jù)2024/9/168:52上海杉達學院信息技術基礎教學部41Oracle支持多種數(shù)據(jù)文件,如Excel電子表格(.xls、.xlsx),文本文件(.TXT)等。
使用“創(chuàng)建數(shù)據(jù)集”的方式。Oracle支持多種數(shù)據(jù)庫,如Oracle、SQLServer,Access等。使用“創(chuàng)建連接”的方式。創(chuàng)建項目2024/9/168:52上海杉達學院信息技術基礎教學部42【范例】(P21/2-1)打開Oracle可視化軟件,創(chuàng)建項目,命名為“銷售分析”,添加2個名為“全國訂單明細”和“退單”的數(shù)據(jù)集,數(shù)據(jù)源為“某公司銷售數(shù)據(jù).xlsx”中的“全國訂單明細”和“退單”工作表,兩個數(shù)據(jù)集按照訂單號進行整合。【步驟】創(chuàng)建項目,保存項目,命名為“銷售分析”。創(chuàng)建數(shù)據(jù)集“全國訂單明細”。創(chuàng)建數(shù)據(jù)集“退單”。兩個數(shù)據(jù)集整合。保存。項目的導入與導出2024/9/168:52上海杉達學院信息技術基礎教學部43用戶可以通過項目的導出來備份項目。用戶可以通過項目的導入來重建項目。度量和屬性2024/9/168:52上海杉達學院信息技術基礎教學部44Oracle可視化軟件會將數(shù)據(jù)集中的每個字段自動處理為“度量”和“屬性”。度量:又稱為定量數(shù)據(jù),一般為數(shù)值數(shù)據(jù)。屬性:又稱為定性數(shù)據(jù),一般為文本、日期或者地理數(shù)據(jù)等。Oracle提供了很多預設的聚合計算(聚合表示多個值聚集為一個數(shù)值),例如,總和、平均值、最大值、最小值、計數(shù)、相異值計數(shù)等。Oracle不會對屬性字段進行聚合,如果要對該字段的值進行聚合,那么該字段必須轉換為度量。將度量字段添加到畫布,Oracle將對該字段進行求和計算。在“屬性”面板中可修改聚合方式。當OracleAD將字段標識為不正確的數(shù)據(jù)類型時,單擊該字段右側的按鈕(選項按鈕),或者選中字段后右擊,通過快捷菜單中的“轉換為文本”“轉換為數(shù)字”“轉換為日期”選項可以對字段進行數(shù)據(jù)類型的轉換?!痉独浚≒37/2-6)Oracle將“訂單號”字段自動標識為度量(數(shù)字類型),我們需要將該字段轉換為屬性(文本類型)?!静襟E】“準備”界面中使用“轉換為文本”功能進行轉換。添加步驟,應用腳本。保存。轉換數(shù)據(jù)類型2024/9/168:52上海杉達學院信息技術基礎教學部45“連接”功能可以將各種數(shù)據(jù)類型的字段連接起來,生成一個新字段。【范例】(P38/2-7)將“運輸方式”字段、“運送日期”字段和“運輸成本”字段中的值進行合并,合并后的值保存至新建字段,該字段命名為“運輸匯總”,合并時的分隔符設置為短劃線?!静襟E】“準備”界面中使用“連接”功能進行數(shù)據(jù)合并。設置連接屬性。添加步驟,應用腳本。保存。數(shù)據(jù)連接2024/9/168:52上海杉達學院信息技術基礎教學部46“提取”功能可以從日期類型的字段值中抽取出“年”“季度”“月”“周”“工作日”和“一年中的第幾周”等數(shù)據(jù)?!痉独浚≒39/2-8)提取出“訂單日期”字段值所屬的“季度”和“星期”數(shù)據(jù),并將提取出的數(shù)據(jù)保存至新建字段,字段分別命名為“季度”和“星期”?!静襟E】“準備”界面中使用“提取”功能進行數(shù)據(jù)提取。選擇需要提取的日期單位。字段重命名。添加步驟,應用腳本。保存。數(shù)據(jù)提取2024/9/168:52上海杉達學院信息技術基礎教學部47“拆分”功能可以依據(jù)位置或分隔符將文本值列拆分為若干個部分。【范例】(P42/2-9)從“產品包箱”字段中拆分出包箱大小和包箱類型,拆分后的數(shù)據(jù)保存至新建字段,字段分別命名為“包箱大小”和“包箱類型”,隱藏原始列?!静襟E】“準備”界面中使用“拆分”功能進行數(shù)據(jù)拆分。設置拆分屬性。添加步驟,應用腳本。保存。數(shù)據(jù)拆分2024/9/168:52上海杉達學院信息技術基礎教學部48“拆分”功能可以依據(jù)位置或分隔符將文本值列拆分為若干個部分?!痉独浚≒43/2-10)從“產品名稱”字段中拆分出產品品牌,拆分后的數(shù)據(jù)保存至新建字段,字段命名為“產品品牌”(假定“產品名稱”字段值的第1個單詞為產品品牌)。【步驟】“準備”界面中使用“拆分”功能進行數(shù)據(jù)拆分。設置拆分屬性。添加步驟,應用腳本。保存。數(shù)據(jù)拆分2024/9/168:52上海杉達學院信息技術基礎教學部49“創(chuàng)建”功能可以基于函數(shù)創(chuàng)建計算字段?!痉独浚≒44/2-11)利用函數(shù)生成顧客姓氏,生成的數(shù)據(jù)保存至新建字段,字段命名為“顧客姓氏”(假定“顧客姓名”字段值的第1個字為姓氏)。【步驟】“準備”界面中使用“創(chuàng)建”功能進行字段創(chuàng)建。設置創(chuàng)建屬性,函數(shù)表達式為LEFT(顧客姓名,1)。添加步驟,應用腳本。保存。字段創(chuàng)建2024/9/168:52上海杉達學院信息技術基礎教學部50“分組”功能可以將文本字段中的值根據(jù)用戶的需要分成若干個組。【范例】(P46/2-12)對“訂單等級”字段進行分組,其中,“高級”訂單為“A”組,“中級”訂單、“低級”訂單為“B”組,“其他”訂單為“C”組,生成的數(shù)據(jù)保存至新建字段,字段命名為“訂單等級定制”?!静襟E】“準備”界面中使用“分組”功能進行數(shù)據(jù)分組。設置分組屬性。添加步驟,應用腳本。保存。數(shù)據(jù)分組2024/9/168:52上海杉達學院信息技術基礎教學部51“收集器”功能可以將數(shù)值字段中的值根據(jù)用戶的需要分成若干個組?!痉独浚≒48/2-13)對“單價”字段創(chuàng)建收集器,按“高”(>80)、“中”(>30至80)和“低”(<=30)3個等級區(qū)間來收集數(shù)據(jù),收集的數(shù)據(jù)保存至新建字段,字段命名為“單價等級”?!静襟E】“準備”界面中使用“收集器”功能進行數(shù)據(jù)分組。設置收集器屬性。添加步驟,應用腳本。保存。數(shù)據(jù)收集器2024/9/168:52上海杉達學院信息技術基礎教學部52數(shù)據(jù)可視化工作界面2024/9/168:52上海杉達學院信息技術基礎教學部53Oracle提供了數(shù)據(jù)準備、可視化、敘述操作界面,可以通過右上角操作界面切換按鈕進行切換。數(shù)據(jù)準備界面:用于數(shù)據(jù)轉換、擴充以及數(shù)據(jù)匹配等操作。數(shù)據(jù)可視化界面:用于數(shù)據(jù)的可視化操作。數(shù)據(jù)敘述界面:用于分析匯總。數(shù)據(jù)可視化工作界面2024/9/168:52上海杉達學院信息技術基礎教學部54一旦將數(shù)據(jù)添加至可視化畫布中,就會出現(xiàn)“語法”面板。用戶可以通過“語法”面板對當前選中的可視化圖表進行自定義設計。例如,可視化圖表類型、X軸、Y軸、顏色、大小、篩選器等設置。創(chuàng)建畫布2024/9/168:52上海杉達學院信息技術基礎教學部55【范例】(P49/2-14)在“銷售分析”項目中,將第一個畫布重命名為“銷售分析”,并設置畫布寬度900px,高度500px?!静襟E】重命名畫布。設置畫布屬性。創(chuàng)建可視化圖表2024/9/168:52上海杉達學院信息技術基礎教學部56【范例】(P50/2-15、2-16、2-17)在“銷售分析”畫布的左側,顯示銷售額總額以及利潤額總額,銷售額總額顯示在上方,利潤額總額顯示在下方。在“銷售分析”畫布的右側,顯示各產品子類別的利潤額總額情況。【步驟】設置“銷售額”和“利潤額”字段的聚合方式為總和。雙擊“銷售額”字段。將“利潤額”字段拖至銷售額總和的下方。將“產品子類別”和“利潤額”字段拖至畫布右側。更改可視化類型為水平條形圖。創(chuàng)建可視化圖表2024/9/168:52上海杉達學院信息技術基礎教學部57【范例】(P54/2-18)設置畫布右側可視化圖表標題為“各產品子類別的利潤額”,顯示數(shù)據(jù)標簽,標簽位置為“上”,數(shù)字格式為“貨幣”中的“CNY/CN¥”格式,啟用數(shù)值縮寫,X軸刻度取值范圍設置為-200000~400000,適當調整可視化圖表寬度,以顯示所有數(shù)據(jù)?!静襟E】修改標題?!皩傩浴泵姘逯小爸怠边x項卡,設置利潤額的數(shù)據(jù)標簽顯示方式和數(shù)字格式?!皩傩浴泵姘逯小拜S”選項卡,設置“值軸”屬性。適當調整可視化圖表寬度。創(chuàng)建可視化圖表2024/9/168:52上海杉達學院信息技術基礎教學部58【范例】(P56/2-19)設置畫布右側可視化圖表的顏色依據(jù)為利潤額總額,利潤額總額大于0時,用綠色顯示,小于0,用紅色顯示?!静襟E】將“利潤額”字段拖到“語法”面板的顏色區(qū)域。點擊顏色區(qū)域三角形下拉菜單,選擇“管理分配…”菜單項。編輯“利潤額”的顏色。創(chuàng)建可視化圖表2024/9/168:52上海杉達學院信息技術基礎教學部59【范例】(P58/2-20)設置畫布右側可視化圖表的大小依據(jù)為運輸成本總額,設置圖例在右側顯示?!静襟E】設置“運輸成本”字段的聚合方式為總和。將“運輸成本”字段拖到“語法”面板的大小區(qū)域?!皩傩浴泵姘逯小俺R?guī)”選項卡,設置圖例顯示位置為“右”。排序與篩選2024/9/168:52上海杉達學院信息技術基礎教學部60【范例】(P59/2-21)設置畫布右側可視化圖表,按各產品子類別的利潤額總額降序排序,設置該畫布僅顯示2009年度利潤額情況?!静襟E】利潤額總額降序排序。鼠標右鍵單擊可視化圖表,在彈出的快捷菜單中選擇“排序/產品子類別,按利潤額由高到低”菜單項。添加畫布篩選器。將“訂單日期”字段拖至畫布上方“單擊此處或拖動數(shù)據(jù)以添加篩選器”區(qū)域,設置時間區(qū)域。排序與篩選2024/9/168:52上海杉達學院信息技術基礎教學部61【范例】(P62/2-22有修改)設置畫布右側可視化圖表僅顯示利潤額總額小于等于100000的數(shù)據(jù),將畫布右側可視化圖表設置為主圖表,使該畫布中左側圖表僅顯示利潤額總額為負的產品子類別的相關數(shù)據(jù)。【步驟】添加右側圖表的篩選器。將“利潤額”字段拖至右側圖表語法面板中的篩選器區(qū)域,設置最大值為100000。設置右側圖表為主圖表。鼠標右鍵單擊右側可視化圖表,在彈出的右鍵菜單中選擇“用作篩選器”菜單項。選擇右側圖表中的利潤額為負值的數(shù)據(jù),即紅色水平條。導出畫布2024/9/168:52上海杉達學院信息技術基礎教學部62【范例】(P62/2-23)導出項目文件,包含數(shù)據(jù),無需密碼,命名為“銷售分析.dva”。以PDF格式導出銷售分析畫布,命名為“銷售分析.pdf”。以圖片格式導出右側可視化圖表,命名為“各產品子類別的利潤額.png”?!静襟E】鼠標單擊“銷售分析”畫布界面左上角“共享”按鈕,選擇“文件”選項,在彈出的對話框中設置導出名稱和類型等。設置保存的路徑。THANKYOUzdj@數(shù)據(jù)圖表制作Datavisualizationandanalysisbasis
數(shù)據(jù)可視化與分析基礎圖表—條形圖2024/9/168:52上海杉達學院信息技術基礎教學部65條形圖是比較常用的一種圖表,常用來分析每類數(shù)據(jù)“有多少”的問題。條形圖的X軸表示維度,Y軸表示數(shù)值。條形圖橫置時稱為水平條形圖。應用場景:適合多個分類的數(shù)據(jù)對比。條形圖堆疊條形圖100%堆疊條形圖水平條形圖圖表—條形圖2024/9/168:52上海杉達學院信息技術基礎教學部66【范例】(P67/3-1)在“銷售分析”項目中,新建畫布命名為“產品子類別的訂單數(shù)量分析”,分析3大產品類別中各產品子類別的訂單數(shù)量情況。在右側使用條形圖顯示“產品包箱”為“巨型木箱”和“巨型紙箱”的訂單數(shù)量情況。在左側使用堆疊條形圖顯示的訂單數(shù)量情況?!静襟E】條形圖:格狀圖列為“產品類別”,值(Y軸)為“訂單數(shù)量”,類別(X軸)為“產品子類別”,篩選“產品包箱”字段中“巨型木箱”和“巨型紙箱”,按訂單數(shù)量的降序排列,圖表標題為“條形圖”。堆疊條形圖:修改圖表標題為“堆疊條形圖”,居中顯示數(shù)據(jù)標簽。圖表—條形圖2024/9/168:52上海杉達學院信息技術基礎教學部67【范例】(P72/3-2)新建畫布命名為“運輸成本分布”,分析運輸成本的分布情況?!静襟E】根據(jù)運輸成本的多少,利用“收集器”分為5個組。對“運輸成本”字段進行聚合(計數(shù)運算)。制作條形圖。修改圖表標題為“運輸成本分布”。在上方顯示數(shù)據(jù)標簽?!咀⒁狻吭诋斍皥D表中修改字段的聚合方式,會影響其它圖表中相同字段的聚合,所以,當一個字段需要多種聚合時,可以使用計算字段完成,詳見第四章。圖表—線形圖2024/9/168:52上海杉達學院信息技術基礎教學部68線形圖也是較為常用的一種圖表,通常用來顯示數(shù)據(jù)隨時間變化的趨勢。應用場景:通常用來顯示在相等時間間隔下的或有序類別的數(shù)據(jù)變化趨勢。局限性:無序的類別無法適用。圖表—線形圖2024/9/168:52上海杉達學院信息技術基礎教學部69【范例】(P78/3-3)新建畫布命名為“線形圖”,分析3個產品類別每月的利潤額總額的情況?!静襟E】制作線形圖。值(Y軸)為“利潤額”,類別(X軸)為“訂單日期”,顏色依據(jù)為“產品類別”?!坝唵稳掌凇钡娘@示方式設置為“第幾月”。修改圖表標題為“累計月份利潤額”。設置圖例顯示在右側。設置X軸無標題。設置顏色為“光譜”調色板,“辦公用品”類別顏色為藍色(#160fad)、“家具產品”類別顏色為橙色(#f69000)、“技術用品”類別顏色為紅色(#f30900)。圖表—面積圖2024/9/168:52上海杉達學院信息技術基礎教學部70面積圖又稱區(qū)域圖,用面積表示隨時間或類別而變化的數(shù)據(jù)情況,同時也能體現(xiàn)總數(shù)據(jù)量的變化情況。面積圖與線性圖相似,線形圖突出各數(shù)據(jù)量的對比,面積圖突出總量的變化。圖表—面積圖2024/9/168:52上海杉達學院信息技術基礎教學部71【范例】(P82/3-4)修改“線形圖”畫布的名稱為“產品類別利潤圖(月份)”,并在畫布下方制作面積圖,
分析3個產品類別每月的利潤額總額的情況?!静襟E】在可視化圖表“累計月份利潤額”的下方,復制或制作一個相同的圖表。將下方的圖表類型設置為“面積圖”。圖表—餅圖2024/9/168:52上海杉達學院信息技術基礎教學部72餅圖主要用于顯示一個數(shù)據(jù)系列中各類別數(shù)據(jù)的多少與總和的比例。扇形表示數(shù)據(jù)占比大小,面積越大占比越大。應用場景:用來顯示一個數(shù)據(jù)系列中各類別的所占比例。局限性:不能體現(xiàn)出數(shù)據(jù)中的負值數(shù)據(jù)。圖表—餅圖2024/9/168:52上海杉達學院信息技術基礎教學部73【范例】(P84/3-5)新建畫布命名為“各產品類別訂單數(shù)量占比”,分析3個產品類別每年訂單數(shù)量總計的占比情況?!静襟E】制作餅圖?!坝唵稳掌凇钡娘@示方式設置為“年”。設置格狀圖列為“訂單日期”。顯示數(shù)據(jù)標簽,顯示形式為百分比。修改圖表標題為“各產品類別訂單數(shù)量占比”。圖例顯示在圖表上方?!咀⒁狻俊碍h(huán)形”圖與餅圖類似,環(huán)形圖中間可以顯示數(shù)據(jù)總計。圖表—旭日圖2024/9/168:52上海杉達學院信息技術基礎教學部74旭日圖相當于多個餅圖的組合,不僅可以體現(xiàn)多層結構數(shù)據(jù)的各類別數(shù)據(jù)的大小與總和的比例關系,還能展示數(shù)據(jù)之間的層次關系。在旭日圖中,一個圓環(huán)表示一個層級的數(shù)據(jù),圓環(huán)中的各段代表數(shù)據(jù)在該層級的占比,最內層圓環(huán)的數(shù)據(jù)層級最高,越往外,層級越低,且數(shù)據(jù)分類越細。圖表—旭日圖2024/9/168:52上海杉達學院信息技術基礎教學部75【范例】(P88/3-6)在“各產品類別訂單數(shù)量占比”畫布的上方制作旭日圖,分析3個產品類別中各個產品子類別的訂單數(shù)量總計的占比情況?!静襟E】制作旭日圖。修改圖表標題為“訂單數(shù)量占比-多層結構”。顯示數(shù)據(jù)標簽,顯示方式為“百分比”和“標簽”,按組顯示百分比。圖表—樹狀圖2024/9/168:52上海杉達學院信息技術基礎教學部76樹狀圖,又稱為矩形式樹狀結構圖(Treemap),它直觀地以面積表示數(shù)據(jù)的多少。應用場景:適合用于展示各類別數(shù)據(jù)對比情況。局限性:當分類占比太小會變得很難排版。圖表—樹狀圖2024/9/168:52上海杉達學院信息技術基礎教學部77【范例】(P91/3-7)在“各產品類別訂單數(shù)量占比”畫布右上方添加一個樹狀圖,分析各產品子類別的訂單數(shù)量情況?!静襟E】制作樹狀圖。修改圖表標題為“各產品子類別的訂單數(shù)量”。不顯示圖例。數(shù)據(jù)標簽顯示方式為“百分比”。設置顏色依據(jù)為“產品子類別”。圖表—雷達線2024/9/168:52上海杉達學院信息技術基礎教學部78雷達線是顯示多個變量的常用圖示方法,也稱為雷達圖,蜘蛛圖,星圖,不規(guī)則多邊形,極坐標圖或Kiviat圖等,是以從同一點開始的軸上表示的多個數(shù)據(jù)量的二維圖表形式,它相當于平行坐標圖的軸徑向排列。應用場景:顯示或對比多變量的數(shù)值時十分有效。2003年我國城鄉(xiāng)居民家庭人均消費支出圖表—雷達線2024/9/168:52上海杉達學院信息技術基礎教學部79【范例】(P93/3-8有修改)新建畫布命名為“利潤額與銷售額”,分析各產品子類別的銷售額總額和利潤額總額的對比情況。【步驟】制作雷達線。修改圖表標題為“銷售額與利潤額”。修改線形圖類型為“曲線”。圖表—網(wǎng)格熱圖2024/9/168:52上海杉達學院信息技術基礎教學部80網(wǎng)格熱圖是將數(shù)據(jù)以顏色塊的形式來表示,可以將紛繁的數(shù)據(jù)交叉表轉變?yōu)樯鷦?、直觀的可視圖。應用場景:適合用于區(qū)分和對比兩組或多組分類數(shù)據(jù)。局限性:雖然通過顏色可以非常容易了解到數(shù)據(jù)的整體對比情況,但不適合顯示數(shù)據(jù)中的某些統(tǒng)計信息,如最大、最小值等。圖表—網(wǎng)格熱圖2024/9/168:52上海杉達學院信息技術基礎教學部81【范例】(P95/3-9)在“利潤額與銷售額”畫布右側添加一個可視化圖表,分析各省份每月的利潤額總額的情況?!静襟E】制作網(wǎng)格熱圖,“省份”為X軸的依據(jù)?!坝唵稳掌凇钡娘@示方式設置為“第幾月”。修改圖表標題為“各省利潤額(月份)”。設置每月利潤額大于10000的色塊為紅色,否則為藍色。圖表—標記云2024/9/168:52上海杉達學院信息技術基礎教學部82標記云,又稱詞云圖,文字云,主要用文字的大小表示數(shù)據(jù)的多少,一個詞顯示越大表示數(shù)據(jù)量越大。應用場景:一般與文本挖掘結合使用。局限性:不適用于數(shù)據(jù)太少或數(shù)據(jù)區(qū)分度不大的文本。圖表—標記云2024/9/168:52上海杉達學院信息技術基礎教學部83【范例】(P98/3-10)在“利潤額與銷售額”畫布的下方添加一個可視化圖表,分析各產品子類別的利潤額總額情況?!静襟E】制作標記云。設置圖表無標題,無圖例。設置顏色依據(jù)為“產品子類別”。圖表—散點圖2024/9/168:52上海杉達學院信息技術基礎教學部84散點圖也叫X-Y圖,用兩組數(shù)據(jù)構成多個坐標點,考察坐標點的分布模式。應用場景:適合考察兩組數(shù)據(jù)之間是否存在某種關聯(lián),散點圖中包含的數(shù)據(jù)越多,分析結果就越準確。局限性:不適合數(shù)據(jù)量少的分析。不相關-數(shù)據(jù)點排列無序
負相關-數(shù)據(jù)點以右下的趨勢下降正相關-數(shù)據(jù)點以右上的趨勢上升圖表—散點圖2024/9/168:52上海杉達學院信息技術基礎教學部85【范例】(P101/3-11、3-12)在“利潤額與銷售額”畫布的右下方添加一個可視化圖表,分析各產品子類別的銷售額總額和利潤額總額的關系。在該可視化圖表下方,復制一個同樣的圖表,分析各產品子類別的銷售額總額、利潤額總額和單價的關系。【步驟】制作散點圖。修改圖表標題為“銷售額與利潤額”。設置顏色依據(jù)為“產品類別”。添加趨勢線。復制可視化圖表,放置在原圖表的下方。無圖例,無趨勢線。設置大小的依據(jù)為“單價”。圖表—組合圖2024/9/168:52上海杉達學院信息技術基礎教學部86組合圖:又稱為雙軸圖,將兩個圖表組合起來對比數(shù)據(jù),比如在柱狀圖上疊加折線圖等。應用場景:適合對比兩組數(shù)據(jù)。局限性:不適合大于兩組的數(shù)據(jù)對比。圖表—組合圖2024/9/168:52上海杉達學院信息技術基礎教學部87【范例】(P106/3-13)在“運輸成本分布”畫布下方添加一個可視化圖表,分析各省份的利潤額總額與運輸成本總額的情況?!静襟E】制作組合圖。設置“運輸成本”總額使用Y2軸顯示?!袄麧欘~”使用折線圖,“運輸成本”使用面積圖。修改圖表標題為“組合圖”。設置值軸刻度為-50K~300K。設置次值軸刻度-1.3K~7.5K。【注意】此處的運輸成本應該是總和,但實際卻是計數(shù),該問題的可通過計算字段來解決,詳見第四章。圖表—瀑布圖2024/9/168:52上海杉達學院信息技術基礎教學部88瀑布圖可以描述數(shù)據(jù)從初始值受到一系列的正值或者負值影響后得到結果的整個過程。應用場景:適合描述數(shù)據(jù)的演變過程。圖表—瀑布圖2024/9/168:52上海杉達學院信息技術基礎教學部89【范例】(P110/3-14)新建畫布命名為“訂單數(shù)量變化”,分析每年各個季度的訂單量變化情況?!静襟E】制作瀑布圖?!坝唵稳掌凇钡娘@示方式設置為“季度”。修改圖表標題為“瀑布圖”。圖表—箱線圖2024/9/168:52上海杉達學院信息技術基礎教學部90箱線圖又稱為盒須圖、盒式圖或箱形圖,是一種用作顯示一組數(shù)據(jù)分散情況的統(tǒng)計圖,因形狀如箱子而得名。應用場景:適用于反映數(shù)據(jù)的分布特征,箱線圖中的箱體表示數(shù)據(jù)的集中范圍,箱體越短表示數(shù)據(jù)分布越集中,反之,數(shù)據(jù)分布越離散。最小值Min下四分位數(shù)QL最大值Max
中位數(shù)Me上四分位數(shù)QU圖表—箱線圖2024/9/168:52上海杉達學院信息技術基礎教學部91【范例】(P114/3-15)新建畫布命名為“各產品子類別利潤分布”,分析各季度各產品子類別的利潤額總額分布情況。【步驟】制作水平箱線圖。設置詳細信息依據(jù)為“產品子類別”?!坝唵稳掌凇钡娘@示方式設置為“第幾季度”。按“訂單日期”從早到晚排序。修改圖表標題為“各產品子類別利潤分布”。圖表—地圖2024/9/168:52上海杉達學院信息技術基礎教學部92地圖主要用于分析和展示與地理位置相關的數(shù)據(jù),地理數(shù)據(jù)包括國家、省、市等。應用場景:適用于地理位置數(shù)據(jù)的分析。局限性:無地理位置數(shù)據(jù)不適合使用。圖表—地圖2024/9/168:52上海杉達學院信息技術基礎教學部93【范例】(P116/3-16)新建畫布命名為“地圖”,分析各個城市的銷售額總額的情況,突出顯示北京、上海和深圳的銷售額總額情況?!静襟E】創(chuàng)建地圖。修改圖表標題為“地圖”。設置背景地圖為“Oracle地圖”,設置層類型為“點圖”,透明度為“20”。篩選城市:北京、上海和深圳?!咀⒁狻靠商砑影俣鹊貓D??刂婆_欄目中添加地圖背景和地圖層。創(chuàng)建故事(敘述)2024/9/168:52上海杉達學院信息技術基礎教學部94創(chuàng)建故事,也稱之為敘述,可以將多個畫布的分析結果匯總到一起,用于展示整個數(shù)據(jù)分析過程。【范例】(P118)創(chuàng)建一個敘述,將所有畫布添加至敘述,導出所有故事頁,命名為“故事.pptx”。導出項目,命名為“銷售分析.dva”,需包含數(shù)據(jù),無需密碼。上交作業(yè):將兩個文件打包上交,壓縮包命名“銷售分析.rar”。THANKYOUzdj@Datavisualizationandanalysisbasis數(shù)據(jù)公式與函數(shù)教師:張丹玨辦公室:實驗樓9103室zdj@常量與運算符上海杉達學院97常量:指的是始終保持相同值的數(shù)據(jù),有日期型常量(如:“2020-9-1”)、數(shù)字型常量(如:“123456”)及字符串常量(如:“你好”)等。在公式中的使用過程中,需要注意引用的是常量還是字段,不同的引用,產生的結果也會不同。算數(shù)運算符含義舉例+(加號)加法運算5+5-(減號)減法運算負數(shù)5-2-5*(星號)乘法運算5*5/(正斜杠)除法運算5/5%(百分號)百分比20%^(冪字符)乘方運算5^2比較運算符含義舉例=(等號)等于A1=B1>(大于號)大于A1>B1<(小于號)小于A1<B1>=(大于等于號)大于等于A1>=B1<=(小于等于號)小于等于A1<=B1<>(不等于號)不等于A1<>B1邏輯運算符含義舉例邏輯與,AND(&&)expr1&&expr2expr1、expr2均為真,返回值為真;否則,返回為假1&&1=True1&&0=False0&&0=False邏輯或,OR(||)expr1||expr2expr1、expr2均為假,返回值為假;否則,返回為真1||1=True1||0=True0||0=False邏輯非,NOT(!)!exprexpr為真,返回值為假;否則為真!1=0!0=1常量與運算符上海杉達學院98運算符優(yōu)先級【范例】1&&3+2^2=101&&3+4=101&&7=101&&00公式上海杉達學院99在使用公式的時候,添加計算的數(shù)據(jù)元素存儲在數(shù)據(jù)集的“我的計算”文件夾中。如果項目中僅包含單個數(shù)據(jù)集或一組連接的數(shù)據(jù)集,只有一個“我的計算”文件夾,新的計算數(shù)據(jù)元素將添加到該文件夾中。如果項目中包含多個數(shù)據(jù)集,每組連接的和未連接的數(shù)據(jù)集都有一個“我的計算”文件夾?!痉独浚≒123/4-1)在“銷售分析”項目中,創(chuàng)建一個新計算字段“銷售利潤率”,并進行可視化分析?!静襟E】新建計算字段“銷售利潤率”,公式為利潤額總額除以銷售額總額。將畫布1重命名為“公式”。分析每個產品類別的銷售額總額、利潤額總額和銷售利潤率的情況,用數(shù)據(jù)透視表展示。設置顏色的依據(jù)為銷售利潤率,圖表的標題為“各產品類別銷售利潤率”,在頂部顯示圖例。函數(shù)上海杉達學院100在Oracle可視化軟件中,為了減少操作步驟,提高運算速度,用戶可以通過函數(shù)來簡化公式的計算過程。函數(shù)的輸入過程跟公式的輸入類似,只需要在“新建計算”對話框中,將需要的函數(shù)添加在計算的編輯框中,按照函數(shù)語法設置相關參數(shù)即可。Oracle可視化軟件中預設了多種類型的函數(shù),主要包含聚合函數(shù)、運行聚合函數(shù)、字符串函數(shù)、數(shù)學函數(shù)、日歷/日期函數(shù)、轉換函數(shù)、系統(tǒng)函數(shù)、表達式函數(shù)、時間序列計算函數(shù)、篩選器函數(shù)、分析函數(shù)、空間函數(shù)等多種主題函數(shù)。常用函數(shù)——計數(shù)、相異值計數(shù)上海杉達學院101Count功能:計算表達式中包含非空值的行數(shù)。語法:COUNT(expr)【范例】在“銷售分析”項目中,將“公式”畫布重命名為“公式與函數(shù)”,創(chuàng)建兩個新計算字段“產品包箱計數(shù)”和“產品包箱相異值計數(shù)”,在原有圖表的下方添加一個圖表,分析各產品類別的產品包箱種類數(shù)目,用數(shù)據(jù)表展示。【步驟】將“公式”畫布重命名為“公式與函數(shù)”。新建計算字段“產品包箱計數(shù)”,公式為COUNT(產品包箱)。新建計算字段“產品包箱相異值計數(shù)”,公式為COUNT(DISTINCT產品包箱)。分析各產品類別的產品包箱種類數(shù)目,用數(shù)據(jù)表展示。設置圖表的標題為“計數(shù)比較”,辦公用品的顏色為藍色(#2329ba)。CountDistinct功能:對計數(shù)函數(shù)進行相異處理,當計數(shù)項有重復時,不進行累計計數(shù)。語法:COUNT(DISTINCTexpr)常用函數(shù)——字符串函數(shù)上海杉達學院102Length功能:返回指定字符串的長度,以字符數(shù)為單位。語法:LENGTH(expr)【范例】在“銷售分析”項目中,創(chuàng)建兩個新計算字段“姓名字符數(shù)”和“位置”,在可視化圖表“計數(shù)比較”的下方添加一個圖表,顯示姓名中包含“紅”字的顧客信息,用數(shù)據(jù)表展示?!静襟E】新建計算字段“姓名字符數(shù)”,公式為LENGTH(顧客姓名)。顯示顧客姓名和姓名字符數(shù),用數(shù)據(jù)表展示。新建計算字段“位置”,公式為LOCATE('紅',顧客姓名)。設置篩選器,顯示位置不為0的顧客信息。設置圖表的標題為“姓名中包含“紅”字的顧客”。Locate功能:返回字符串在另一個字符串中的位置,以數(shù)字表示。語法:LOCATE(expr1,expr2)常用函數(shù)——時間函數(shù)上海杉達學院103TimestampDiff功能:返回兩個時間之間指定時間單位的間隔。語法:TIMESTAMPDIFF(interval,timestamp1,timestamp2)【范例】在“銷售分析”項目中,創(chuàng)建一個新計算字段“訂單反應時間(周)”,在現(xiàn)有的可視化圖表的右側添加一個圖表,分析各運輸方式及時間間隔的訂單數(shù)量,用數(shù)據(jù)表展示?!静襟E】新建計算字段“訂單反應時間(周)”,公式為TIMESTAMPDIFF(SQL_TSI_WEEK,訂單日期,運送日期)。分析各運輸方式及時間間隔的訂單數(shù)量,用數(shù)據(jù)表展示。按“訂單反應時間(周)”升序排列。設置圖表的標題為“各運輸方式及時間間隔的訂單數(shù)量”。常用函數(shù)——條件函數(shù)上海杉達學院104【范例】在“銷售分析”項目中,創(chuàng)建兩個新計算字段“校正利潤率1”和“校正利潤率2”,在“各產品類別銷售利潤率”可視化圖表中增加兩列,分析校正后的利潤率,用數(shù)據(jù)表展示。【步驟】新建計算字段“校正利潤率1”,公式為CASE產品類別WHEN‘家具產品’THEN(利潤額-運輸成本)/銷售額ELSE利潤額/銷售額END。新建計算字段“校正利潤率2”,公式為CASEWHEN產品類別=‘家具產品’THEN(利潤額-運輸成本)/銷售額ELSE利潤額/銷售額END。將兩個計算字段添加到“各產品類別銷售利潤率”可視化圖表中。Case(Switch)功能:根據(jù)表達式的值,返回相應的數(shù)據(jù)。語法:CASE表達式WHEN值1THEN返回的數(shù)據(jù)1WHEN值2THEN返回的數(shù)據(jù)2ELSE返回的數(shù)據(jù)3ENDCase(if)功能:根據(jù)表達式的值,返回相應的數(shù)據(jù)。語法:CASEWHEN表達式=值1THEN返回的數(shù)據(jù)1WHEN表達式=值2THEN返回的數(shù)據(jù)2ELSE返回的數(shù)據(jù)3ENDThankyouzdj@數(shù)據(jù)可視化案例Datavisualizationandanalysisbasis
數(shù)據(jù)可視化與分析基礎數(shù)據(jù)獲取2024/9/168:52上海杉達學院信息技術基礎教學部107一、公開數(shù)據(jù)庫常用數(shù)據(jù)公開網(wǎng)站:中華人民共和國國家統(tǒng)計局、百度、阿里巴巴、亞馬遜等。二、互聯(lián)網(wǎng)數(shù)據(jù)使用爬蟲爬取網(wǎng)站上的數(shù)據(jù),但需要一定的技術水平。三、數(shù)據(jù)交易平臺由于現(xiàn)在數(shù)據(jù)的需求很大,也催生了很多做數(shù)據(jù)交易的平臺,這些平臺提供各個行業(yè)的脫敏數(shù)據(jù),但需要付費購買。四、與行業(yè)企業(yè)合作通過合作可獲取相關企業(yè)的高附加值數(shù)據(jù),這是數(shù)據(jù)獲取中較為有效的途徑。圖解中國能源2024/9/168:52上海杉達學院信息技術基礎教學部108能源是指能夠提供能量的資源,它是整個世界發(fā)展和經(jīng)濟增長的最基本驅動力,是人類賴以生存的基礎,是各國國民經(jīng)濟的重要物質基礎,能源的開發(fā)和有效利用程度是各國國力和生產、生活水平的重要標志。自工業(yè)革命以來,能源問題就開始出現(xiàn)。當前世界能源消費以石油、天然氣資源為主,也有部分國家以煤資源為主,不管是何種能源結構,人類面臨的能源危機都日趨嚴重,新能源的開發(fā)刻不容緩。在《中華人民共和國節(jié)約能源法》中所稱的能源,是指煤炭、石油、天然氣、生物質能和電力、熱力以及其他直接或者通過加工、轉換而取得有用能的各種資源。圖解中國能源——數(shù)據(jù)整理2024/9/168:52上海杉達學院信息技術基礎教學部109本次關于中國能源的數(shù)據(jù)均來自國家統(tǒng)計局網(wǎng)上公布的年度數(shù)據(jù)(/),數(shù)據(jù)顯示了2000年~2018年我國能源生產和消耗總量,以及四類能源(原煤、原油、天然氣、新能源)的生產和消耗情況。圖解中國能源——數(shù)據(jù)整理2024/9/168:52上海杉達學院信息技術基礎教學部110為了便于后續(xù)的數(shù)據(jù)分析,我們需要把該數(shù)據(jù)的行列置換,即設置能源種類為列,時間為行。新建兩張數(shù)據(jù)表“能源生產數(shù)據(jù)”和“能源消耗數(shù)據(jù)”,用于存放行列置換后的數(shù)據(jù)。行列置換可利用Excel中復制粘貼數(shù)據(jù)時的轉置功能(使用“開始”選項卡“剪貼板”組中的“粘貼”下拉菜單中的“轉置”菜單項,即可得到轉置后的數(shù)據(jù))。圖解中國能源——項目創(chuàng)建和數(shù)據(jù)導入2024/9/168:52上海杉達學院信息技術基礎教學部111在Oracle中創(chuàng)建項目“圖解中國能源”,并將數(shù)據(jù)導入,數(shù)據(jù)集命名為“能源生產數(shù)據(jù)”和“能源消耗數(shù)據(jù)”,整合兩張數(shù)據(jù)表(匹配項為“時間”)。圖解中國能源——能源概況2024/9/168:52上海杉達學院信息技術基礎教學部112能源總量差額分析我們利用條形圖顯示每年的能源生產總量,利用線性圖顯示每年的能源消耗總量,從中可以看出我國的能源生產總量和消耗總量都是逐年上升的,但是,每年的消耗總量均大于生產總量,也就是說,為了滿足能源需求,我國每年都需要進口能源,且進口數(shù)量逐年提高。四類能源的差額根據(jù)我們獲得的數(shù)據(jù)顯示,我國能源主要分為四個大類,原煤、原油、天然氣和新能源,在我國能源總量存在缺口的情況下,我們發(fā)現(xiàn)四類能源中,新能源基本上能夠自給自足,其他三類能源都存在缺口,且缺口逐年加大,其中,缺口最大的是原油。圖解中國能源——能源概況2024/9/168:52上海杉達學院信息技術基礎教學部113能源總量差額分析【操作步驟】(1)將第一張畫布命名為“能源概況”。(2)向畫布中添加三個字段數(shù)據(jù),“時間”、“能源生產總量”和“能源消耗總量”。(3)在語法面板中,設置可視化類型為“組合圖”。(4)在語法面板中,設置Y軸的依據(jù)為“能源生產總量”和“能源消耗總量”,X軸的依據(jù)為“時間”。(5)在語法面板中,設置Y軸中的“能源生產總量”以條形圖顯示。(6)在語法面板中,設置Y軸中的“能源消耗總量”以線性圖顯示。(7)在屬性面板中,設置該可視化圖表的標題為“能源總量差額”。四類能源的差額【操作步驟】(1)在數(shù)據(jù)面板中,添加計算字段“原煤差額”,計算公式為:原煤生產-原煤消耗。(2)同樣操作,添加計算字段“原油差額”、“天然氣差額”和“新能源差額”。(3)在“能源總量差額”可視化圖表下方,添加五個字段數(shù)據(jù),“時間”、“原煤差額”、“原油差額”、“天然氣差額”和“新能源差額”。(4)在語法面板中,設置可視化類型為“表”。(5)在語法面板中,設置行軸的依據(jù)為“原煤差額”、“原油差額”、“天然氣差額”和“新能源差額”。(6)在屬性面板中,設置該可視化圖表的標題為“四類能源差額”。圖解中國能源——四類能源生產與消耗比例2024/9/168:52上海杉達學院信息技術基礎教學部114每年四類能源生產比例我們發(fā)現(xiàn)我國的能源生產總量是逐年上升的,四類能源中原煤生產量的比例最大,約占總量的四分之三,其余三類能源生產量總計約占四分之一。每年四類能源消耗比例我們發(fā)現(xiàn)我國的能源消耗總量是逐年上升的,四類能源中原煤消耗量的比例最大,約占總量的四分之三,其余三類能源消耗量總計約占四分之一。篩選為了方便比較各個年份的四類能源的比例,我們選取第一年(2000年)、中間年份(2009年)以及最后一年(2018年)的數(shù)據(jù)進行比較,我們發(fā)現(xiàn)原煤、原油的生產和消耗量的比例都有所下降,而天然氣、新能源的生產和消耗量的比例都有所上升。圖解中國能源——四類能源生產與消耗比例2024/9/168:52上海杉達學院信息技術基礎教學部115每年四類能源生產比例【操作步驟】(1)新建畫布,命名為“四類能源生產與消耗比例”。(2)向畫布中添加五個字段數(shù)據(jù),“時間”、“原煤生產”、“原油生產”、“天然氣生產”和“新能源生產”。(3)在語法面板中,設置可視化類型為“環(huán)形”,設置格狀圖列的依據(jù)為“時間”。設置值的依據(jù)為“原煤生產”、“原油生產”、“天然氣生產”和“新能源生產”。(4)在屬性面板中,設置該可視化圖表的標題為“每年四類能源生產比例”。每年四類能源消耗比例【操作步驟】(1)選擇“每年四類能源生產比例”可視化圖表,鼠標右鍵單擊,在彈出的快捷菜單中,選擇“編輯”/“重復可視化”選項,復制一個相同的可視化圖表。(2)選擇下方的可視化圖表,在語法面板中,設置值的依據(jù)為“原煤消耗”、“原油消耗”、“天然氣消耗”和“新能源消耗”。(3)在屬性面板中,設置該可視化圖表的標題為“每年四類能源消耗比例”。篩選
【操作步驟】(1)將“時間”字段添加到畫布上方的篩選器中。(2)篩選出“2000年”、“2009年”和“2018年”。如需要比較其他年份,也可篩選出其他相應年份數(shù)據(jù)。圖解中國能源——敘述2024/9/168:52上海杉達學院信息技術基礎教學部116將做好的兩張畫布添加到敘述中,方便演示。【操作步驟】切換到“敘述”界面,依次添加兩張畫布。點擊右上角的“表示”按鈕,用于演示。演示結束,可單擊右上角的關閉按鈕退出表示模式,最后,保存并導出該項目文件(包含數(shù)據(jù),無需密碼),項目文件命名為“圖解中國能源.dva”。導出項目中的兩張畫布,分別命名為“能源概況.png”和“四類能源生產與消耗比例.png”。圖解新冠肺炎疫情發(fā)展2024/9/168:52上海杉達學院信息技術基礎教學部1172020年,一場疫情在春節(jié)期間彌漫開來,被稱為新型冠狀病毒肺炎(CoronaVirusDisease2019,COVID-19,簡稱“新冠肺炎”)的疫情發(fā)展牽動著全國人民的心,這是一場沒有硝煙的戰(zhàn)爭,使每個人都難以置身事外,疫情發(fā)生一個月后,其確診病例已超2003年的“非典”疫情。圖解新冠肺炎疫情發(fā)展——數(shù)據(jù)整理2024/9/168:52上海杉達學院信息技術基礎教學部118本次關于新冠肺炎疫情發(fā)展的數(shù)據(jù)均來自網(wǎng)絡,數(shù)據(jù)顯示了我國各省各市2020年1月24日~2月26日的疫情情況。圖解新冠肺炎疫情發(fā)展——數(shù)據(jù)整理、項目創(chuàng)建和數(shù)據(jù)導入2024/9/168:52上海杉達學院信息技術基礎教學部119我們把相關數(shù)據(jù)復制到Excel中,發(fā)現(xiàn)數(shù)據(jù)中包含一些空行,為了便于后續(xù)的數(shù)據(jù)分析,我們需要把這些空行刪除。刪除空行可以利用Excel中的定位功能(“開始”選項卡“編輯”組中的“查找和選擇”下拉菜單中的“定位條件”菜單項,在彈出的“定位條件”對話框中,選擇“空值”選項),定位空行,然后刪除行。在Oracle中創(chuàng)建項目“圖解新冠肺炎疫情發(fā)展”,并將數(shù)據(jù)導入,數(shù)據(jù)集命名為“疫情數(shù)據(jù)”。圖解新冠肺炎疫情發(fā)展——疫情概況2024/9/168:52上海杉達學院信息技術基礎教學部120疫情人數(shù)情況我們利用磁貼顯示我國在2020年1月24日~2月26日期間的疫情人數(shù)情況,通過鼠標點擊上方的日期,可以顯示指定日期的新冠肺炎累計確診人數(shù)、治愈人數(shù)以及死亡人數(shù)。全國疫情地圖我們利用地圖顯示我國各個省份的疫情確診人數(shù),我們發(fā)現(xiàn),截止到2月26日,湖北省累計確診人數(shù)達到了6萬5千多,約占全國總數(shù)的80%以上。為了比較各個省份的疫情數(shù)據(jù),我們考慮將最為突出的湖北省排除,從而使各個省份的的情況以顏色深淺在地圖上體現(xiàn)出來。我們發(fā)現(xiàn),截止到2月26日,區(qū)域顏色比較深的河南省、浙江省、廣東省以及湖南省的確診人數(shù)較多,均超過了1000人,區(qū)域顏色比較淺的青海省和西藏自治區(qū)的確診人數(shù)較少,均低于50人。疫情人數(shù)情況【操作步驟】(1)將第一張畫布命名為“疫情概況”。(2)為了能夠顯示每天的疫情人數(shù),在畫布中添加“更新日期”字段數(shù)據(jù),在語法面板中,設置可視化類型為“數(shù)據(jù)透視表”,列的依據(jù)為“更新日期”,鼠標單擊“更新日期”可視化圖表右上角的菜單,勾選“用作篩選器”選項。(3)在“更新日期”可視化圖表下方添加“確診人數(shù)”字段數(shù)據(jù),在語法面板中,設置可視化類型為“磁貼”。(4)在“確診人數(shù)”可視化圖表右側,添加“治愈人數(shù)”字段數(shù)據(jù),在語法面板中,設置可視化類型為“磁貼”。(5)在“治愈人數(shù)”可視化圖表右側,添加“死亡人數(shù)”字段數(shù)據(jù),在語法面板中,設置可視化類型為“磁貼”。(6)在“更新日期”可視化圖表中任選一個日期,即可顯示當天的疫情情況。全國疫情地圖【操作步驟】(1)在“確診人數(shù)”、“治愈人數(shù)”和“死亡人數(shù)”可視化圖表的下方,添加“省份”和“確診人數(shù)”字段數(shù)據(jù)。(2)在語法面板中,設置可視化類型為“地圖”,設置類別(位置)的依據(jù)為“省份”,設置顏色的依據(jù)為“確診人數(shù)”。(3)在屬性面板中,設置背景地圖為“Oracle地圖”,設置該可視化圖表的標題為“全國疫情地圖”,無圖例。(4)選擇“全國疫情地圖”可視化圖表,鼠標右鍵單擊,在彈出的快捷菜單中,選擇“編輯”/“重復可視化”選項,復制一個相同的可視化圖表,并將復制后的可視化圖表放置到“全國疫情地圖”可視化圖表的右側。(5)在語法面板中,添加“省
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版數(shù)學七年級下冊第41課時《用加減法解二元一次方程組(三)》聽評課記錄
- 湘教版數(shù)學八年級上冊2.5《第6課時 全等三角形的性質和判定的應用》聽評課記錄1
- 聽評課記錄英語九年級
- 人教版(廣西版)九年級數(shù)學上冊聽評課記錄21.2 解一元二次方程
- 生態(tài)自然保護游合同
- 狂犬疫苗打完免責協(xié)議書(2篇)
- 蘇科版數(shù)學八年級下冊《10.2 分式的基本性質》聽評課記錄
- 部編版道德與法治七年級上冊第三單元第七課《親情之愛第三框讓家更美好》聽課評課記錄
- 【2022年新課標】部編版七年級上冊道德與法治第三單元師長情誼6-7課共5課時聽課評課記錄
- 五年級數(shù)學上冊蘇教版《認識平方千米》聽評課記錄
- 2024年湖南高速鐵路職業(yè)技術學院單招職業(yè)適應性測試題庫及答案解析
- 預應力錨索施工方案
- 豇豆生產技術規(guī)程
- MES運行管理辦法
- 奢侈品管理概論完整版教學課件全書電子講義(最新)
- 文藝美學課件
- 中藥炮制學教材
- 常見腫瘤AJCC分期手冊第八版(中文版)
- 電氣第一種第二種工作票講解pptx課件
- 工程監(jiān)理監(jiān)理工作流程圖(附表123)
- 《特種設備目錄》(2022年第114號)
評論
0/150
提交評論