地理社交網(wǎng)絡數(shù)據(jù)可視化分析系統(tǒng)的設計、開發(fā)與應用_第1頁
地理社交網(wǎng)絡數(shù)據(jù)可視化分析系統(tǒng)的設計、開發(fā)與應用_第2頁
地理社交網(wǎng)絡數(shù)據(jù)可視化分析系統(tǒng)的設計、開發(fā)與應用_第3頁
地理社交網(wǎng)絡數(shù)據(jù)可視化分析系統(tǒng)的設計、開發(fā)與應用_第4頁
地理社交網(wǎng)絡數(shù)據(jù)可視化分析系統(tǒng)的設計、開發(fā)與應用_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

地理社交網(wǎng)絡數(shù)據(jù)可視化分析系統(tǒng)的

設計、開發(fā)與應用答辯提綱緒論研究背景研究目標研究內(nèi)容研究技術路線系統(tǒng)構(gòu)建相關理論與技術可視化分析系統(tǒng)的設計與實現(xiàn)應用實例與分析總結(jié)與展望研究背景地理社交網(wǎng)絡積累的數(shù)據(jù)日益龐大,成為了極具研究價值的對象。信息可視化表達與分析是實現(xiàn)知識發(fā)現(xiàn)的重要手段,信息可視化表達與分析可大大縮短從數(shù)據(jù)分析到?jīng)Q策制定的過程。然而,目前的可視化研究著眼于多維數(shù)據(jù)、時間序列數(shù)據(jù)、層次化數(shù)據(jù)等數(shù)據(jù)的可視化,在地理社交網(wǎng)絡數(shù)據(jù)的可視化方面研究較少。研究目標開展數(shù)據(jù)交互可視化分析技術的研究。設計基于空間數(shù)據(jù)存儲的地理社交網(wǎng)絡數(shù)據(jù)可視化分析系統(tǒng)。在研究小組自主開發(fā)的地理知識云平臺上進行集成與部署。開展系統(tǒng)的典型示范應用。研究內(nèi)容開展地理社交網(wǎng)絡、空間數(shù)據(jù)存儲和信息可視化的相關理論研究。針對地理社交網(wǎng)絡數(shù)據(jù)的時間、空間和多維屬性特性,重點研究了熱力圖、聚簇圖、節(jié)點-鏈接圖、平行坐標等幾種信息可視化方法的基本原理。具體開展系統(tǒng)的需求分析、總體設計、數(shù)據(jù)模型設計以及系統(tǒng)主要功能模塊的詳細設計工作與軟件實現(xiàn),并在地理知識云平臺GeoKSCloud中實現(xiàn)集成與部署。以Foursquare數(shù)據(jù)的分析為例,開展地理社交網(wǎng)絡數(shù)據(jù)可視化分析系統(tǒng)的具體示范應用,對相關分析過程的現(xiàn)實意義進行解釋。研究技術路線圖1-1技術路線圖答辯提綱緒論系統(tǒng)構(gòu)建相關理論與技術地理社交網(wǎng)絡空間數(shù)據(jù)存儲信息可視化系統(tǒng)開發(fā)相關技術和工具

可視化分析系統(tǒng)的設計與實現(xiàn)應用實例與分析總結(jié)與展望地理社交網(wǎng)絡內(nèi)涵地理社交網(wǎng)絡,學術界也有不少人稱之為基于位置的社交網(wǎng)絡,即在社交網(wǎng)絡中融入地理空間位置這一屬性,其意義在于彰顯了“位置”和“社交”的整合。用戶可以在所在地通過手機客戶端應用進行簽到活動,與此同時,可以發(fā)布此刻的心情或狀態(tài)讓好友看到。還能夠與其他地理社交網(wǎng)絡關聯(lián),同步更新狀態(tài)。新型的社交網(wǎng)絡較傳統(tǒng)的社交網(wǎng)絡而言,更能體現(xiàn)用戶真實情境下的學習、工作和生活狀態(tài),為人們線下和線上生活架起了一座橋梁,是標榜網(wǎng)絡虛擬世界和現(xiàn)實存在的最有效方式。地理社交網(wǎng)絡分析地理特征分析潛在好友發(fā)現(xiàn)真實用戶關系分析用戶偏好發(fā)現(xiàn)與地點推薦空間認知分析用戶行為分析空間數(shù)據(jù)存儲關系型數(shù)據(jù)庫非關系型數(shù)據(jù)庫類型產(chǎn)品特點Key-ValueRedis簡單易用,直接取值列族Bigtable,HBase模式靈活,任意增、刪列族文檔MongoDB,CouchDB任意模式查詢,嵌套文檔圖Neo4J,GraphLab適用于復雜數(shù)據(jù)結(jié)構(gòu)表2-1NoSQL數(shù)據(jù)庫對比MongoDB數(shù)據(jù)庫MongoDB是一種面向文檔的開源NoSQL數(shù)據(jù)庫系統(tǒng),用C++語言編寫,提供強大、靈活、可擴展的數(shù)據(jù)存儲方式。MongoDB優(yōu)良特性:

(1)采用內(nèi)存映射作為存儲引擎,可有效地提高I/O性能

(2)具有無模式特性,便于用戶存儲數(shù)據(jù)

(3)支持即時查詢、豐富的查詢表達式和二級索引,同時也提供空間索引能力

(4)支持自動分片機制及服務器之間的相互復制,提供冗余備份、自動故障轉(zhuǎn)移以及云級別伸縮性信息可視化熱力圖熱力圖的本質(zhì)是三維數(shù)據(jù)(包括地理位置經(jīng)緯度坐標和某一地理要素值的大小)在二維平面上的可視表達。聚簇圖

聚簇即將多個點要素聚合為一個符號。聚簇過程取決于屏幕顯示區(qū)域的大小。節(jié)點-鏈接圖它能夠直觀展示各節(jié)點之間的關系,其中,節(jié)點代表地理社交網(wǎng)絡中的用戶,用邊表示人與人之間的關系。平行坐標

平行坐標是最經(jīng)典的在二維平面表示多維數(shù)據(jù)的可視化方法。系統(tǒng)開發(fā)相關技術和工具D3

D3.js基于數(shù)據(jù)操作文檔(Data-DrivenDocuments)的理念構(gòu)建,通過使用HTML、SVG和CSS來使數(shù)據(jù)生動的展現(xiàn)在符合Web標準的瀏覽器中。Leaflet

Leaflet是一個為交互式地圖提供的、現(xiàn)代開源的JavaScript庫。CrossfilterCrossfilter是用于在瀏覽器上探索大規(guī)模高維數(shù)據(jù)集的JavaScript庫。Bootstrap

Bootstrap是基于HTML、CSS和JavaScript的簡潔靈活的流行前端框架及交互組件集。答辯提綱緒論系統(tǒng)構(gòu)建相關理論與技術可視化分析系統(tǒng)的設計與實現(xiàn)需求分析總體設計數(shù)據(jù)模型設計模塊設計系統(tǒng)實現(xiàn)

應用實例與分析總結(jié)與展望需求分析在數(shù)據(jù)管理方面,針對不同用戶提供不同使用權限提供豐富的數(shù)據(jù)查詢功能支持多種可視化方式支持交互式可視化分析提供統(tǒng)計分析功能具有良好的結(jié)構(gòu)和穩(wěn)定性界面便于操作總體設計圖3-1系統(tǒng)三層邏輯架構(gòu)圖總體設計圖3-2系統(tǒng)物理架構(gòu)圖數(shù)據(jù)模型設計系統(tǒng)用戶信息表設計位置數(shù)據(jù)模型用戶關系模型類別模型模塊設計圖3-3系統(tǒng)模塊結(jié)構(gòu)圖系統(tǒng)主界面圖3-4系統(tǒng)主界面系統(tǒng)實現(xiàn)——數(shù)據(jù)導入圖3-5(a)數(shù)據(jù)導入流程圖圖3-5(b)

數(shù)據(jù)導入界面系統(tǒng)實現(xiàn)——數(shù)據(jù)檢索接口接口方法名接口說明好友查詢1findFrdByUID(Stringuser_ID)根據(jù)用戶ID查詢該用戶的所有好友簽到查詢2findCheckByUID(Stringuser_ID)通過用戶ID查詢用戶所有的簽到數(shù)據(jù)簽到查詢3findFrdCheckByUID(Stringuser_ID)根據(jù)用戶ID查詢該用戶好友的簽到數(shù)據(jù)簽到查詢4findCheckByCo(StringsLng,StringsLat,StringsDistance)查詢臨近某空間坐標的簽到數(shù)據(jù),參數(shù)包括經(jīng)度、緯度以及查詢半徑簽到查詢5findCheckByCo(StringsLng1,StringsLat1,StringsLng2,StringsLat2)根據(jù)提供的經(jīng)緯度,查詢某空間矩形范圍內(nèi)的簽到數(shù)據(jù)簽到查詢6findCheckByPoly(String[][]polygon)查詢某空間多邊形范圍內(nèi)的簽到數(shù)據(jù)簽到查詢7findCheckByDate(Stringyear,String

month,Stringday)根據(jù)時間查詢簽到數(shù)據(jù)簽到查詢8findCheckByCat(Stringcat_ID)根據(jù)簽到類別查詢數(shù)據(jù)表3-1部分查詢接口系統(tǒng)實現(xiàn)——數(shù)據(jù)檢索結(jié)果展示圖3-6數(shù)據(jù)檢索結(jié)果展示(a)用戶參數(shù)(b)時間參數(shù)(c)空間參數(shù)(d)類別參數(shù)(e)操作系統(tǒng)實現(xiàn)——熱力圖圖3-8熱力圖圖3-7實現(xiàn)熱力圖的核心代碼系統(tǒng)實現(xiàn)——聚簇圖圖3-10聚簇圖圖3-9實現(xiàn)聚簇圖的核心代碼系統(tǒng)實現(xiàn)——平行坐標實現(xiàn)的功能有:交換坐標軸高亮顯示(Brushing)統(tǒng)計選定數(shù)據(jù)個數(shù)刪除數(shù)據(jù)導出數(shù)據(jù)圖3-12平行坐標可視化方法圖3-11實現(xiàn)平行坐標的核心代碼系統(tǒng)實現(xiàn)——統(tǒng)計分析圖3-13統(tǒng)計分析邏輯結(jié)構(gòu)圖圖3-14統(tǒng)計分析主頁面答辯提綱緒論系統(tǒng)構(gòu)建相關理論與技術可視化分析系統(tǒng)的設計與實現(xiàn)應用實例與分析應用背景地理知識云平臺GeoKSCloud可視化分析總結(jié)與展望應用背景地理社交網(wǎng)絡數(shù)據(jù)主要由用戶關系數(shù)據(jù)和簽到數(shù)據(jù)兩部分組成。Foursquare是一個針對手機用戶在移動端提供地理位置服務,并鼓勵用戶分享自己當前地理位置及其他信息的實地場景社交網(wǎng)絡,當用戶在手機上啟動Foursquare軟件后,用戶可以更新當前所處地理位置,在此過程中用戶可以選擇性的以文本、圖片等形式發(fā)布對當前環(huán)境、心情、事件等內(nèi)容的評價。數(shù)據(jù)集分析用戶簽到數(shù)據(jù)

記錄條數(shù):41037515條

屬性:TwitterID,TwitterUserName,VenueID,VenueCategoryID,VenueCategoryName,VenueLatitude,VenueLongitude,Time(GMT)用戶關系數(shù)據(jù)

記錄條數(shù):1017133條

屬性:user_ID1,user_ID2簽到地點類別數(shù)據(jù)

條數(shù):分為一級、二級和三級類別,共計約400項GeoKSCloud——體系結(jié)構(gòu)GeoKSCloud——主要功能數(shù)據(jù)聚合中心為GeoKSCloud提供統(tǒng)一的數(shù)據(jù)發(fā)布、訪問界面。知識服務中心地學問題求解中心平臺控制中心提供平臺用戶管理、權限控制、系統(tǒng)運行監(jiān)控等功能。地理知識云門戶旨在為Web和移動用戶提供地理知識云服務平臺的訪問入口接口,具有遠程任務提交、服務訪問和基于位置的服務功能。GeoKSCloud——系統(tǒng)集成由于系統(tǒng)設計時采用的基礎設施和技術框架與GeoKSCloud完全相同(例如,Bootstrap同時用于地理社交網(wǎng)絡數(shù)據(jù)可視化分析系統(tǒng)和地理知識云平臺的前端頁面構(gòu)建,底層都采用MongoDB和Hadoop存儲和處理數(shù)據(jù),硬件資源都采用實驗小組長期使用的服務器,兩者采用相同的配置文件、底層代碼),所以,在系統(tǒng)集成時,只需要將相應代碼拷貝至地理知識云平臺的對應目錄,并在平臺各模塊增加相關超鏈接和調(diào)用函數(shù)。可視化分析——簽到類別分布規(guī)律其中,以“家”作為地點類別的簽到點占總簽到數(shù)的23%,具有最大比重;“辦公場所”略高于8%,居于第二位。這說明對全球Foursquare地理社交網(wǎng)絡用戶而言,人們更傾向于在家和辦公場所進行簽到。圖4-1簽到地點類別統(tǒng)計直方圖可視化分析——簽到地點分布規(guī)律東部及南部沿海地區(qū)簽到點較為密集,西部地區(qū)及東北地區(qū)簽到點較為稀疏。就簽到較為密集的東部及南部區(qū)域而言,渤海經(jīng)濟區(qū)、長三角經(jīng)濟區(qū)、珠三角經(jīng)濟區(qū)以及四川、重慶、山西、山東等區(qū)域簽到最為集中。圖4-2中國簽到數(shù)據(jù)分布熱力圖北京和天津簽到數(shù)據(jù)分析北京的聚集范圍比天津更廣,聚簇圖中簇的數(shù)目比天津的更大,從而得出北京的用戶簽到次數(shù)遠高于天津。圖4-3北京和天津簽到數(shù)在地圖上的顯示(a)熱力圖(b)聚簇圖北京簽到數(shù)據(jù)分析北京市用戶簽到數(shù)據(jù)特征:簽到集聚區(qū)主要分布在五環(huán)內(nèi),且主要集中于北部和東北部地區(qū)簽到集聚區(qū)存在顯著的空間偏向性圖4-4北京簽到數(shù)在地圖上的顯示北京簽到數(shù)據(jù)分析北部地區(qū)存在中關村、上地、國貿(mào)、三里屯、王府井等區(qū)域,中關村、上地和國貿(mào)屬于辦公區(qū)域,而用戶更加樂于在辦公地點發(fā)布簽到信息,王府井屬于消費區(qū),人流量較大,三里屯則屬于外國人密集居住區(qū),F(xiàn)oursquare作為國外地理社交網(wǎng)絡產(chǎn)品,在外國人的群體中更加普及。圖4-5北京簽到數(shù)在地圖上的顯示(局部區(qū)域)可視化分析——簽到時間分布規(guī)律利用系統(tǒng)中平行坐標已有的功能,可以得出:周末的簽到頻率明顯高于工作日圖4-6平行坐標圖(北京和天津用戶簽到數(shù)據(jù))可視化分析——簽到時間分布規(guī)律北京市和天津市一天當中,用戶簽到數(shù)呈現(xiàn)多次波動現(xiàn)象。凌晨0點至凌晨4點之間,簽到數(shù)量持續(xù)降低,并在凌晨4點達到一天中的簽到數(shù)最低值;凌晨4點至早上9點之間簽到數(shù)逐漸攀升,并在9點達到一次小高峰;之后簽到數(shù)量再波動攀升,11點左右達到局部最小,13點達到局部最大值,19點達到一天中的最高峰。圖4-7北京和天津用戶簽到次數(shù)隨時間變化圖總結(jié)分析總結(jié)了可視化分析系統(tǒng)構(gòu)建所涉及的基礎理論與相關技術。以地理社交網(wǎng)絡數(shù)據(jù)知識發(fā)現(xiàn)的應用需求為導向,開展了系統(tǒng)的需求分析、總體設計、數(shù)據(jù)模型設計以及系統(tǒng)主要功能模塊的設計工作,實現(xiàn)了可視化分析系統(tǒng)。以Foursquare簽到數(shù)據(jù)的分析為例,開展了地理社交網(wǎng)絡數(shù)據(jù)的可視化分析示范應用。展望本文實例分析時使用的實驗數(shù)據(jù)僅針對北京市

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論