南京郵電大學(xué)本科畢業(yè)論文標(biāo)準(zhǔn)版(對一種社會關(guān)系網(wǎng)絡(luò)的模擬與分析)_第1頁
南京郵電大學(xué)本科畢業(yè)論文標(biāo)準(zhǔn)版(對一種社會關(guān)系網(wǎng)絡(luò)的模擬與分析)_第2頁
南京郵電大學(xué)本科畢業(yè)論文標(biāo)準(zhǔn)版(對一種社會關(guān)系網(wǎng)絡(luò)的模擬與分析)_第3頁
南京郵電大學(xué)本科畢業(yè)論文標(biāo)準(zhǔn)版(對一種社會關(guān)系網(wǎng)絡(luò)的模擬與分析)_第4頁
南京郵電大學(xué)本科畢業(yè)論文標(biāo)準(zhǔn)版(對一種社會關(guān)系網(wǎng)絡(luò)的模擬與分析)_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、摘要 隨著在線社交網(wǎng)絡(luò)效勞的快速開展,存在了大量、繁瑣、雜亂的社會網(wǎng)絡(luò)數(shù)據(jù)。我們迫切需要一種針對性強(qiáng)且直觀的社會網(wǎng)絡(luò)評估分析軟件,以初步分析這些社會網(wǎng)絡(luò)數(shù)據(jù),并作為深入的社會網(wǎng)絡(luò)分析方法研究的工具根底。本文設(shè)計了一種社會網(wǎng)絡(luò)分析系統(tǒng),用以模擬現(xiàn)實的社會網(wǎng)絡(luò)結(jié)構(gòu)。此外,系統(tǒng)還可抽取假設(shè)干社會網(wǎng)絡(luò)中的結(jié)構(gòu)屬性,提供應(yīng)用戶。本系統(tǒng)采用了B/S模式,借助Prefuse可視化軟件包和XML技術(shù)進(jìn)行設(shè)計和開發(fā)。系統(tǒng)的實現(xiàn)采用了面向?qū)ο蟮姆治龊驮O(shè)計方法,具有較高的可維護(hù)性、可擴(kuò)展性和可移植性。關(guān)鍵詞:社會網(wǎng)絡(luò)分析;在線社交網(wǎng)絡(luò);XML;Prefuse;ABSTRACTWith the rapid devel

2、opment of online SNSSocial Networking Services,there exists a large, cumbersome and messy social network data. We need a software for SNS, which is not only strong targeted but also intuitive. It can help to give a preliminary analysis of social networks and it can also be helpful as a tool base for

3、 an in-depth study of social networks.This text designs a kind of system for SNA(Social Network Analysis),the system is used for simulating the real structure of social networks.Besides,this system can siphon several structural properties from social networks for the users.The system using B / S mod

4、el the design and development drawing support from XML technology and the Prefuse Visualization Package.The whole system using object-oriented analysis and design methods,owning a high degree of stability, availability, maintainability, scalability and portability.Key words:Social Network Analysis;O

5、nline Social Networks;XML;Prefuse;目 錄TOC o 1-4 h u HYPERLINK l _Toc26644 第一章 緒論 PAGEREF _Toc26644 1 HYPERLINK l _Toc32724 PAGEREF _Toc32724 1 HYPERLINK l _Toc24777 PAGEREF _Toc24777 1 HYPERLINK l _Toc18872 PAGEREF _Toc18872 1 HYPERLINK l _Toc7734 PAGEREF _Toc7734 2 HYPERLINK l _Toc6864 PAGEREF _Toc6

6、864 2 HYPERLINK l _Toc32500 第二章 社會網(wǎng)絡(luò)分析 PAGEREF _Toc32500 3 HYPERLINK l _Toc11294 PAGEREF _Toc11294 3 HYPERLINK l _Toc8588 2.1.1 社會網(wǎng)絡(luò)的表示方式 PAGEREF _Toc8588 3 HYPERLINK l _Toc28014 PAGEREF _Toc28014 5 HYPERLINK l _Toc23669 社會網(wǎng)絡(luò)的屬性 PAGEREF _Toc23669 5 HYPERLINK l _Toc20940 社會網(wǎng)絡(luò)的常用理論 PAGEREF _Toc20940 7

7、 HYPERLINK l _Toc15153 PAGEREF _Toc15153 7 HYPERLINK l _Toc12468 社會網(wǎng)絡(luò)分析概述 PAGEREF _Toc12468 7 HYPERLINK l _Toc20811 2.2.2 社會網(wǎng)絡(luò)分析的主要任務(wù) PAGEREF _Toc20811 8 HYPERLINK l _Toc27028 PAGEREF _Toc27028 10 HYPERLINK l _Toc31294 論文抽取的結(jié)構(gòu)特征 PAGEREF _Toc31294 10 HYPERLINK l _Toc9376 2.3.2 抽取算法 PAGEREF _Toc9376 1

8、0 HYPERLINK l _Toc5514 第三章 社會網(wǎng)絡(luò)可視化技術(shù) PAGEREF _Toc5514 11 HYPERLINK l _Toc8970 PAGEREF _Toc8970 11 HYPERLINK l _Toc2181 3.2 Prefuse工具包 PAGEREF _Toc2181 12 HYPERLINK l _Toc25104 3.2.1 Prefuse介紹 PAGEREF _Toc25104 12 HYPERLINK l _Toc23469 3.2.2 Prefuse可視化框架 PAGEREF _Toc23469 13 HYPERLINK l _Toc12170 PAG

9、EREF _Toc12170 14 HYPERLINK l _Toc14210 PAGEREF _Toc14210 14 HYPERLINK l _Toc991 第四章 社會網(wǎng)絡(luò)模擬系統(tǒng)的詳細(xì)設(shè)計和實現(xiàn)過程 PAGEREF _Toc991 16 HYPERLINK l _Toc25902 PAGEREF _Toc25902 16 HYPERLINK l _Toc21629 4.1.1 界面控制臺 PAGEREF _Toc21629 16 HYPERLINK l _Toc22926 4.1.2 社會網(wǎng)絡(luò)圖可視化模塊 PAGEREF _Toc22926 17 HYPERLINK l _Toc274

10、73 4.1.3 網(wǎng)路特征提取模塊 PAGEREF _Toc27473 19 HYPERLINK l _Toc17748 4.2 社會網(wǎng)絡(luò)模擬系統(tǒng)的分析 PAGEREF _Toc17748 20 HYPERLINK l _Toc15190 4.2.1 系統(tǒng)的特點與優(yōu)勢 PAGEREF _Toc15190 20 HYPERLINK l _Toc9137 4.2.2 系統(tǒng)的缺乏與改良 PAGEREF _Toc9137 21 HYPERLINK l _Toc17997 結(jié)束語 PAGEREF _Toc17997 22 HYPERLINK l _Toc10212 致 謝 PAGEREF _Toc102

11、12 23 HYPERLINK l _Toc20876 參考文獻(xiàn) PAGEREF _Toc20876 24 HYPERLINK l _Toc10552 附 錄 PAGEREF _Toc10552 25第一章 緒論 隨著計算機(jī)和互聯(lián)網(wǎng)的不斷普及,人與人之間的交往不再受時間和地域的限制,而可以通過E-mail、即時通訊工具、BBS、博客、聊天室等進(jìn)行信息交流。隨著現(xiàn)實社會的網(wǎng)絡(luò)化,在線社交網(wǎng)站逐步形成并開展起來。常見的在線社交網(wǎng)站有Facebook、Twitter,以及中國的開心網(wǎng)、人人網(wǎng)等。社交網(wǎng)站作為現(xiàn)實社會網(wǎng)絡(luò)的一種虛擬,將人與人緊密連接在一起,并逐漸在商業(yè)領(lǐng)域和社會活動等方面發(fā)揮了越來越重

12、要的作用。例如,恐怖組織將論壇當(dāng)作招募成員、散布其意識形態(tài)、發(fā)布恐怖襲擊指示的手段,販毒和搶劫團(tuán)伙也把網(wǎng)絡(luò)作為其開展活動的交流方式,通過社會網(wǎng)絡(luò)分析可以有效地理解犯罪分子的交互方式,調(diào)查犯罪分子的犯罪網(wǎng)絡(luò),這些知識對網(wǎng)絡(luò)犯罪偵察具有重要的社會價值。由于在線社會網(wǎng)絡(luò)中具有龐大的數(shù)據(jù),而這些數(shù)據(jù)可能包含了有價值的信息,因此如何對社會關(guān)系網(wǎng)絡(luò)進(jìn)行分析和數(shù)據(jù)挖掘,即采用何種技術(shù)和方法是一個急需解決的問題。目前,社會網(wǎng)絡(luò)分析成為了人工智能領(lǐng)域的研究熱點和難點問題。目前制約社會網(wǎng)絡(luò)分析技術(shù)開展的瓶頸主要有:(1)人在社會活動中的主觀能動性造成了社會對象的復(fù)雜多樣。2無法用簡單數(shù)學(xué)模型來抽象復(fù)雜的社會現(xiàn)象。

13、3相關(guān)的技術(shù)水平和方法論還不成熟。近年來,隨著計算機(jī)技術(shù)和社會學(xué)領(lǐng)域的開展,數(shù)據(jù)挖掘技術(shù)正慢慢成熟,為人們?nèi)ァ坝嬎闵鐣?、進(jìn)行社會網(wǎng)絡(luò)分析創(chuàng)造了條件。在這種背景下,本文主要研究如何模擬社會網(wǎng)絡(luò)關(guān)系并進(jìn)行初步分析。本文分析人與人之間的信息交互方式,收集社交網(wǎng)絡(luò)中社會成員的各類信息,從信息源中抽取各種本體,并分析每個本體的特征屬性;判斷網(wǎng)絡(luò)中節(jié)點人或企業(yè)等的身份的真實性,確定本體間存在的關(guān)系,并挖掘其余潛在的社會關(guān)系;構(gòu)建社會關(guān)系網(wǎng)絡(luò),得出理想的社會網(wǎng)絡(luò)結(jié)構(gòu)圖,最終實現(xiàn)社會網(wǎng)絡(luò)關(guān)系的可視圖。構(gòu)建社會網(wǎng)絡(luò),關(guān)鍵是要確定網(wǎng)絡(luò)中的節(jié)點和邊,也就是社會關(guān)系網(wǎng)絡(luò)中的實體和實體之間的相互關(guān)系。社會網(wǎng)絡(luò)中各個本體

14、間的關(guān)系包括二元關(guān)系、多元關(guān)系和傳遞關(guān)系。目前國內(nèi)外構(gòu)建社會網(wǎng)絡(luò)的方法主要分為手動構(gòu)建社會網(wǎng)絡(luò)和自動構(gòu)建社會網(wǎng)絡(luò)兩大類。手動構(gòu)建社會網(wǎng)絡(luò)手動構(gòu)建社會網(wǎng)絡(luò)主要針對BBS、論壇、SNS社區(qū)及一些即時通訊軟件。這種方法首先要求用戶通過注冊的方式來填寫豐富的個人描述如自己的年齡、職業(yè)、昵稱、好友的賬號等等,網(wǎng)絡(luò)構(gòu)建直接以論壇中的用戶作為網(wǎng)絡(luò)中的節(jié)點,用戶之間可以通過有意的好友關(guān)系和無意的陌生人方式建立聯(lián)系,最后通過已經(jīng)建立的好友關(guān)系來構(gòu)建社會網(wǎng)絡(luò)中節(jié)點之間的邊,從而形成以用戶為中心的社會關(guān)系網(wǎng)絡(luò)參考文獻(xiàn)?。目前對該方法的改良主要集中在通過用戶的行為進(jìn)行邊的構(gòu)建,例如分析聊天數(shù)據(jù)的時序關(guān)系,推斷聊天數(shù)據(jù)

15、用戶間的社會網(wǎng)絡(luò)關(guān)系,通過用戶之間的回帖關(guān)系建立用戶之間社會網(wǎng)絡(luò)關(guān)系等。該類方法的優(yōu)點是操作簡便,信息準(zhǔn)確率較高。缺點是用戶有時不能完全找到他的好友,僅僅是因為他的朋友沒有在這個網(wǎng)站中注冊,或者是因為朋友太多而忘記了好友的名字,或者是因為他的朋友在這個網(wǎng)站中使用了其他的名字而無法找到。自動構(gòu)建社會網(wǎng)絡(luò)自動構(gòu)建社會網(wǎng)絡(luò)以互聯(lián)網(wǎng)上的海量信息為計算根底,基于傳統(tǒng)搜索的信息挖掘技術(shù),將人和人之間的關(guān)系抽取出來,建立實體間的社會關(guān)系網(wǎng)絡(luò)。該類方法獲取的信息量大,省時省力,正逐漸成為今后社會關(guān)系獲取的主流技術(shù)。國內(nèi)外對自動獲取人際關(guān)系的研究也進(jìn)行了多方面的探索參考文獻(xiàn)?。 目前,社會網(wǎng)絡(luò)分析作為被廣泛使用

16、的網(wǎng)絡(luò)分析方法,是社區(qū)發(fā)現(xiàn)的有效途徑。本文在分析了國內(nèi)外研究現(xiàn)狀的根底上對社會網(wǎng)絡(luò)可視化以及社會網(wǎng)絡(luò)結(jié)構(gòu)特征抽取進(jìn)行了研究。本文的研究內(nèi)容主要有兩個方面:1、對現(xiàn)實的社會網(wǎng)絡(luò)進(jìn)行模擬,并得到一個可視化的社會網(wǎng)絡(luò)圖;2、分析社會網(wǎng)絡(luò)的結(jié)構(gòu)屬性,得到一些有價值的信息,用于進(jìn)一步的社會網(wǎng)絡(luò)分析研究。本文的剩余內(nèi)容安排如下: 第一章:介紹社會關(guān)系網(wǎng)絡(luò)構(gòu)建的背景及意義,調(diào)查了社會關(guān)系網(wǎng)絡(luò)構(gòu)建相關(guān)的國內(nèi)外研究現(xiàn)狀,并對本文研究的主要內(nèi)容進(jìn)行了描述。 第二章:對社會網(wǎng)絡(luò)分析進(jìn)行簡單的介紹。說明了社會網(wǎng)絡(luò)的定義、構(gòu)成、相關(guān)概念及根本理論,介紹一些社會網(wǎng)絡(luò)分析的研究方法,并根據(jù)不同的web信息對社會網(wǎng)絡(luò)進(jìn)行分類

17、,指明當(dāng)前社會網(wǎng)絡(luò)研究的熱點。 第三章:調(diào)查社會網(wǎng)絡(luò)可視化技術(shù)的研究現(xiàn)狀,介紹一種可視化工具Prefuse,構(gòu)建可視化的社會網(wǎng)絡(luò)圖。 第四章:社會網(wǎng)絡(luò)模擬系統(tǒng)的實現(xiàn)與分析。第五章 :結(jié)果分析與工作總結(jié),并指出了未來的研究方向。第二章 社會網(wǎng)絡(luò)分析 社會網(wǎng)絡(luò)的表示方式 隨著Internet的迅猛開展,Web信息正以幾何級數(shù)的方式飛速增長。據(jù)中國互聯(lián)網(wǎng)信息中心(CNNIC)統(tǒng)計顯示22:截至到2009年6月30日,中國網(wǎng)民規(guī)模到達(dá)3.38億人,普及率到達(dá)25.5%,我國域名總數(shù)已到達(dá)1,626萬個,網(wǎng)站數(shù)量達(dá)360.1萬個。Web信息資源的日益豐富,使得人們可以方便地獲取世界各地的信息,Web已經(jīng)

18、成為當(dāng)今最龐大的信息資源庫。本文研究的社會關(guān)系網(wǎng)絡(luò)構(gòu)建方法主要是從在線社交網(wǎng)站中抽取出人與人之間的關(guān)系,因此web信息源是我們構(gòu)建社會關(guān)系網(wǎng)絡(luò)的數(shù)據(jù)根底。總體來說,社會網(wǎng)絡(luò)主要可分為如下幾類: WWW上的信息是按頁提供的,WWW頁通常稱之為網(wǎng)頁結(jié)構(gòu)復(fù)雜,并采用超文本語言進(jìn)行描述,其中包含有文本、圖形、圖像、聲音等。通過瀏覽網(wǎng)頁,人們可以方便及時地獲取各種新聞、消息資訊和在線論文等等。通過從web網(wǎng)頁中抽取出相應(yīng)的人名、地名、機(jī)構(gòu)名以及短語,并且通過算法自動地計算出它們之間存在關(guān)系的可能性,可以構(gòu)建出一個龐大的社會關(guān)系網(wǎng)絡(luò)。 電子郵件electronic mail,簡稱E-mail,它是Inte

19、rnet上應(yīng)用最廣的效勞。據(jù)統(tǒng)計,Internet上30%以上的業(yè)務(wù)量是電子郵件。如何通過挖掘E-mail的信息建立社會關(guān)系網(wǎng)絡(luò)已成為了當(dāng)前互聯(lián)網(wǎng)上的一個研究熱點。3.BBS、電子論壇 BBS(Bulletin Board system),即電子公告欄,是一個Internet上可以自由發(fā)表言論的網(wǎng)絡(luò)論壇,一般提供氣象、法律、娛樂、校園信息等效勞。電子論Electronic Forum與電子郵件的一對一通信不同,電子論壇是一種多對多的通信方式,一旦參加某個電子論壇,就可以收到其他成員發(fā)給電子論壇的信息,同時自己也可以給論壇成員發(fā)送消息。我們可以通過電子論壇的數(shù)據(jù)內(nèi)容和存在的回復(fù)關(guān)系來構(gòu)建社會關(guān)系

20、網(wǎng)絡(luò)。 博客blog又譯為網(wǎng)絡(luò)日志,是一種通常由個人管理、不定期張貼新的文章的網(wǎng)站。一個典型的博客結(jié)合了文字、圖像、其他博客或網(wǎng)站的鏈接、及其它與主題相關(guān)的媒體,能夠讓讀者以互動的方式留下意見,進(jìn)而形成了自己的社會關(guān)系網(wǎng)絡(luò)。5.即時通訊工具IM 即時通訊工具又稱IM軟件,主要提供基于互聯(lián)網(wǎng)絡(luò)的客戶端進(jìn)行實時語音、文字傳輸。近幾年,逐漸集成了電子郵件、博客、音樂、電視、游戲和搜索等多種功能。目前比擬流行的即時通訊軟件主要有QQ、MSN、ICQ等,可以通過分析聊天數(shù)據(jù)的時序關(guān)系,并引入相似內(nèi)容來推斷聊天用戶間的社會關(guān)系網(wǎng)絡(luò)。本文主要以電子郵件、web信息源為研究對象,構(gòu)建出基于目標(biāo)用戶的社會關(guān)系網(wǎng)

21、絡(luò)?,F(xiàn)實社會中,社會關(guān)系網(wǎng)絡(luò)是指人與人之間親戚、朋友、同學(xué)等通過興趣愛好、工作合作等關(guān)系建立起來的網(wǎng)絡(luò)。在互聯(lián)網(wǎng)中,社會關(guān)系網(wǎng)絡(luò)主要指人們通過郵件、博客、BBS、論壇、社交網(wǎng)站等建立起來的網(wǎng)絡(luò),具體形成過程見圖2-1。本文所說的社會關(guān)系網(wǎng)絡(luò)主要指互聯(lián)網(wǎng)中的社會關(guān)系網(wǎng)絡(luò)。 圖2-1 社會關(guān)系網(wǎng)絡(luò)形成圖圖2-1可以看出,根據(jù)形成社會關(guān)系網(wǎng)絡(luò)的元素不同,社會關(guān)系網(wǎng)絡(luò)可以分為如下三大類:1、封閉自治的社會網(wǎng)絡(luò),這種網(wǎng)絡(luò)用戶之間通過電子郵件、回復(fù)關(guān)系、共同的興趣愛好、工作需要、好友關(guān)系等有意建立起來的。這種網(wǎng)絡(luò)構(gòu)建的難點是如何收集有效的數(shù)據(jù)和確定節(jié)點的身份。2、合作關(guān)系的社會網(wǎng)絡(luò),主要是通過特定數(shù)據(jù)集合

22、構(gòu)成的。這種社會網(wǎng)絡(luò)通常包含兩種節(jié)點,即參與者和媒介,參與者通過媒介聯(lián)系在一起。例如,在論文合作網(wǎng)中,論文作者是參與者,他們共同發(fā)表和引用的論文是媒介 3、開放的社會網(wǎng)絡(luò),這種社會網(wǎng)絡(luò)主要是通過互聯(lián)網(wǎng)上大量的web文檔新聞、profile等無意間構(gòu)成的社會關(guān)系網(wǎng)絡(luò)。這種網(wǎng)絡(luò)需要發(fā)現(xiàn)web文檔中的實體人名、地名、機(jī)構(gòu)等,并且定義、發(fā)現(xiàn)實體之間的關(guān)系。這種網(wǎng)絡(luò)的特點是信息量大,網(wǎng)絡(luò)龐大,具有很大的不確定性。本文選取了封閉社會網(wǎng)絡(luò)中的典型信息源數(shù)據(jù),進(jìn)行了模擬和分析。通過可視化的方法,本文為用戶提供了一種較為直觀的社會網(wǎng)絡(luò)分析工具。具體方法見第三、四章。社會網(wǎng)絡(luò)的研究理論.1 社會網(wǎng)絡(luò)的屬性社會關(guān)系

23、網(wǎng)絡(luò)是由許多節(jié)點構(gòu)成的一種社會結(jié)構(gòu),通常由兩局部構(gòu)成,即節(jié)點actor和邊(edge)。節(jié)點主要是指社會關(guān)系網(wǎng)絡(luò)中的參與者,邊是節(jié)點之間的關(guān)系。關(guān)系Relation被看作兩個實體在一段時間或空間范圍內(nèi)的某種聯(lián)系。例如,兩個人之間如果互相發(fā)送過郵件、有共同的興趣愛好、共同發(fā)表過論文等。好友之間可能存在多種關(guān)系,包括二元關(guān)系、多元關(guān)系和傳遞關(guān)系,而且根據(jù)關(guān)系的不同,可以分為親密關(guān)系和一般關(guān)系等,所以進(jìn)行計算時可以給關(guān)系引入一定的權(quán)值。由于對朋友親疏程度的分析不是本文的研究重點,為簡便起見,本文所有的朋友關(guān)系都是同等對待,無需權(quán)重進(jìn)行衡量。本文的社會關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)如圖2-2所示:圖2-2社會關(guān)系網(wǎng)絡(luò)結(jié)

24、構(gòu)圖社會關(guān)系網(wǎng)絡(luò)從結(jié)構(gòu)上來說是一種以“本體節(jié)點為頂點和“關(guān)系為邊的帶權(quán)有向圖。用G=V,E,M,a四元組來表示圖,其中VG是頂點集合,EG是網(wǎng)絡(luò)中邊的集合,M為用于表示節(jié)點間關(guān)系的鄰接矩陣,a為邊集EG到0,1的映射,對于rEG,稱ar為邊r的權(quán),即表示由邊r連接的兩個本體間關(guān)系的親密程度。社會關(guān)系網(wǎng)絡(luò)的相關(guān)概念如下:1、節(jié)點Node。節(jié)點即G中的頂點,節(jié)點vVG,所有關(guān)系都是建立在兩個節(jié)點之間的二元關(guān)系。節(jié)點可以包含節(jié)點本體信息用于描述節(jié)點本身的屬性。2、關(guān)系Relation即G中的邊,關(guān)系rEG。關(guān)系建立在任意兩個節(jié)點之間,表示它們之間的聯(lián)系。ar為邊的權(quán),簡單記為a。稱a為關(guān)系r的相關(guān)度

25、,它表示兩個節(jié)點關(guān)系的親密程度,0a1。3、關(guān)系路徑(Relation Path)。連接兩個節(jié)點之間的有向路徑P稱為兩個節(jié)點之間的關(guān)系路徑。P=,稱l為關(guān)系路徑長度。如圖2-2所示,節(jié)點M到節(jié)點C的一條關(guān)系路徑為Mr1Ar2Br3C或,其路徑長度為3。4、關(guān)系累積親密度關(guān)系路徑親密度。將一條關(guān)系路徑上每個關(guān)系的相關(guān)度依次相乘,即得到這條關(guān)系路徑的關(guān)系累積親密度或關(guān)系路徑親密度。設(shè)關(guān)系路徑P=,a(ri)=ai,i=0,1,l-1,那么關(guān)系累積親密度如式2-1。如圖2-2所示,節(jié)點M到節(jié)點C的關(guān)系路徑,其關(guān)系累積親密度為A=a1a2a3。 (2-1)5、聯(lián)系度。與節(jié)點v直接相連的節(jié)點數(shù)目稱為節(jié)點

26、v的聯(lián)系度。在式2-2的定義中,Ddv表示節(jié)點v的相對聯(lián)系度。Ddv0,1,其中b(i,v)是一個布爾型量,如果為說明節(jié)點i和v直接相連,如果為說明不相連,n表示節(jié)點數(shù)目。聯(lián)系度反映了節(jié)點在網(wǎng)絡(luò)中的活潑程度。一個節(jié)點的聯(lián)系度越高,與該節(jié)點相聯(lián)系的節(jié)點數(shù)目越多,表示該節(jié)點越有可能影響或操控網(wǎng)絡(luò)中的其它節(jié)點。 (2-2)6、居間度。節(jié)點v到其它節(jié)點的最短路徑數(shù)稱為節(jié)點v的居間度由式2-3定義的Dbv為節(jié)點v的相對居間度,Dbv,其中g(shù)(i,j)是一個布爾型變量,表示節(jié)點i和j之間的最短路徑是否通過節(jié)點v,通過v,那么為;否那么為。居間度用于衡量某個特殊節(jié)點影響其它節(jié)點間交互關(guān)系的程度。一個節(jié)點的中

27、介度越大,說明網(wǎng)絡(luò)中的節(jié)點越有可能通過該節(jié)點與其它節(jié)點聯(lián)系。 (2-3)7、緊密度。節(jié)點v和網(wǎng)絡(luò)中所有節(jié)點之間的最短路徑之和稱為節(jié)點v的緊密度,下式定義的Dcv稱為節(jié)點v的相對緊密度,Dcv,其中si,v為節(jié)點i和v之間最短路徑長度。緊密度反映了一個節(jié)點到達(dá)其它節(jié)點的速率一個節(jié)點的緊密度越小,說明該節(jié)點到其它節(jié)點距離越短,其越可能是節(jié)點間通信的必經(jīng)之路。 (2-4)我們往往用聯(lián)系度、居間度和緊密度來刻畫某個節(jié)點在社會網(wǎng)絡(luò)中的地位即中心性。.2 社會網(wǎng)絡(luò)的常用理論1六度別離理論 六度別離理論是美國著名社會心理學(xué)家米爾格倫(Stanley Milgram)于20世紀(jì)60年代最先提出。簡單地說:“你

28、和任何一個陌生人之間所間隔的人不會超過六個,也就是說,最多通過六個人你就能夠認(rèn)識任何一個陌生人24。最近,微軟公司研究人員通過電腦計算證實了六度分隔理論。按照六度分隔理論,每個個體的社交圈都不斷放大,最后成為一個大型網(wǎng)絡(luò)。2150法那么 150法那么最早是由歐洲發(fā)源的“赫特兄弟會提出的,即“把人群控制在150人以下似乎是管理人群的一個最正確和最有效的方式。150成為我們普遍公認(rèn)的人們可以與之保持社交關(guān)系的人數(shù)的最大值。這同時也符合“二八法那么,即80%的社會活動可能被150個強(qiáng)鏈接所占有。社會網(wǎng)絡(luò)分析概述 社會網(wǎng)絡(luò)(social network)反映行動者之間的社會關(guān)系。而從上世紀(jì)六十年代至今

29、,一些研究者借助于快速開展的計算機(jī)技術(shù),采用社會網(wǎng)絡(luò)分析法研究人際關(guān)系。從不同的學(xué)術(shù)背景出發(fā),社會網(wǎng)絡(luò)分析方法主要分為兩種:此方法關(guān)注的焦點是整體網(wǎng)絡(luò),即一個社會體系中角色關(guān)系的綜合結(jié)構(gòu)或群體中不同角色的關(guān)系結(jié)構(gòu)。目前的研究集中于小群體內(nèi)部關(guān)系研究,探討網(wǎng)絡(luò)結(jié)構(gòu)隨時間變遷和網(wǎng)絡(luò)中成員的直接或間接的聯(lián)系方式。從數(shù)據(jù)收集上來看,整體網(wǎng)絡(luò)分析方法主要使用提名選擇法、參數(shù)選擇法與循環(huán)選擇法等各種選擇方法。從數(shù)據(jù)整理上來看,整體網(wǎng)絡(luò)分析主要采用社會矩陣方法與社群圖示法。社會矩陣是一個N階矩陣。N代表群體的人數(shù),橫行代表選擇者,縱行代表被選擇者,在選擇者與被選擇者交叉的地方標(biāo)出選擇結(jié)果,最后就可以得到該群

30、體的整體網(wǎng)絡(luò)矩陣。社群圖示法那么在一張圖上標(biāo)出所有的群體成員,然后使用箭頭表示群體成員的相互選擇情況,最為研究者所熟知的即為由同心圓組成的箭靶圖。從數(shù)據(jù)分析上來看,主要采用矩陣解析、社群圖分析方法以及使用有關(guān)指數(shù),如聲望指數(shù)、中心指數(shù)加以標(biāo)示。我們可以將社會矩陣作為初級矩陣予以分析,平方之后的矩陣那么代表群體成員之間的二級關(guān)系,立方之后那么代表三級關(guān)系,以此類推。我們也可以通過解剖社群圖的根本結(jié)構(gòu),掌握群體中的社會網(wǎng)絡(luò)分布情況,區(qū)分網(wǎng)絡(luò)中不同地位的角色,如明星,聯(lián)絡(luò)人,孤立者等。我們還可以得到網(wǎng)絡(luò)的假設(shè)干指數(shù):聲望指數(shù),即行為主體在關(guān)系中被選擇為客體的比重或者在整體網(wǎng)絡(luò)中的絕對人數(shù);中心指數(shù),

31、即計算行為主體介入的關(guān)系占據(jù)網(wǎng)絡(luò)中所有關(guān)系的比重來。這種研究方法集中于個體間的自我中心網(wǎng)絡(luò),從個體的角度來界定社會網(wǎng)絡(luò)。它所關(guān)心的問題是個體行為如何受到其人際網(wǎng)絡(luò)的影響。這個領(lǐng)域的核心概念那么主要是網(wǎng)絡(luò)的范圍、密度、強(qiáng)弱聯(lián)系等。自我中心網(wǎng)絡(luò)分析主要有以下幾種方法互動方法:角色關(guān)系和情感方法以及社會交換法。情感方法要求被試者指出與其關(guān)系最為密切的人,如最好朋友提問法或者十項提名法。這種方法的缺點在于不同的人的評價標(biāo)準(zhǔn)可能不一致。社會交換法以社會交換理論作為根底,認(rèn)為擁有報償性互動資源的人在影響被試者的態(tài)度和行為的時候相當(dāng)重要。這種方法目前得到了普遍運用,并且被證明在不同文化背景之中也是適用的。

32、社會網(wǎng)絡(luò)分析的主要任務(wù) 社會網(wǎng)絡(luò)分析主要對鏈接的分析,故而社會網(wǎng)絡(luò)分析又稱為鏈接挖掘(link mining)。通過對鏈接的挖掘我們可以獲得關(guān)于實例更豐富如某個實例在整個網(wǎng)絡(luò)中的重要性、更準(zhǔn)確如預(yù)測某個實例所屬的類別的信息。更深入地,由于考慮了數(shù)據(jù)之間的鏈接,社會網(wǎng)絡(luò)的結(jié)構(gòu)屬性,如節(jié)點的度數(shù)degree、連通性connectivity在挖掘中也提供了重要信息,同時,更復(fù)雜的模式,如子圖可理解為社團(tuán)或群體等也隨之出現(xiàn)。社會網(wǎng)絡(luò)分析的主要任務(wù)有:1、基于鏈接的節(jié)點排序基于鏈接的節(jié)點排序是社會網(wǎng)絡(luò)分析中一個核心分析任務(wù),它的目的是通過分析利用圖中的鏈接結(jié)構(gòu),根據(jù)某種衡量節(jié)點重要性的度量來對圖中節(jié)點進(jìn)

33、行排序,這種可度量的重要性被稱為中心度centrality。根據(jù)復(fù)雜程度的不同,它們可分為局部度量和全局度量。其中前者包括“度中心度degree centrality,即個頂點的度數(shù),后者包括“特征向量/能量中心度eigenvector/power centrality,即通過譜方法Spectral methods根據(jù)一個節(jié)點到其他重要節(jié)點的連接來刻畫該節(jié)點的重要性。除了上述基于在靜態(tài)圖上用給定的度量進(jìn)行全局排序的工作外,還有對相對于圖中假設(shè)干相關(guān)節(jié)點的局部節(jié)點排序和在動態(tài)圖上的節(jié)點排序。2、基于鏈接的節(jié)點分類傳統(tǒng)機(jī)器學(xué)習(xí)中的分類問題是基于數(shù)據(jù)實例節(jié)點是獨立同分布的假設(shè),然而很多現(xiàn)實問題不滿足

34、這個假設(shè)。在基于鏈接的節(jié)點分類問題中,一個數(shù)據(jù)圖G = (O,L)表示了節(jié)點集合O和他們之間的鏈接集合L,我們的任務(wù)是將O中的成員賦予某一類標(biāo)簽?;阪溄拥墓?jié)點分類與傳統(tǒng)分類問題的最顯著的不同在于節(jié)點的類別是彼此相關(guān)的。3、節(jié)點聚類節(jié)點聚類又稱為群體檢測Group Detection,它的目的是將有著共同的特征的節(jié)點聚類。社會網(wǎng)絡(luò)分析中塊建模的任務(wù)是將社會網(wǎng)絡(luò)分割成個體的集合,這種集合稱為位置position,顯示了在網(wǎng)絡(luò)中相似鏈接的集合。一種定義在鏈接集合和聚合聚類之間的相似度量被用來尋找位置。譜圖分割的方法Spectral graph partitioning methods用確定為了使圖

35、到達(dá)指定數(shù)量群體而可以去掉的近似最小鏈接集合來解決群體檢測問題。4、鏈接預(yù)測鏈接預(yù)測是基于它所鏈接的節(jié)點屬性和已觀測到的鏈接來預(yù)測某鏈接是否存在。鏈接預(yù)測的應(yīng)用非常廣泛,包括預(yù)測社會中人與人之間的朋友關(guān)系,電子郵件、 聯(lián)系,合作關(guān)系等。往往一些鏈接被觀察到,未被觀察到的需要我們?nèi)ネ茰y;或者存在一個時間序列,在某個時間點t的連接狀態(tài),要預(yù)測t+1時間點的鏈接狀態(tài)。由于多數(shù)我們感興趣的數(shù)據(jù)集是稀疏的,因而鏈接預(yù)測是比擬困難的。為鏈接預(yù)測構(gòu)造統(tǒng)計模型的一個難點在于,鏈接的先驗概率往往很低。這種困難不僅在于模型評價中,也在于預(yù)測可行程度的定量。一種提高預(yù)測質(zhì)量的方法是使預(yù)測全體化。很多方法在整個鏈接的

36、圖、標(biāo)簽和邊上構(gòu)造一個概率模型。這些網(wǎng)絡(luò)結(jié)構(gòu)的聯(lián)合模型經(jīng)?;隈R爾可夫隨機(jī)場或者有向圖。5、子圖發(fā)現(xiàn)子圖發(fā)現(xiàn)的任務(wù)是在一個圖的集合中找到感興趣的或者頻繁出現(xiàn)的子圖。一個研究方向的是在圖中尋找頻繁子圖。Inokuchi等人描述了AGM,它尋找了所有滿足最小支持的歸納子圖。Kuromachi等人利用一種子圖數(shù)據(jù)的鄰接表示和描述新的優(yōu)化的候選子圖生成過程來改良AGM。Yan等人描述了 gSpan,這種方法防止了候選子圖生成的代價。它首先將每一幅圖映射到深度優(yōu)先搜索編碼,并用字典序排序。然后在這個字典序定義的搜索樹上進(jìn)行深度優(yōu)先搜索。其他的方法來自于歸納邏輯編程Inductive Logic Prog

37、ramming。Dehaspe等人最早成功地將ILP的技術(shù)應(yīng)用于在毒物學(xué)領(lǐng)域?qū)ふ翌l繁模式。6、圖分類不同于基于鏈接的節(jié)點分類,圖分類是一種試圖將整張圖用正或負(fù)標(biāo)簽來分類的監(jiān)督學(xué)習(xí)問題。這是最早的將機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)應(yīng)用與圖數(shù)據(jù)的任務(wù)。圖分類一般不要求像節(jié)點、邊分類中要求的集體推斷。這是因為圖一般是假設(shè)獨立的。三種主要方法有:基于圖上特征挖掘,歸納邏輯編程ILP和定義圖核函數(shù)。論文抽取的結(jié)構(gòu)特征目前,對社會網(wǎng)絡(luò)結(jié)構(gòu)特征的分析主要有兩個方向,一種方向是對社會網(wǎng)絡(luò)的參數(shù)進(jìn)行測量,這些參數(shù)主要包括:網(wǎng)絡(luò)規(guī)模,節(jié)點的個數(shù)、節(jié)點之間的距離,節(jié)點可達(dá)性,聚類系數(shù)等等。通過分析比擬社會網(wǎng)絡(luò)的各項參數(shù)有利于

38、我們揭示網(wǎng)絡(luò)中節(jié)點與節(jié)點之間是如何相互作用的,以便進(jìn)一步了解社交網(wǎng)絡(luò)將來的開展特點和方向。另一方向是通過分析社會關(guān)系網(wǎng)的網(wǎng)絡(luò)結(jié)構(gòu)和內(nèi)容來發(fā)現(xiàn)網(wǎng)絡(luò)中具有特征的局部結(jié)構(gòu)和關(guān)鍵節(jié)點,例如社區(qū)識別,社團(tuán)結(jié)構(gòu)發(fā)現(xiàn),網(wǎng)絡(luò)核心人物挖掘等。本文主要抽取了三種社會網(wǎng)絡(luò)結(jié)構(gòu)特征,包括:社會網(wǎng)絡(luò)圖中具有最大連接率的節(jié)點,社會網(wǎng)絡(luò)圖的半徑,社會網(wǎng)絡(luò)圖的平均步長。隨后,本文根據(jù)節(jié)點的度對所有節(jié)點進(jìn)行排序。 抽取算法本文評估了4種屬性特征計算的時間復(fù)雜度,因為本文采用的社會網(wǎng)絡(luò)數(shù)據(jù)沒有到達(dá)海量,而是對大規(guī)模社會網(wǎng)絡(luò)的局部結(jié)構(gòu)進(jìn)行簡單的模擬和分析。所以僅通過啟發(fā)性的算法78910,計算出4個屬性的復(fù)雜度僅到達(dá)O(n2)。這

39、里值得一提的是,在基于度的節(jié)點排序算法中,如果采用快速排序算法11在時間復(fù)雜度上可以將原有的O(n2)降低到O(nlog(n)。因為快速排序算法是目前最快的排序算法,適合海量的數(shù)據(jù)研究,而且“偏愛根本無序的序列。假設(shè)在元素較少的情況下,其效率還不如簡單排序方法。該算法經(jīng)過一趟排序后,就能確定一個元素的最終位置,快速排序是不穩(wěn)定的方法。所以經(jīng)過綜合考慮沒有使用該算法。第三章 社會網(wǎng)絡(luò)可視化技術(shù) Linton Freeman描述了社會學(xué)研究領(lǐng)域中社會網(wǎng)絡(luò)可視化的技術(shù),并通過了大量可視化的例子闡述了可視化的開展進(jìn)程。 隨著數(shù)學(xué)領(lǐng)域中圖論的開展,一些數(shù)學(xué)算法應(yīng)用到了社會可視化領(lǐng)域,人們可以通過算法對社

40、會網(wǎng)絡(luò)的空間布局進(jìn)行改良,例如,力導(dǎo)引布局force-directed layout可以更為有效地組織復(fù)雜網(wǎng)絡(luò)的空間布局,而輻射布局radial layout那么能夠更加有效地描繪出各網(wǎng)絡(luò)節(jié)點與中心節(jié)點的距離。此外,圖形的顏色、大小、形狀等也被用來描繪節(jié)點的一些屬性性別、職業(yè)、群體等。目前,一些社會化分析工具都內(nèi)嵌了社會網(wǎng)絡(luò)可視化的功能,例如UCINet、GUESS。除了社會研究學(xué)領(lǐng)域,計算機(jī)領(lǐng)域也提供了一些開源的可視化工程,例如Prefuse、JUNG等。 如何在有限的頁面當(dāng)中顯示社會網(wǎng)絡(luò)的主要結(jié)構(gòu)。為了解決上述問題,目前主要有兩類顯示方法,即樹狀列表顯示和二維圖形顯示兩種形式。 樹狀列表形

41、式在目前的大多數(shù)即時通訊軟件中被普遍采用,通過對好友分類,然后把好友以列表或者是樹狀圖的形式進(jìn)行顯示。用戶通過點擊每個類別,該類別中的好友將以樹狀圖的形式進(jìn)行展開,用戶通過點擊每個好友的頭像可以進(jìn)一步查看用戶的詳細(xì)信息,該方法的優(yōu)點是易于實現(xiàn),簡單清晰,缺點就是缺乏互動性,不能充分的展現(xiàn)出好友之間親疏程度和社會網(wǎng)絡(luò)結(jié)構(gòu)。 二維圖形顯示那么是用節(jié)點表示用戶和好友,而邊表示好友之間的關(guān)系。目前使用較普遍的主要有以下幾個方向:一種方法被稱為六度拓?fù)滹@示方法相關(guān)網(wǎng)址見 :/ 6dtop /6dtop/,該方法以用戶為圓心,首先會在外圍一圈羅列出用戶的好友,即一度好友;然后是更外面的一圈,羅列出好友的好

42、友,即二度好友。以此類推,最多可以到六度好友。但是,隨著好友度數(shù)上升,好友數(shù)將呈幾何級數(shù)增加,該方法對硬件的要求很高,而且隨著好友的不斷增減,頁面的布局也顯得異常的凌亂。 另一種方法那么是基于force-directed布局,節(jié)點之間可以相互擠壓,而節(jié)點之間邊可以像彈簧一樣進(jìn)行縮短和拉伸,這種算法不僅可以很好的解決頁面布局的問題,而且還能夠各用戶產(chǎn)生動態(tài)的效果,使網(wǎng)絡(luò)更加形象生動。目前比擬流行的Douban Link、Facebook Visualiser、Flickr Graph都是以社交網(wǎng)絡(luò)為數(shù)據(jù)根底。 社會網(wǎng)絡(luò)可視化具體的效果如圖3所示。當(dāng)節(jié)點數(shù)目到達(dá)一定數(shù)量之后,采用上述介紹的方法可能

43、使各個元素出現(xiàn)交叉或重疊的沖突,因此近年來人們提出了用3D代替目前的2D圖形顯示,提出了在3D空間選擇假設(shè)干平面作為布局平面,而每個特定的布局平面仍采用2D圖形顯示方法,三維立體圖形可以通過旋轉(zhuǎn)、放大和切換視角來從不同的角度來觀察單個元素的相關(guān)人際關(guān)系,這樣既能增加每個元素關(guān)系的顯示數(shù)量,又能方便查看和搜索。三維立體可視化技術(shù)將是今后的開展方向。 圖3-1社會網(wǎng)絡(luò)可視化效果圖3.2 Prefuse工具包3.2.1 Prefuse介紹 Prefuse是一個可擴(kuò)展的軟件框架,它可以幫助使用java語言的開發(fā)者開發(fā)交互的信息可視化程序,用來建立獨立的應(yīng)用程序,把有結(jié)構(gòu)與無結(jié)構(gòu)數(shù)據(jù)以具有交互性的可視化

44、圖形展示出來。 Prefuse支持的數(shù)據(jù)包括具有層次性(如:文件系統(tǒng),組織圖),網(wǎng)絡(luò)(網(wǎng)絡(luò)拓?fù)?網(wǎng)站鏈接),和甚至是沒有連接的數(shù)據(jù)集(如:時間線等)。該開源工程的目的是幫助用戶簡化處理數(shù)據(jù)過程的開發(fā);建立數(shù)據(jù)和顯示的圖形的聯(lián)系特別是圖形的大小,位置,形狀,顏色;建立交互的可視化數(shù)據(jù)顯示。歸納起來,Prefuse有如下的特征50:支持由表,圖,樹組成的數(shù)據(jù)結(jié)構(gòu),字段的數(shù)據(jù)索引和選擇列的查詢,并且高效的利用內(nèi)存。 已存的組件幫助完成布局,顏色,大小和形狀設(shè)定,變形,動畫及更多功能。包括與用戶交互和操作的一組庫函數(shù)。通過一組活動的時序機(jī)制來實現(xiàn)動畫??梢暬淖冃涡Ч?,包括物體位置移動和通過空間和語義

45、的放大放小。動態(tài)查詢過濾數(shù)據(jù)顯示。 融合使用了lucene( :/)文本查詢engines。在位置和動畫中利用了物理學(xué)中力的摸擬。靈活的多種顯示方式,包括概貌+詳細(xì)的方式和多個顯示圖。內(nèi)建類似于SQL的語言語句可以針對數(shù)據(jù)進(jìn)行行和列的操作。支持?jǐn)?shù)據(jù)庫的查詢結(jié)果集合和Prefuse內(nèi)部數(shù)據(jù)的映射??梢岳媒?jīng)過簡化的,對開發(fā)者友好的API,建立自定義的過程,用戶交互和畫圖像的組件。 Prefuse用java程序語言進(jìn)行編寫,并以Java2D為根底,不支持3D圖形顯示。3.2.2 Prefuse可視化框架圖3-2 Prefuse可視化框架從圖3-2可以看出,Prefuse的整個框架分為三局部:數(shù)據(jù),

46、可視表和視圖。其處理過程分為四步:抽象數(shù)據(jù)、將抽象的數(shù)據(jù)映射成可見的形式(即過濾)、利用顯示技術(shù)將可視表轉(zhuǎn)換為視圖(即移交和顯示),最后將視圖呈現(xiàn)給用戶。 在本文中,我通過利用原有的軟件信息和已經(jīng)實現(xiàn)的可視化界面,通過對信息提取與完善過濾出有用的信息,然后把得到的數(shù)據(jù)轉(zhuǎn)換成可視表的形式,最后調(diào)用Prefuse開發(fā)包生成不同的視圖,將結(jié)果呈現(xiàn)給用戶。其中如下列圖3-5所示: 圖3-5 有調(diào)查文獻(xiàn)已經(jīng)指出了社會網(wǎng)絡(luò)可視化開展的三個階段,即整體概括Overview,對圖形進(jìn)行局部調(diào)整zoom and filter和過濾及關(guān)注圖形細(xì)節(jié)details-on-demand三個階段。 長期以來,國內(nèi)外的眾多

47、學(xué)者都對復(fù)雜網(wǎng)絡(luò)可視化進(jìn)行了深入的研究,對當(dāng)前的可視化算法進(jìn)行了綜述。歸納起來,大致分為兩大類,分別是布點算法和可視化壓縮算法。布點算法,大致思想是通過節(jié)點之間的相互擠壓,從而到達(dá)節(jié)點之間的邊像彈簧一樣進(jìn)行縮短和拉伸,這種算法不僅可以很好的解決頁面布局的問題,而且還能夠各用戶產(chǎn)生動態(tài)的效果,使網(wǎng)絡(luò)更加形象生動。而可視化壓縮算法那么主要用于大規(guī)模和超大規(guī)模的復(fù)雜網(wǎng)絡(luò)中,核心思想是把大規(guī)模網(wǎng)絡(luò)圖形轉(zhuǎn)化為小規(guī)模圖形,從而保存網(wǎng)絡(luò)圖形的一些關(guān)鍵屬性,已到達(dá)空間節(jié)省資源和顯示全部節(jié)點的目的。本文中的圖形采用布點算法中經(jīng)典的力引導(dǎo)算法FDA:Force-Directed Algorithm完成社會網(wǎng)絡(luò)可視

48、化的目的。FDA最早由P.Eades提出,也稱彈簧算法。其理論來源于物理模型中的彈簧。根本思想是將網(wǎng)絡(luò)圖形中的節(jié)點看成一個鐵環(huán),而邊那么看成是一條連接該鐵環(huán)的彈簧。當(dāng)系統(tǒng)被賦予某個作用之后,邊彈簧的彈力會導(dǎo)致鐵環(huán)移動,當(dāng)兩個節(jié)點的距離太遠(yuǎn)的時候,會被邊彈簧拉回,即兩點相互吸引,當(dāng)兩點距離太近的時候會被邊彈開,即兩點相互排斥,直到整個系統(tǒng)到達(dá)一個穩(wěn)定狀態(tài)為止,由此來計算節(jié)點在圖中的坐標(biāo)位置。圖3-3力導(dǎo)引算法原理圖本文采用節(jié)點和邊的表示方法來代表社會關(guān)系網(wǎng)絡(luò)在,社會網(wǎng)絡(luò)中是好友關(guān)系的,我就是他們有邊相連接。通過社會網(wǎng)絡(luò)節(jié)點獲取和社會網(wǎng)絡(luò)節(jié)點確認(rèn)兩個步驟,可以得到網(wǎng)絡(luò)節(jié)點的相關(guān)信息,利用這些信息,

49、我們可以找到節(jié)點間的關(guān)系。為了更好的展現(xiàn)網(wǎng)絡(luò)的節(jié)點之間是否有聯(lián)系,本文利用的數(shù)組的方法來定義好友之間的聯(lián)系。然而目前普遍采用的鄰接矩陣來代表社會關(guān)系網(wǎng)絡(luò)成員之間的關(guān)系。圖3-4就是一個由四個節(jié)點構(gòu)成的社會網(wǎng)絡(luò)鄰接矩陣。矩陣中行和列中數(shù)字代表了網(wǎng)絡(luò)中的四個節(jié)點“1、“2、“3、“4,而矩陣中行和列交接處的數(shù)值代表了兩個節(jié)點是否具有關(guān)系,數(shù)值“1代表具有關(guān)系,數(shù)值“0代表兩者無關(guān)系。 圖3-4社會網(wǎng)絡(luò)鄰接矩陣第四章 社會網(wǎng)絡(luò)模擬系統(tǒng)的詳細(xì)設(shè)計和實現(xiàn)過程 界面控制臺在程序設(shè)計中,界面控制臺是不可缺少的一個局部,他讓整個程序結(jié)果的顯示不再是單調(diào),單一的顯示,而是給整個程序增加了很多色彩。本文運用JAV

50、A語言,簡單的對控制臺進(jìn)行了處理和編寫7.通過編譯,成功的獲取了如下界面如圖4-1所示: 圖4-1:社會網(wǎng)絡(luò)模擬系統(tǒng)界面控制臺上圖所顯示的界面,可以看出有一個主窗口,另外還有5個按鈕和4個輸出框??刂婆_的功能簡述:1按鈕一:顯示按鈕,此按鈕是將Prefuse工具包所制作的圖形界面與java控制臺相互連接,以便使用者能夠更直觀的看到整個社會網(wǎng)絡(luò)的整體情況。點擊按鈕如圖4-1-2所示:圖4-1-2按鈕“顯示所得結(jié)果2按鈕二:顯示最大節(jié)點連接率,該按鈕是為提取社會網(wǎng)絡(luò)四種屬性之一所設(shè)定的。根據(jù)考夫曼的研究,在連接稀少的網(wǎng)絡(luò)中,平均每個節(jié)點僅僅連著一個或者更少的節(jié)點。在連接豐富的網(wǎng)絡(luò)里,每個節(jié)點會連接

51、十個、百個、千個乃至上百萬個節(jié)點。理論上每個節(jié)點連接數(shù)量的上限是節(jié)點總數(shù)減一。一百萬個節(jié)點的網(wǎng)絡(luò),每個節(jié)點可以有一百萬減一個連接,也即每個節(jié)點都連著其他所有節(jié)點。而網(wǎng)絡(luò)節(jié)點的最大連接率可以很好的表達(dá)出網(wǎng)絡(luò)中的與他人聯(lián)系最多的一個節(jié)點,可以給用戶提供一個直觀的結(jié)果,例如:在社會網(wǎng)絡(luò)中用戶好友中擁有好友數(shù)最多的節(jié)點。按鈕三:平均步長的顯示,平均步長即為根節(jié)點到每一個節(jié)點的鏈接邊數(shù)與和根節(jié)點有聯(lián)系的節(jié)點數(shù)目的比值。該屬性網(wǎng)絡(luò)的平均步長在現(xiàn)在的社會網(wǎng)絡(luò)中,尤其是對網(wǎng)絡(luò)最有路由算法有著極其重要的意義。按鈕四:網(wǎng)絡(luò)半徑的顯示,即是根節(jié)點到與之相連的子節(jié)點最遠(yuǎn)距離。該屬性的研究,可以將網(wǎng)絡(luò)中的每一個節(jié)點包含

52、進(jìn)去,可以幫助相關(guān)領(lǐng)域的用戶更好的研究每一個節(jié)點的屬性和特征。按鈕五:結(jié)點的排序前四位鏈接數(shù)最多的結(jié)點,這個屬性是幾乎每項網(wǎng)絡(luò)研究中都要考慮的屬性。無論是社會網(wǎng)絡(luò),還是神經(jīng)網(wǎng)絡(luò)在各個領(lǐng)域中的研究,節(jié)點的排序都是必不可少的。本文中利用了啟發(fā)性的算法將前四名的節(jié)點例舉出來,以便給用戶提供更加直觀的信息。幫助他們更好的分析社會網(wǎng)絡(luò),例如:研究與自己聯(lián)系的最密切的4個好友的信息等。 社會網(wǎng)絡(luò)圖可視化模塊 第三章已經(jīng)介紹到了本文所使用的可視化工具包Prefuse軟件,通過第三章的綜述可以對該軟件包有一點的了解,其中包括所使用的各種法那么和算法,本章節(jié)中并對其進(jìn)行了編輯和調(diào)用。并總結(jié)了其模塊功能的實現(xiàn),實

53、現(xiàn)的步驟主要有以下兩大步驟: 1:數(shù)據(jù)源格式定義 本文通過使用開源軟件Prefuse開發(fā)包來完成社會網(wǎng)絡(luò)可視化的實現(xiàn)。Prefuse支持的數(shù)據(jù)源主要有xml文件,本文采用xml文件數(shù)據(jù)源格式的定義。關(guān)鍵代碼如下隨機(jī)抽取了兩個節(jié)點:- HYPERLINK l -HYPERLINK l - - HYPERLINK l - 張丹丹 F 19 student climbing,shopping,singing HYPERLINK l - 章雪妮 F 21 student tricking,XMA,chatting,shopping 通過上述的簡單代碼可以知道每個節(jié)點的簡單屬性,里面包括年齡,性別,姓名

54、,職業(yè)還有興趣愛好。 2:社會網(wǎng)絡(luò)可視化實現(xiàn) 利用Prefuse實現(xiàn)社會網(wǎng)絡(luò)可視化分為五個步驟,如下:1加載數(shù)據(jù)源12創(chuàng)立可視化抽象圖23用render和render工廠傳遞數(shù)據(jù)34數(shù)據(jù)處理動作45顯示和交互控制5利用上述方法并通過控制臺可以顯示并得出社會網(wǎng)絡(luò)可視化效果圖3-5所示圖3-5利用Prefuse實現(xiàn)社會網(wǎng)絡(luò)可視化效果圖 網(wǎng)路特征提取模塊筆者原先在程序設(shè)計中通過建立了一個129*129的矩陣來對社會網(wǎng)絡(luò)中的各個結(jié)點進(jìn)行了定義,但是由于開發(fā)平臺對代碼的長度識別有限制,那么采用了另一種較為簡便的方法,即建立一個129*129的二維數(shù)組,然后對相互認(rèn)識的人進(jìn)行了定義,免去了建立復(fù)雜的矩陣。

55、對數(shù)據(jù)的總體特征進(jìn)行的提取方法如下:int ed=new int129129;void set(int ed)其中是各個結(jié)點之間的聯(lián)系為了方便起見:相互連接的定義為1,沒有聯(lián)系的沒有進(jìn)行定義;舉例如下:ed1334=ed1335=ed1336=ed1337=ed1338=ed1339=ed1340=ed1341=ed1342=ed1343=ed1344=ed1345=ed1346=ed1314=ed1317=ed1320=1;此外如之前所介紹的,本文對整個模擬分析的網(wǎng)絡(luò)進(jìn)行了最大節(jié)點連接率7,平均步長8,網(wǎng)絡(luò)半徑9,結(jié)點排序10的計算。通過調(diào)試,運行??梢缘玫较旅娴慕缑骘@示結(jié)果如圖4-2所示:

56、 圖4-2網(wǎng)絡(luò)特征的數(shù)據(jù)顯示由圖4-2:我們可以直觀的看到最大連接率的結(jié)點是名叫:房楊的同志,后面并顯示了與其相互認(rèn)識的人的數(shù)量43;另外可以看到網(wǎng)絡(luò)整個平均步長為4.59375;而整個網(wǎng)絡(luò)的半徑為7;節(jié)點排序前四名的是:房楊,王思偉,王大維,劉辰,與他們相互認(rèn)識的人的數(shù)量依次是43,21,20,16.做了一個簡單的降序排列。4.2 社會網(wǎng)絡(luò)模擬系統(tǒng)的分析 系統(tǒng)的特點與優(yōu)勢1:系統(tǒng)的特點筆者所繪制的社會網(wǎng)絡(luò)模擬系統(tǒng)是看起來很直觀很方便的,在整個程序的實現(xiàn)過程當(dāng)中,沒有通過建立大型數(shù)據(jù)庫來記錄每個節(jié)點的屬性特征,也沒有通過對圖中每個節(jié)點進(jìn)行解析抽取,而是用了一種簡單的方法,用XML對節(jié)點的屬性進(jìn)

57、行了存儲,在代碼中通過建立數(shù)組將相互聯(lián)系的人們進(jìn)行定義。這樣使得系統(tǒng)不必經(jīng)歷繁瑣的啟動和調(diào)試,更加方便于用戶的使用。同時系統(tǒng)沒有通過MFC等工具來進(jìn)行控制臺的顯示,而是純用了JAVA對控制臺進(jìn)行了編寫。此外筆者還通過閱讀國外的研究生研究成果,運用了Prefuse軟件包對相互聯(lián)系的人們進(jìn)行了可視化顯示。2:系統(tǒng)的優(yōu)勢整個模擬系統(tǒng)是社會網(wǎng)絡(luò)分析的根底,整個系統(tǒng)的優(yōu)勢是分析方法簡潔明了,直指對網(wǎng)絡(luò)中4大屬性的分析,從中可以迅速得到這個四個屬性并且加以顯示,準(zhǔn)確率很高,并且使用了JAVA語言,對系統(tǒng)有著很好的兼容性,對于社交網(wǎng)絡(luò)來說,本程序也很適合于網(wǎng)絡(luò)應(yīng)用,在一些群關(guān)系較少的社區(qū)中有著很好的效果。

58、系統(tǒng)的缺乏與改良 本文對提出的社會關(guān)系網(wǎng)絡(luò)構(gòu)屬性進(jìn)行了實驗驗證,本文所有的好友關(guān)系資料均來自人人網(wǎng),以本人好友王大維節(jié)點1為中心選取了129個好友的關(guān)系資料進(jìn)行研究。因為無法及時保證好友關(guān)系的變化,在實驗中好友關(guān)系被定義為不可變類。從而證明了本文提出的社會關(guān)系網(wǎng)絡(luò)構(gòu)建方法的正確性和有效性,為后續(xù)社會關(guān)系網(wǎng)絡(luò)的模擬分析提供了理論根底。本文主要做了以下工作: 1、以實現(xiàn)基于社會網(wǎng)絡(luò)節(jié)點確實認(rèn)。利用現(xiàn)有的社會網(wǎng)絡(luò)來確定社會網(wǎng)絡(luò)節(jié)點。 2、對當(dāng)前的各種社會網(wǎng)絡(luò)可視化方法進(jìn)行了分析和比擬,并基于Prefuse工具包將社會關(guān)系網(wǎng)絡(luò)進(jìn)行了可視化。盡管如此,由于個人技術(shù)的局限性,無法將所社會網(wǎng)絡(luò)中所有信息進(jìn)行

59、抽取,社會網(wǎng)絡(luò)中節(jié)點的具體屬性無法得到顯示和利用,而各個節(jié)點的具體屬性對于用戶來說是意義重大的,而且本文給出的技術(shù)和方法還不是很成熟,主要有以下幾方面: 1、本文對所有的好友關(guān)系都是同等對待的,未對關(guān)系進(jìn)行深入的分析。今后應(yīng)該對好友關(guān)系進(jìn)行細(xì)化二元關(guān)系、多元關(guān)系,并根據(jù)關(guān)系的親密程度提出關(guān)系親疏度的計算方法。 2、本文對社會網(wǎng)絡(luò)可視化實現(xiàn)了2D顯示,當(dāng)節(jié)點數(shù)目到達(dá)海量之后,采用上述介紹的方法將出現(xiàn)元素的交叉或重疊的沖突,可視化的3D顯示是本文今后研究的一個重點。 3、本文只對有限的數(shù)據(jù)量進(jìn)行了實驗,采用的特征抽取算法比擬簡單,無法更好的對海量數(shù)據(jù)進(jìn)行抽取。 4、本文的控制臺界面比擬簡單,沒有對

60、整個控制臺進(jìn)行相對的美化。在今后的工作中可以對其進(jìn)行改良,用專門的軟件對其進(jìn)行編輯。結(jié)束語隨著計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速開展,社會越來越多的網(wǎng)絡(luò)化,或者被網(wǎng)絡(luò)映射,以前基于人情世故的關(guān)系脈絡(luò)也開始數(shù)碼化為社會關(guān)系網(wǎng)絡(luò),而這種社會關(guān)系網(wǎng)絡(luò)既可以娛樂,也可以創(chuàng)造價值。社會關(guān)系網(wǎng)絡(luò)的模擬技術(shù)及其方法研究成為了目前的研究熱點和難點問題。 本文在今后的工作中需要對以下方面進(jìn)行深入的研究與探討: 因為Web拓?fù)浣Y(jié)構(gòu)除了一些穩(wěn)定的統(tǒng)計特征以外,更細(xì)粒度拓?fù)浣Y(jié)構(gòu)特性目前還沒有更好的度量方法,將鏈接信息和其他信息配合起來,進(jìn)一步探討具有實用價值的、更精確的社區(qū)結(jié)構(gòu)及特性分析意義重大。 本文現(xiàn)有的社會網(wǎng)絡(luò)特征仍然

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論