在線(xiàn)社會(huì)網(wǎng)絡(luò)研究(OSN)_第1頁(yè)
在線(xiàn)社會(huì)網(wǎng)絡(luò)研究(OSN)_第2頁(yè)
在線(xiàn)社會(huì)網(wǎng)絡(luò)研究(OSN)_第3頁(yè)
在線(xiàn)社會(huì)網(wǎng)絡(luò)研究(OSN)_第4頁(yè)
在線(xiàn)社會(huì)網(wǎng)絡(luò)研究(OSN)_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、在線(xiàn)社會(huì)網(wǎng)絡(luò)研究?jī)?nèi)容提綱研究背景相關(guān)研究研究?jī)?nèi)容工作研究背景Web2.0技術(shù)的發(fā)展促使在線(xiàn)社會(huì)網(wǎng)絡(luò)(OnlineSocialNetwork,簡(jiǎn)稱(chēng)OSN)的興起:Facebook,Twitter,MySpace,Flickr,Youtube等等。兩個(gè)重要挑戰(zhàn):A海量數(shù)據(jù)使數(shù)據(jù)分析和數(shù)據(jù)挖掘迎來(lái)了前所未有的機(jī)遇和挑戰(zhàn)。對(duì)新興媒體的監(jiān)管提出了挑戰(zhàn)。研究背景美國(guó)2011年7月啟動(dòng)“戰(zhàn)略通信中的社交媒體”研究計(jì)劃,投資4200萬(wàn)$。目的:有效對(duì)社交媒體中出現(xiàn)的欺騙性信息等進(jìn)行監(jiān)測(cè)、分類(lèi)和追蹤,并在深入分析之后通過(guò)有針對(duì)性的信息發(fā)布阻止謠言等傳播。印第安納大學(xué)復(fù)雜網(wǎng)絡(luò)和系統(tǒng)研究中心研發(fā)岀Truthy系統(tǒng),

2、它每小時(shí)能夠?qū)witter用戶(hù)廢送的數(shù)午條tweets行分析,以識(shí)別岀用戶(hù)行為模式以及傳播的觀點(diǎn)等信息。采用了文本和數(shù)據(jù)挖掘、復(fù)雜系統(tǒng)模型分析等先進(jìn)技術(shù),研究人員希望最終能借助該系統(tǒng)實(shí)現(xiàn)對(duì)社交媒體中傳播錯(cuò)誤信息的行為進(jìn)行自動(dòng)識(shí)別和監(jiān)測(cè)。新媒體監(jiān)管項(xiàng)目成立相關(guān)研究什么是新媒體微博相關(guān)介紹在線(xiàn)社會(huì)網(wǎng)絡(luò)的相關(guān)研究社會(huì)網(wǎng)絡(luò)研究的方向傳統(tǒng)媒體傳統(tǒng)大眾媒體就是電視、廣播.雜志.報(bào)紙什么是新媒體?新媒體是相對(duì)于傳統(tǒng)媒體在傳播形式和載體上的表現(xiàn)形式相比較而言的,因此一切在媒介表現(xiàn)形式上具有新穎性的媒體都稱(chēng)為新媒體。傳統(tǒng)媒體如果運(yùn)用上了新技術(shù),新形式也是新媒體。新渠道一一新閱讀終端新形態(tài)一一社區(qū)媒體新表達(dá)方式

3、一一碎片化+互動(dòng)+多媒體新媒體二新渠道+新形式+新表達(dá)方式+傳統(tǒng)的編輯卡青神+持續(xù)陥責(zé)廷感微博的鼻祖dRobtrtWijhti5i)rcaiinj(kd3虹Ckwiging.MwifcHefonngsiwuMY切iidd口沁k伽fhc里程碑第00億!ttcwfkbjohncwiIvev/TiuaiihiyekwjTIMEcorsiwv-abouih(*vTvvrUert$changingthewaywelis-e-anrishowinginthelucureolmnovaticfl.Ekiyacosy!10,000,898,537lO.OlO.OOO.CCO03:35:3S10,100,000

4、,CCOIday23:*4411.000.000/m19dw19:00:2120.003.000.CCO19BderF$01:56:372010年3月5日,Twitter信息統(tǒng)計(jì)網(wǎng)站Gigatweet的數(shù)據(jù)顯示,Twitter信息發(fā)送總量已經(jīng)突破100億條。微博在中國(guó)微博白皮書(shū)微博時(shí)代做啥網(wǎng)2007年正武上線(xiàn)嘀咕網(wǎng)2009年2月8日正式上線(xiàn)同學(xué)網(wǎng)2009年5月進(jìn)軍微博領(lǐng)域9911微博客2009年5月底正式上線(xiàn)Follow52009年6月上線(xiàn)新浪微博2009年8月開(kāi)始內(nèi)測(cè)搜狐微博2009年12月14日上線(xiàn)百度i貼吧2009年11月推出網(wǎng)易微博2010年1月20日上線(xiàn)內(nèi)測(cè)騰訊微博2010年4月1日

5、對(duì)外小規(guī)模測(cè)試2010年底,中國(guó)互聯(lián)網(wǎng)微博累計(jì)活躍注冊(cè)帳戶(hù)數(shù)將突破6500萬(wàn)個(gè),2011年中將突破1億。微博正以燎原之勢(shì)在全球蔓延Twitter(6年)全球獨(dú)立用戶(hù)超過(guò)102億新浪微博(6個(gè)冃)酬用戶(hù)已經(jīng)超過(guò)2900萬(wàn)微博的特征平民化:以普通用戶(hù)為主自發(fā)傳播:朋友間的相互推薦和轉(zhuǎn)發(fā)隨性化:沒(méi)有時(shí)空、形式的限制M平等、開(kāi)放、直接、正是微博這些特征迎合了人們的真實(shí)需求,微博改變了世界,也改變了互聯(lián)網(wǎng),它將人們帶入了一個(gè)更自由、更開(kāi)放、更加即時(shí)、更加互動(dòng)的個(gè)人互聯(lián)網(wǎng)時(shí)代鮮活微博應(yīng)用我的最佳Fans將基于你最近發(fā)布的微博受到的轉(zhuǎn)發(fā)和評(píng)論來(lái)源、最近AT你的人、他們是否關(guān)注了你等多個(gè)條件,使用不同的權(quán)重,

6、計(jì)算出您近期的最佳粉絲排行榜。我的熱門(mén)詞語(yǔ)酉卩合龐大的中文詞典進(jìn)行分詞。并且按照自然詞頻進(jìn)行需異金菲站分析您最近20條微博的熱門(mén)詞語(yǔ)。圍脖粉絲分析可以知道粉絲的男女比例、V認(rèn)證比例、粉絲在全國(guó)各地的分布情況。也可以知道你的粉絲中的明星有哪些以及粉絲中誰(shuí)在圍脖中的資格比較老。微博應(yīng)用微博風(fēng)云查詢(xún)您微博的影響力和活躍度排名。對(duì)您的微博,朋友,粉絲進(jìn)行深度分析。誰(shuí)最?lèi)?ài)評(píng)論我找出最喜歡通過(guò)評(píng)論和你互動(dòng)的朋友,關(guān)注這些更值得關(guān)注的人。我最受歡迎的微博可以知道你的原創(chuàng)微博中最受歡迎的那一條。微分析您的微博被轉(zhuǎn)發(fā)的趨勢(shì)圖,您的微博被評(píng)論的趨勢(shì)圖,您的粉絲的粉絲數(shù)分布社會(huì)網(wǎng)絡(luò)分析(SocialNetworkA

7、nalysis)社會(huì)網(wǎng)絡(luò)分析方法是由社會(huì)學(xué)家根據(jù)數(shù)學(xué)方法、圖論等發(fā)展起來(lái)的定量分析方法,是社會(huì)學(xué)領(lǐng)域比較成熟的分析方法。社會(huì)網(wǎng)絡(luò)分析法可以從多個(gè)不同角度對(duì)社會(huì)網(wǎng)絡(luò)進(jìn)行分析,包括中心性分析凝聚子群分析核4邊緣結(jié)構(gòu)分析以及結(jié)構(gòu)對(duì)等性分析等。一般來(lái)說(shuō),社會(huì)網(wǎng)絡(luò)可以表示成一個(gè)圖G=(V,E),每個(gè)節(jié)點(diǎn)yGV,圖中的邊V,rGEo加時(shí)間標(biāo)簽詬Vu,vt示當(dāng)節(jié)點(diǎn)y或者邊Vs卩在某個(gè)時(shí)刻幼|入圖中中心性分析-點(diǎn)度中心度/圖中心勢(shì):行動(dòng)者的重要性-中間中心度/中間中心勢(shì):行動(dòng)者之間的控制性-接近中心度/接近中心勢(shì):行動(dòng)者之間的獨(dú)立性社會(huì)網(wǎng)絡(luò)分析社會(huì)網(wǎng)絡(luò)的研究成果1967年,MilgramdfiJ“sixdeg

8、reeofSeparation”推斷1973年,Granovetter的提出“強(qiáng)鏈接,、“弱鏈接”理論1998年,Watts和Strogatz分析了小世界特性并建立了小世界網(wǎng)絡(luò)模型1999年,BarabasiDAbert揭示無(wú)標(biāo)度(scale-free)性質(zhì)并建立無(wú)標(biāo)度網(wǎng)絡(luò)模型-網(wǎng)絡(luò)度的分布遵循幕律(power-law)在線(xiàn)社會(huì)網(wǎng)絡(luò)的相關(guān)研究Adamicetal.發(fā)現(xiàn)OSN存在小世界現(xiàn)象,并局部聚集。Liben-Nowelletal.在LiveJournal上發(fā)現(xiàn)社會(huì)網(wǎng)絡(luò)的朋友關(guān)系和地理位置非常相關(guān)。GirvanandNewman觀察到OSN的用戶(hù)傾向形成緊密群組。Kumar等人研究了大型在線(xiàn)

9、社會(huì)網(wǎng)絡(luò)的動(dòng)態(tài)結(jié)構(gòu)模型。他們采用了經(jīng)典的方法,用不同時(shí)間點(diǎn)的圖的快照來(lái)推斷網(wǎng)絡(luò)增長(zhǎng)過(guò)程。AlanMislove等人對(duì)4種OSN進(jìn)行測(cè)量和分析,實(shí)驗(yàn)結(jié)果確認(rèn)了在線(xiàn)社會(huì)網(wǎng)絡(luò)的幕律、小世界、無(wú)標(biāo)度等特征。還觀察到結(jié)點(diǎn)的入度和出度基本一致;網(wǎng)絡(luò)包括了一個(gè)緊密鏈接的高度核心結(jié)點(diǎn);這個(gè)核心結(jié)點(diǎn)鏈接小的群組,這些群組是由低度的網(wǎng)絡(luò)邊緣結(jié)點(diǎn)強(qiáng)鏈接構(gòu)成。社會(huì)網(wǎng)絡(luò)的直徑小,圖中的邊趨向于局部聚類(lèi)。以MSN信息網(wǎng)絡(luò)為例,它的平均路徑長(zhǎng)為6.6,且90%的節(jié)點(diǎn)可通過(guò)8步達(dá)到。社會(huì)網(wǎng)絡(luò)分析的研究方向社會(huì)網(wǎng)絡(luò)的結(jié)構(gòu)分析-統(tǒng)計(jì)分析:網(wǎng)絡(luò)直徑、PowerLaw、網(wǎng)絡(luò)直徑等-社區(qū)發(fā)現(xiàn)-結(jié)點(diǎn)分類(lèi):影響力,專(zhuān)家發(fā)現(xiàn)-網(wǎng)絡(luò)演變:動(dòng)力

10、學(xué)-鏈接預(yù)測(cè)-可視化社會(huì)網(wǎng)絡(luò)的內(nèi)容分析-通用數(shù)據(jù)挖掘-文本挖掘-多媒體挖掘-傳感器的數(shù)據(jù)流挖掘社會(huì)網(wǎng)絡(luò)分析的研究團(tuán)隊(duì)國(guó)內(nèi)的團(tuán)隊(duì)-上海交大:汪小凡教授-中國(guó)原子能科學(xué)研究院:方錦清教授-電子科大:周濤教授網(wǎng)絡(luò)信息挖掘-中國(guó)傳媒大學(xué):沈浩教授網(wǎng)絡(luò)數(shù)據(jù)挖掘-國(guó)防大學(xué):胡曉峰教授基于戰(zhàn)爭(zhēng)的復(fù)雜網(wǎng)絡(luò)研究-北京理工大學(xué):張華平博士網(wǎng)絡(luò)搜索挖掘與安全研究?jī)?nèi)容微博的研究新浪微博的統(tǒng)計(jì)分析用戶(hù)排名的相關(guān)研究微博的研究微博基本的統(tǒng)計(jì)性質(zhì)微博中內(nèi)容分析的研究-自動(dòng)生成標(biāo)簽-基于主題模型的研究-自動(dòng)抽取關(guān)鍵短語(yǔ)-微博和傳統(tǒng)媒體內(nèi)容間的差異-微博中的HashTag的研究微博中社會(huì)關(guān)系網(wǎng)絡(luò)的分析-各種鏈接關(guān)系圖以及鏈接間

11、的分析-鏈接關(guān)系的語(yǔ)義-用戶(hù)排序-資源排序微博的研究微博中檢索分析-微博的檢索需求-比較微博檢索和傳統(tǒng)檢索的不同-如何利用微博來(lái)提高傳統(tǒng)檢索-如何利用傳統(tǒng)檢索來(lái)加強(qiáng)微博檢索微博的應(yīng)用研究-事件檢測(cè)-情感分析新浪微博的統(tǒng)計(jì)分析分析工具-UCINET6.0可以處理32767個(gè)點(diǎn)的網(wǎng)絡(luò)數(shù)據(jù)xitbuttonxitbuttoneditorSubmenubuttons分析工具-Pajek2.0PajekJnlxlFileNetNetsOperationsPartitionPartitionsPernut.ClusterHierarchyVectorVectorsOption$DrawMacroInfoT

12、ools分析結(jié)果一網(wǎng)絡(luò)直徑(pajek2.0)命令:Net/Pathsbetween2vertices/Diameter的菜單命令網(wǎng)絡(luò)的直徑:27左右一平均距離(pajek2.0)命令:Net/Pathsbetween2vertices/fromallvertices纟占果:Averagedistanceamongreachablepairs:863561-平均度(1420036)平均入度:2.129(770405)平均入度:1.709分析結(jié)果-度分布分析雙對(duì)數(shù)坐標(biāo)下的入度分布(770405個(gè)結(jié)點(diǎn),1316791條關(guān)系)分析結(jié)果-度分布分析雙對(duì)數(shù)坐標(biāo)下的入度分布(1420063個(gè)結(jié)點(diǎn),3023

13、835條關(guān)系)分析結(jié)果-度分布分析雙對(duì)數(shù)坐標(biāo)下的出度分布(80000隨機(jī)結(jié)點(diǎn))分析結(jié)果-微博數(shù)分布分析微博數(shù)分布用戶(hù)排名的相關(guān)研究RankingApproachesforMicroblogSearch1摘要:本文描述了在實(shí)時(shí)搜索引擎中的幾個(gè)微博排名策略,因?yàn)槿狈_(kāi)真實(shí)有效的數(shù)據(jù)集,因此我們?cè)O(shè)計(jì)了一個(gè)獲取有效數(shù)據(jù)集的框架TABS,并提岀了評(píng)估排名策略準(zhǔn)確性的方法,實(shí)驗(yàn)表明考慮微博作者的社會(huì)網(wǎng)絡(luò)屬性和微博的自身屬性對(duì)微博的搜索引擎是有益的。2主要貢獻(xiàn):提岀了幾個(gè)微博排名策略;設(shè)計(jì)了數(shù)據(jù)集的收集工具,提出了兩個(gè)排名策略的定量評(píng)估指標(biāo)。實(shí)證了所有排名算法的有效性。3主要內(nèi)容定義1:微博排名(Twee

14、tRank):TR(a)=N(a),N(R是a作者目前的微博數(shù)。用戶(hù)排名的相關(guān)研究(續(xù))RankingApproachesforMicroblogSearch定義2:FollowerRank是:FR(a)=i(a)/(i(a)+o(a)定義3:tweets排名:fTR(t,q)=TR(auth(t)fpR(t,q)二FR(auth(t)定義4:長(zhǎng)度排名:fLR(t,q)二l(t)/maxl(s)定義5:URL排名:fUR(t,q)=ciftcontainsaURLelse0定義6:fFLR(t,q)=fFR(t,q)+fLR(t,q)fFLUR(t,q)=fFLR(t,q)+fuR(t,q)A

15、WeightedMulti-factorAlgorithmforMicroblogerSearch1摘要:該論文主要關(guān)注微博的排名策略,利用6個(gè)要素度量用戶(hù)的社會(huì)影響力,每個(gè)要素都和微博的作者及其自身屬性的社會(huì)網(wǎng)絡(luò)特征有很大的相關(guān)性,基于此,論文提出了加權(quán)多要素排名算法(WMFR)。通過(guò)對(duì)用戶(hù)選擇和tweets選擇算法進(jìn)行Kendall的才相關(guān)分析,結(jié)果表明與現(xiàn)有的幾個(gè)算法相比,WMFR更高效。2主要內(nèi)容:文章提岀了影響排名的6個(gè)要素:微博數(shù)、粉絲數(shù)、微博長(zhǎng)度、URL數(shù)、轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù),并給出相應(yīng)的排名策略:定義1URLRank:fUR(t,q)二N(URL)定義2RetweetRank:fR

16、T(t?q)=N(rt)定義3mentionRank:fMention(q)=N(mention)定義4綜合排名:fFLR匚q)=fFRt,q)+fLRt,q)fFLUR,匚Q)-%斤(匚6+血心金FLURT(q)二fFLURt,g)+fRTt,q)fgR(t,q)二fFR(t,q)+fLR(t,q)+fuR(t,q)+fRT(t,4)+fmerition(匚q)二Wo*fFR(t,q)+W*fLR(t,q)+w2*fuR(t,q)+w;3*fRT(t,q)+W4*f斶tion(Kq)TwitterRank:FindingTopic-sensitiveInfluentialTwitterers

17、1摘要:該論文關(guān)注的是微博用戶(hù)的影響力問(wèn)題。提出了衡量用戶(hù)影響力的PageRank的擴(kuò)展算法一TwitterRank。該算法從主題相似和鏈接結(jié)構(gòu)兩個(gè)方面評(píng)價(jià)用戶(hù)的影響力。2主要內(nèi)容:TopicDistillationTopic-specificRelationshipNetworkConstructionTopic-sensitiveUserInfluenceRankingTwitterRank:FindingTopic-sens!tiveInfluentialTwitterers(1)通過(guò)分析twitter用戶(hù)他們所發(fā)表的tweets的內(nèi)容,識(shí)別他們所感興趣的topic(2)基于中特定的to

18、pic,構(gòu)造twitter用戶(hù)間的關(guān)系網(wǎng)絡(luò)(特定topic用戶(hù)間轉(zhuǎn)移方式)(3)對(duì)于每個(gè)特定topic,twitter用戶(hù)影響力排序從tweets中提取潛藏的主題信息topic采用了LDA(LatentDirichletAllocation,中文名潛在的狄利克雷分配)模型。利用隨機(jī)游走算法給相同主題的用戶(hù)進(jìn)行排序。最后比較了indegree,PageRankTopic-sensitivePageRank0TwitterRank等4種排序算。用戶(hù)排名的相關(guān)研究(續(xù))MeasuringUserInfluenceinTwitter:TheMillionFollowerFallacy1摘要:在本文中對(duì)

19、三種衡量影響力的方法進(jìn)行深入的比較:入度,轉(zhuǎn)發(fā)和評(píng)論。根據(jù)這些要素,研究了跨主題和時(shí)間的動(dòng)態(tài)用戶(hù)影響力。得出:入度高的用戶(hù)并不一定具有影響力最具有影響力的用戶(hù)在多個(gè)主題上有顯著的影響影響力不是自發(fā)地或意外獲得,而是通過(guò)協(xié)調(diào)一致的努力。比如在單一主題上有著高質(zhì)量的內(nèi)容一點(diǎn)想法微博的重要用戶(hù)分析前提:微博已經(jīng)變得越來(lái)越流行,在給人們帶來(lái)方便的同時(shí),也成為謠言傳播的平臺(tái)。為了對(duì)微博進(jìn)行有效的監(jiān)管,用戶(hù)的權(quán)威性分析變得越發(fā)的重要。方法:首先采用監(jiān)督學(xué)習(xí)的方法根據(jù)用戶(hù)所發(fā)的微博內(nèi)容對(duì)用戶(hù)進(jìn)行社會(huì)領(lǐng)域分類(lèi),然后分析用戶(hù)的度中心性、中間中心性、微博數(shù)、轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù),利用加權(quán)平均的方式計(jì)算出用戶(hù)在各領(lǐng)域中的

20、權(quán)威性排名。未來(lái)工作關(guān)注新媒體的信息傳播模型ReferenceNaginoti,R.,A.Teredesai,andM.DeCock,RankingApproachesforMicroblogSearch.Proceedings2010IEEE/ACMInternationalConferenceonWebIntelligence-IntelligentAgentTechnology(WITAT),2010.Zhao,L,Y.Zeng,andN.Zhong,Aweightedmulti-factoralgorithmformicroblogsearch.ActiveMediaTechnology,2011:p.153-161.Weng,J,etal.,TwitterRank:findingtopic-sensitiveinfluentialtwitterers,inProceedingsof

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論