基于六度空間理論的通信社會關系網絡研究_第1頁
基于六度空間理論的通信社會關系網絡研究_第2頁
基于六度空間理論的通信社會關系網絡研究_第3頁
基于六度空間理論的通信社會關系網絡研究_第4頁
基于六度空間理論的通信社會關系網絡研究_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

./基于六度空間理論的通信社會關系網絡研究.txt52每個人都一條拋物線,天賦決定其開口,而最高點則需后天的努力。沒有秋日落葉的飄零,何來新春綠芽的餓明麗?只有懂得失去,才會重新?lián)碛小1疚挠蒭clipsky貢獻pdf文檔可能在WAP端瀏覽體驗不佳。建議您優(yōu)先選擇TXT,或下載源文件到本機查看。XX大學碩士學位論文基于六度空間理論的通信社會關系網絡研究__藍泳鑠申請學位級別:碩士專業(yè):概率論與數理統(tǒng)計指導宋世斌20090526基于六度空間理論的通信社會關系網絡研究專業(yè):概率論與數理統(tǒng)計碩士生:藍泳鑠指導宋世斌副教授摘要為了改進以往以孤立的觀點對待通信用戶進行研究的不足,本研究借鑒互聯(lián)網行業(yè)的社會化網絡服務〔SNS〕經驗,首次在通信領域中引入六度空間的概念,并以此作為理論基礎,對通信領域的社會關系網絡進行了研究。首先,以某地區(qū)2008年7月份的通信行為數據為基礎,結合數據挖掘技術,使用Logistic回歸算法和改進的模糊層次分析法建立用戶營銷活動響應度模型以與"關鍵聯(lián)系人"檢索模型,實現(xiàn)了通信社會關系網絡中高活躍社群的挖掘;其次,通過關聯(lián)路徑和最短路徑檢索算法的設汁,構建了這些"關鍵聯(lián)系人"的通信社會關系網絡,包括用戶的通信網絡以與用戶間的最短通信路徑,并使用Flex技術進行前端界面開發(fā);最后,從商業(yè)應用角度出發(fā),轉變傳統(tǒng)的"撒網式"營銷模式,建立了以"關鍵聯(lián)系人"為核心的精確營銷模式,并舉營銷案例進行說明。本文突破以往孤立的研究方式,從通信用戶的關系網絡入手進行研究,充分體現(xiàn)了人際關系的價值,同時也豐富了國內電信業(yè)在該領域的研究。關鍵詞:六度空間、社會關系網絡、Logistic回歸、模糊層次分析法、關鍵聯(lián)系人modeintobuildingtheprecisemarketingmodeof‘keyexamplestoillustratecontactpersons’,andgaveaitsapplication.Thispapermadebreakthroughinthepastisolatedresearchstyle,fullyembodiedthevalueofinterpersonalrelationship,andenrichedtheresearchinthefieldofChinesetelecomindustry.KeyWords:Sixdegreesofseparation,socialrelationnetwork,logisticregression,fuzzyanalytichierarchyprocess,keycontactpersonsHI論文原創(chuàng)性聲明內容:本人X重聲明:所呈交的學位論文,是本人在導師的指導下,獨立進行研究工作所取得的成果。除文中已經注明引用的內容外,本論文不包含任何其他個人或集體已經發(fā)表或撰寫過的作品成果。對本文的研究作出重要貢獻的個人和集體,均已在文中以明確方式標明。本人完全意識到本聲明的法律結果由本人承擔。學位論文作者簽名:堇I聰g,日期:加。c7年鄉(xiāng)月2f日學位論文使用授權聲明本人完全了解XX大學有關保留、使用學位論文的規(guī)定,即:學校有權保留學位論文并向國家主管部門或其指定機構送交論文的電子版和紙質版,有權將學位論文用于非贏利目的的少量復制并允許論文進入學校圖書館、院系資料室被查閱,有權將學位論文的內容編入有關數據庫進行檢索,可以采用復印、縮印或其他方法保存學位論文。學位論文作者簽名:耋海銣導師簽名:日期:.珈7年g月二石日日期:川第一章引言1.1選題的目的和意義1967年,哈佛大學的社會心理學家米爾格蘭姆〔StanleyMilgra]呻就設計了一個連鎖信件實驗。他將一套連鎖信件隨機發(fā)送給居住在內布拉斯加州奧馬哈的160個人,信中放了一個波士頓股票經紀人的名字,信中要求每個收信人將這套信寄給自己認為是比較接近那個股票經紀人的朋友,朋友收信后照此辦理。最終,大部分信在經過五、六個步驟后都抵達了該股票經紀人,六度空間的概念由此而來[l]。六度空間理論〔Si〕[DegreesofSeparation〕,也稱為六度分割理論、小世界理論等,指你和任何一個陌生人之間所間隔的人不會超過六個,也就是說,最多通過六個人你就能夠認識任何一個陌生人。但是這并不是說任何人與人之問的聯(lián)系都必須要通過六個層次才會產生聯(lián)系,而是表達了這樣一個重要的概念:任何兩位素不相識的人之間,通過一定的聯(lián)系方式,總能夠產生必然聯(lián)系或關系。顯然,隨著聯(lián)系方式和聯(lián)系能力的不同,實現(xiàn)個人期望的機遇將產生明顯的區(qū)別。圖1.I六度空聞理論示意圈者,他們是各大互聯(lián)網事件的參與者,或者說他們是創(chuàng)造者,可能這類人只有20%,但他們確能創(chuàng)造80%的內容。同時也有更多的一批人,他們雖然也是互聯(lián)網的使用者,但是確是一種比較被動的方式參與,他們不制造內容,或者說制造的內容也沒有影響力,他們更多的還是受眾。我們指望在WEB2.O時代,人人成為內容制造者實際上不可能的,大多數人還是習慣于成為內容的消費者。所以作為來說,最重要的還是抓住那批20%的人[5]。在移動通信領域同樣存在這種強弱節(jié)點的現(xiàn)象,這些人一般對于營銷活動響應度較高,綜合使用語音、數據業(yè)務比較活躍,用戶的社交圈較廣,p時U值適當。因此,本文第一部分以2008年7月份某地區(qū)的通信行為數據為基礎,使用數據挖掘技術建立用戶營銷活動響應度模型以與"關鍵聯(lián)系人"檢索模型,從而挖掘出這些輻射力、影響力較強的高活躍社群。其次,本文第二部分通過關聯(lián)路徑檢索算法和最短路徑搜索算法的設計,構建了這些"關鍵聯(lián)系人"的通信社會關系網絡,該網絡主要包括通信用戶的"六度空間’’,即其朋友圈,以與用戶和用戶之間的通信路徑等,并采用FLEX開發(fā)技術將該網絡以Flash的界面形式展現(xiàn)出來,以求直觀的了解。最后,本文第三部分提出該通信社會關系網絡的應用方向,建立以"關鍵聯(lián)系人’’為核心的精確營銷,并以移動飛信產品的營銷策劃作為例子進行說明,充分體現(xiàn)人傳媒的價值,發(fā)揮其影響力、輻射力,有效占領市場并且降低營銷成本。,1。4本文的創(chuàng)新點〔1〕社會關系網絡在通信行業(yè)的應用豐富了國內電信業(yè)在該領域的研究成果,改進了以往以孤立的觀點對待通信用戶進行研究的不足,建立通信社會關系網絡體系,用以描述通信網絡用戶與他們之間的聯(lián)系,并且利用該關系網絡對用戶特征進行研究?!玻病骋越y(tǒng)計理論為基礎,結合數據挖掘技術,在該地區(qū)某電信運營商的所有用戶中,挖掘出一批通信活躍,具有輻射力、影響力的巧關鍵聯(lián)系人",并建立以"關鍵聯(lián)系人"為中心的口碑式營銷模型,從而突破傳統(tǒng)的營銷模式,利用"關鍵聯(lián)系人’’的影響力去推廣業(yè)務,而不是運營商直接去對客戶推廣,既節(jié)?。戳顺杀?又取得了效果?!玻场潮狙芯繉崿F(xiàn)了通信社會關系網絡中關聯(lián)路徑和最短路徑的查找算法,借助該算法構造了六度空間的數據存儲表,并結合SAS軟件運籌〔OR〕模塊的NETFLOW運算過程,實現(xiàn)了包括DijkStra[6],Prinlal.Dual內點算法[71等圖論計算算法,從而為六度空間原理的證明提供了有力的理論依據。5〔1〕結合商業(yè)需求,我們將"關鍵聯(lián)系人"定義為那些對于營銷活動響應度較高,綜合使用語音、數據業(yè)務比較活躍,用戶的社交圈較廣,并且ARPU值〔每用戶平均收入〕適當的用戶,由此確定以下6個指標作為定義"關鍵聯(lián)系人"的核心指標,包括①營銷活動響應度;②一度社交圈人數;③語音通話次數;④短信收發(fā)次數;⑤彩信收發(fā)次數:⑥ARPu值?!玻病呈褂糜脩敉ㄐ徘鍐巍祿I(yè)務數據以與營銷活動數據,建立用戶營銷活動響應度模型,然后使用該模型對2008年7月份所有通信用戶的營銷活動響應概率進行預測,并將此作為"關鍵聯(lián)系人"指標之一——營銷活動響應度?!玻场辰Y合商業(yè)需求,定義"關鍵聯(lián)系人"的"活躍度"為以上6個指標的線性組合,使用改進的層次分析法,即模糊層次分析法來計算這6個指標的權重,確定"活躍度"的計算表達式,生成"關鍵聯(lián)系人"。2.2營銷活動響應度模型用戶對營銷活動的響應情況是運營商開展活動的重要條件,因此本文基于用戶通信清單、數據業(yè)務數據以與營銷活動數據,結合數據挖掘技術,使用SAS軟件的EnterpriseMiIler工具建立Logistic回歸模型,即用戶營銷活動響應度模型,然后使用該模型來計算2008年7月份所有通信用戶的營銷活動響應概率,并將此作為"關鍵聯(lián)系人"的指標之一。2.2.1Logistic回歸算法隨著信息技術迅速發(fā)展,數據庫的規(guī)模不斷擴大,產生了大量的數據。但大量的數據往往無法辨別隱藏在其中的能對決策提供支持的信息,而傳統(tǒng)的查詢、報表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數據分析技術處理大量數據,并從中抽取有價值的潛在知識,數據挖掘〔DataMilling〕技術由此應運而生。從20世紀90年代以來,數據挖掘技術的發(fā)展速度很快,在當今世界的海量數據中隱藏著人們所需要的具有決策意義的信息,數據挖掘技術的產生和發(fā)展使得人們可以利用這些數據中挖掘出有用的、隱藏的商業(yè)和科學信息。由于7數據挖掘是多學科綜合的產物,它從多個學科汲取營養(yǎng),包括數據庫技術、人工智能、機器學習、神經網絡、統(tǒng)計學、模式識別、知識庫系統(tǒng)、信息檢索和數據庫可視化等,因此目前還沒有一個完整的定義。通常普遍認同的一個十分廣泛的數據挖掘定義是:從數據庫中抽取隱含的、以前未知的、具有潛在應用價值的模型或規(guī)則等有用知識的復雜過程,是一類深層次的數據分析方法[81。數據挖掘是以全球廣泛認可的S臥嗄MA數據挖掘進程作為方法論的,SEMMA是抽樣〔Sa叫〕le〕,探索〔Explore〕,調整〔Modif3,〕,建?!玻停铮洌澹臁?評估〔Assess〕的縮寫,對應數據挖掘的5個步驟,即數據取樣、數據特征探索、分析和預處理、數據調整和技術選擇、模型的研發(fā)和知識發(fā)現(xiàn)、模型和知識的綜合解釋和評價。具體如下:〔1〕Samplr數據取樣當進行數據挖掘時,首先要從企業(yè)大量數據中取出一個與企業(yè)要探索問題相關的樣板數據子集,而不是動用全部企業(yè)數據。通過數據取樣,要把好數據的質量關,一定要保證取樣數據的代表性、真實性、完整性和有效性,這樣才能通過此后的分析研究得出反映本質規(guī)律性的結果。根據具體的需求,可以創(chuàng)建訓練集、測試集和效驗集?!玻病常牛兀穑欤铮颍逡粩祿卣魈剿?、分析和預處理當用戶拿到了一個樣本數據集后,它是否達到用戶原來設想的要求,有沒有什么明顯的規(guī)律和趨勢,有沒有出現(xiàn)用戶所從未設想過的數據狀態(tài),各因素之間有什么相關性,可區(qū)分成怎樣~些類別,這些都是首先要探索的內容。在進行數據特征的探索和分析時,應用可視化數據操作的工具,對樣本數據進行可視化的預分析,發(fā)現(xiàn)數據的異常趨勢和規(guī)律性?!玻场常停铮洌榉忠粩祿{整和技術選擇通過Sample和Explore兩步之后,用戶進~步明確了原來要解決的問題,這時要盡可能對問題解決的要求作進一步的量化。在問題進一步明確化的基礎上,用戶可以按照問題的具體要求來審視數據集,看它是否適應企業(yè)問題的需要。針對問題的需要,可能要對數據進行增刪,也可能按照用戶對整個數據挖掘過程的新認識,組合或者生成一些新的變量,以體現(xiàn)對狀態(tài)的有效描述?!玻础常停铮洌宀芬荒P偷难邪l(fā)和知識的發(fā)現(xiàn)8羹;蓁耄囊鎏囊耄羹塞囊奏霧菱霪萎;i霉i囂鎏i囊善耋!≤妻器鍪莖羹蠹霎垂蠢羹簍霧j一妻薹霉羹鎏躉——囊羹鍪薹塞羹。羹藿薹霎耄薹璧;謄鏨蠢鏨耋薹萋蕈毫;霎蠶簍羹璺薹蠹——耋荔蠶曼萋薹j萋囊饕蓁:奏簍羹萎囊萎。薹霪霎饕萋薹;囊薹薹萋蓁霎翼塑——囊薹霉羹冀霧蕙鋈蠶二奏薹鬟囊薹蠶;薹羹||囊薹:垂薹鍪耋釜耋薹囊囊萋要姜霎蓁塞i鋈羹萎;摹囊薹霾妻囊囊冀霉主i莖薹囂i。霞薹璧蠹羹羹鎏萎薹;莖薹鬟i;奏萎;砉i耋薹i蓬蓬耋i薹霎羹薹羹簍霧奏霪輦;塞霉姜;i薹霪霎簍砉l耋囊秦霉j冀霉萎|薹|l莖棗囊ij蓁冀羹蠹螢薹誓委垂÷i籮霎i萋薹薹蠹薹攀霎莖羹羹l;詈羹;。耋霎妻蠢羹羹萋孳妻鬟霎霎羹委嚳甲I童攀*萋羹薹箋莖囊,l襄i簍委薹萎摹|一翟惑爹掌≤羹霧霎奏霉奏霎婁囊,蓁薹喜薹冀鎏霧囊鋈簍薹耋萋妻羹鬲i些萋奏霎.;ii搴妻蠢冀耋崮薹霎鍪冀簍耋鍪m蔞薹÷雩蓁蓁,鬟霎霪霎妻霪鎏|髦窶薹冀蘿耋薹羹羹霧囊霎薹薹妻蠢羹鎏日薹霎砷;奏蓁鏨鋈蠢鋈囊羹霎霉萋鍪耋簍妻霎鍪囊鏨墓簍霪翼囊薹薹羹簍襄薹薹蠹囊鋈,蠶霎耋妻妻萋冀萎薹莖霧簍耋羹!囊窶蓁鍪菱簍霎簍。羹萋蓍蠹霧妻薹墓落荔霧蓁訓磊騷蜘鐾掘蠹酋基羹鍪,囊霪簍蠶墼霎霎霎霧量薹至囊薹羹羹垂=輦誓霪主羹善薹簍蠢妻鏨霪。薹霧囊耋毒蠹囊l薹鎏蠶纂霪耋羹j羹霧霧簍;薹甍塑塞,霧鬟簍藿:薹薹鎣囊羹羹簍霎囊霉姜萋蔞孤萎薹;蔞鬟妻萋霉p[羹霎謇薹耋簍襄羹。薹荔一妻析X疇,是社會學、生物統(tǒng)計學、臨床、數量心理學、市場營銷等統(tǒng)計實證分析的常用方法。Logistic模型是對數線性模型〔Log-lmarmodel〕的~種特殊形式,當對數線性模型中的一個二分類變量當作因變量并定義為一系列的自變量的函數時,對數線性模型就變成了Logistic回歸模型。本章中,考慮到通信用戶的響應是營銷活動中的一個實際問題,因此多元統(tǒng)計模型比較合適,其中Logistic回歸模型比Fisher或Bayes等判別分析模型具有更大的應用優(yōu)勢,主要體現(xiàn)在[lo]:〔1〕Logistic回歸模型不需要像判別分析模型那樣,要求變量滿足多元正態(tài)性假設?!玻病常蹋铮纾椋螅簦椋慊貧w模型由于有直接的統(tǒng)計檢驗,能包含非線性效果和大X圍診斷,因此適用性強?!玻场常蹋铮纾椋樱簦椋慊貧w模型對自變量無要求,可以是定性的或定量的,輸出可為二分類或多分類變量。標準109istic分布的均值為0,方差為7r2/3,其累積分布函數如下:.P〔J,21l工〕=雌≤心+肛〕]2壽1圖2-3Logistic回歸圖該函數稱為Logistic函數,具有S型的分布。Logistic回歸模型假設事件發(fā)生的概率p與自變量_之間的關系服從標準的L09istic累積概率分布函數,當有m個自變量時通常表示為:p=exp卜心+∑_p叫』=l式中因變量p的取值限制在o~1之間,并隨@+∑x』p』〕的變化而連續(xù)變lO化,其中口和p』為系數。對上式進行線性變換可得:南2eXp〔a+嘉矽,〕按照LogiStic回歸模型的定義,事件發(fā)生〔即研究對象的反映結果為1時〕的概率為p,事件不發(fā)生的概率為1一p,p/〔1一p〕通常叫做勝算比,或者優(yōu)勢比〔oddsratio〕,它具有很好的物理解釋意義,表示事件發(fā)生的概率相對于不發(fā)生的概率的強度。對上式兩邊取對數可得:111圭=a+羔_盧,卜p笥∥’上式通常被稱為觀測值少的Logistic形式。與線性回歸不同,由于Logistic回歸是一類非線性模型,估計參數口、p,需要利用已知多組觀測樣本〔即每組自變量xn,t:,…,‰〕以對應事件發(fā)生的觀測值y,〔少,=O或1〕,并采用最大似然估計法來求解。建立刀個觀測值的似然函數:L=兀n∥〔1一只〕1一少,=1三是用觀測數據的概率來表示的,取三為最大來估計參數,其含義表示估計出來的參數能夠通過模型以最大概率再現(xiàn)樣本觀測數據。對上式取對數得到對數似然函數為:ln三=∑陟血p,+〔1一只〕ln〔1一p,〕]對僅和盧』求偏導得:型些:oaa掣:o〔',:1,2,..塒〕8p。、一+‘上式通常被稱為對數似然方程組,從中求得的最大值即為三的最大似然估計值Ⅲ-]2]。采用Ne、咖n.1泖11S。n迭代法求解上式可得到待估的參數&和房,代入Logistic回歸模型求得的p。稱為條件概率只的最大似然估計,表示在x條件下兒=1的條件估計。Logistic回歸模型的估計包括參數檢驗和模型檢驗兩部分。盧,的估計值采用標準正態(tài)分布統(tǒng)計量z:旦SE〔、pt、或者自由度為1的w口脅2=z2來檢驗,其中舾〔盧/〕為盧』的漸進標準誤差,通過將迭代過程中的信息矩陣逆矩陣的對角元素開方即可得到。整個模型的擬合程度可通過擬合優(yōu)度來檢驗,經常采用的是pearSonz2和Hosm£r_Lemeshow檢驗等,具體計算方法可參看文獻[13Ⅲ]。2.2.2EnterpriseMiner介紹SASEnterpriSeMiner〔簡稱EM〕是基于全球廣泛認可的SEMMA數據挖掘進程。SEMMA為執(zhí)行數據挖掘的核心任務提供了一個靈活的框架,所以不管是富有經驗的統(tǒng)計人員,還是經驗稍微欠缺的商業(yè)分析師,都可以在該框架的指導下開發(fā)出更多更好的模型。SAS獨特的SEMMA方法采用了結構化的進程,以合理的方式對每一步所需的工具進行組織,借助可以修改,保存和共享的流程圖,SE^心壓A能夠更方便地使用研究統(tǒng)計技術和視圖技術,選擇和變換最重要的變量,通過這些變量來創(chuàng)建模型,以便預測結果,對模型的精確度進行確認,并進行模型部署的準備工作。12田2qs^sEme鄺由eMimr操作界面sAs/EM是一個圖形化界面,菜單驅動的,拖拉式操作,對用戶非常友好且功能強大的數據挖掘集成環(huán)境。主要集成以下幾個方面㈣:〔1〕數據獲取工具在sAs,EM的這個數據獲取工具中.可以通過對話框指定要使用的數據集的名稱,并指定要在數據挖掘中使用的數據變量。變量分為兩類:區(qū)間變量〔ImervalⅦ誼ble〕和分類變量〔classⅧiable〕。區(qū)間變量是指那些要進行統(tǒng)計處理的變量。對于這樣一些變量,在數據輸入階段可以指定它們是否要作最大值、晟小值、平均值、標準差等的處理,還可給出該變量是否有值的缺漏,缺漏的百分比是多少等。區(qū)問變量以外的變量稱之為分類變量,在數據輸入階段將會提供每個分類變量共有多少種值可供分類之用?!玻病硵祿闃庸ぞ邔Λ@取的數據,可再從中作抽樣操作。抽樣的方式是多種多樣的,包括隨機抽樣、等距抽樣、分層抽樣、從起始順序抽樣和分類抽樣等方式。隨機抽樣:在采用隨機抽樣方式時,數據集中的每一組觀測值都有相同的被抽樣的概率。如接10%的比例對一個數據集進行隨機抽樣,則每一組觀測值都有IO%的機會被取到。等距抽樣:如按5%的比例對一個有loo組觀測值的數據集進行等距抽樣,則有:100,5=20,等距抽樣方式是取第20、40、60、80和第100等五組觀測值。分層抽樣:在這種抽樣操作時,首先將樣本總體分成若干層次〔或者說分成若干個子集〕。在每個層次中的觀測值都具有相同的被選用的概率,但對不同的層次可設定不同的概率。這樣的抽樣結果可能具有更好的代表性,進而使模型具有更好的擬合精度。從起始順序抽樣:這種抽樣方式是從輸入數據集的起始處開始抽樣。抽樣的數量可以給定一個百分比,或者就直接給定選取觀測值的組數。分類抽樣:在前述幾種抽樣方式中,抽樣的單位都是一組觀測值。分類抽樣的單位是一類觀測值,這里的分類是按觀測值的某種屬性進行區(qū)分,如按客戶名稱分類、按地址區(qū)域分類等。顯然在同一類中可能會有多組觀測值,分類抽樣的選取方式就是前面所述的幾種方式,只是抽樣以類為單位。設置多種形式的抽樣方式不僅給了您抽樣的靈活性,更重要的是從抽樣階段您就能主動的考慮數據挖掘的目的性,強化了最后結論的效果。〔3〕數據篩選工具通過數據篩選工具可從觀測值樣本中篩選掉不希望包括進來的觀測值。對于分類變量可給定某一類的類值說明此類觀測值是要排除于抽樣X圍之外的,對于區(qū)間變量可指定其值大于或小于某值時的這些組觀測值是要排除于抽樣X圍之外的,通過數據篩選使樣本數據更適合要數據挖掘的目標?!玻础硵祿兞哭D換工具利用此工具可將某一個數據進行某種轉換操作,然后將轉換后的值作為新的變量存放在樣本數據中。轉換的目的是為了使數據和將來要建立的模型擬合的更好。例如,原來的非線性模型線性化、加強變量的穩(wěn)定性等??蛇M行取冪、對數、開方等轉換,當然,也可給定一個公式進行轉換。〔5〕建立數據挖掘用的數據庫在進行數據挖掘分析模型的操作之前,要建立一個數據挖掘的數據庫〔DMDB〕,其中就放置此次要進行操作的數據。因為此后可能要進行許多復雜的數學運算,在這里建立一個專門的數據集將使工作更加有效率。在處理之前,可對選進數據挖掘數據庫的各個變量預先進行諸如最大、最小、平均、標準差等處理,對一些要按其分類的變量的等級也先放入MetaData之中,以利接下來的14操作,總之在這個數據庫中為數據挖掘建立一個良好的工作環(huán)境?!玻丁硵祿诰蜻^程在數據挖掘的過程中可以使用SAS廣泛的數學方法,以與實現(xiàn)最新數學方法的環(huán)境。SAS/EM提供豐富的數據挖掘模型和靈活算法,包括如下模型算法:聚類分析、多元回歸模型/LogiStic回歸、決策樹模型、神經網絡模型、關聯(lián)模式/序列模式分析、時間序列分析、鏈路分析模型、記憶基礎推理、SOM依OHONEN神經網絡分類算法、主成分分析、二階模型等。同時,SAS/EM提供Ensemble節(jié)點進行多個模型的整合。EIlsemble節(jié)點可以創(chuàng)建一個新的模型以平均來自多個前置模型的分類目標的后驗概率或間隔目標的預測值,由此可以使得生成的模型更加穩(wěn)定和高效。〔7〕數據挖掘的評價工具在SAS/EM的評價工具中,提供了一個通用的數據挖掘評價的架構,可以比較不同的模型效果,預報各種不同類型分析工具的結果。SAS/EM提供Assessmem節(jié)點進行模型評估。在舡sessment節(jié)點中,可以使用LIFT圖、PROFll億OSS圖、ROI圖、診斷分類圖、I的C圖、Thresh01d-based圖等一系列標準的圖表,進行模型比較與評估。在SAS/EM的評價工具中,還可以進行客戶化的工作,對那些標準的評價圖表按具體要求進行更改?!玻浮辰Y果輸出SAS/EM的Score節(jié)點提供以SAS數據步代碼的方式產生模型打分的公式。SAS/EM提供ScoreConverter節(jié)點,可以把Ente?。颍椋螅澹停椋妫欤澹虻耐诰蛄鞒虉D由Score節(jié)點產生的SAS數據步打分代碼轉換成C或JA、,A語言,并且可以把這些C或JA、,A語言的數據挖掘打分代碼集成到標準的C或JAVA應用中去。2.2.3用戶營銷活動響應度計算基于用戶通信清單、數據業(yè)務數據以與營銷活動數據,通過Logistic回歸模型,使用SAS/EM工具建立用戶營銷活動響應度模型,計算2008年7月份該地區(qū)某電信運營商所有通信用戶對營銷活動的響應概率,并作為"關鍵聯(lián)系入"的指標之一。具體步驟如下:15集團內被叫通話時長短消息條數彩信條數夢網消息條數彩鈴開通情況GPRS開通情況wAP使用時長139開通情況是否無線音樂高級會員手機報紙殲通情況數據業(yè)務變量移動飛信開通情況天氣預報開通情況來電提醒開通情況國際一卡多號XX數碼通副號國際一卡多號XX萬眾副號手機投注開通情況套餐資費提醒開通情況語音信箱開通情況XIO實際值〔分鐘〕實際值實際值實際值開通=1,未開通=0開通=1,未開通=0實際值〔分鐘〕開通=1,未開通=0是=1,否=0開通=1,未開通=0開通=1,未開通=0開通=1,未開通=0開通=1,未開通=0是=1,否=0是=1,否=0開通=1,未開通=0開通=1,未開通=O開通=1,未開通=0工llx12X13工14X15工16X17工10X19Z20工2lX22X23X24X2SZ26X27〔3〕模型構建使用SAS數據挖掘工具EnterpriseMmer,以指標"是否響應"作為因變量,其它27個指標作為自變量,分別對三個品牌A、B、C建立Logistic回歸模型,整個模型如圖所示:17l|lii圓國f。魚l越奎ij‘li_}i。}限:|7。|蓄l|I||i睢j因言"副‘圈2-5數據挖掘模型圈ll結點A_MODEL是A品牌模型的輸入數據集,在此之前已經對缺失值、邊界值、不規(guī)則分布等進行處理,并按照上述的樣本選取標準建立的.包括2195個樣本,28個變量,將營銷活動響應的概率作為日標變量,取響應為1,未響應,’一1.50l—1.6415?勺一o.t'uZ,JIo+U.u2u,’2+u?u厶,而3+u?l,yl丑s屹2丁‘幣石函面知而瓦麗面瓦瓦函面而;面l+P—l?50l一1-"15卻一o?0025札+0?020缸12+o?023^3+o?1591ch15結點得分根據相應模型的規(guī)則對打分數據集進行打分,本文將2008年7月份所有通信用戶作為打分數據集,根據上述的表達式分品牌計算用戶在2008年7月份的營銷活動響應概率,并將此作為"關鍵聯(lián)系人"的指標之一。2.3搿關鍵聯(lián)系人弦檢索模型根據定義,前文確定了"關鍵聯(lián)系人"的6個判定指標,為了計算這些指標的權重,本文使用定性和定量結合的方法——層次分析法[161,但層次分析法具有判斷矩陣構造主觀性強和一致性不易檢驗等缺點,因此本文在層次分析法中引入非結構性決策模糊集分析單元系統(tǒng)理論,這種理論可改進層次分析法的缺點,同時將兩種方法結合起來又避免了非結構性決策模糊集分析單元系統(tǒng)理論中計算總相對優(yōu)屬度時利用模糊識別或模糊優(yōu)選模型的復雜運算,這種改進的方法稱為模糊層次分析法[17]。本文使用這種方法來計算指標權重,確定"活躍度"的計算表達式,并生成"關鍵聯(lián)系人"。2.3.1層次分析法決策是人們在生活、生產與科學實踐中常需要做出選擇或判斷的一種思維活動。非結構性決策變量無法量化,只能作定性分析,因而在決策時存在一系列的技術難題。在處理這類問題時常采用層次分析法〔AHP〕。層次分析法是美國運籌學家,匹茲堡大學的A.L.Saaty教授于20世紀70年代提出的一種定性分析和定量分析相結合的系統(tǒng)分析方法。層次分析法通過明確問題,建立層次分析結構模型,構造判斷矩陣,層次單排序和層次總排序五個步驟計算各層次構成要素對于總目標的組合權重,從而得出不同可行方案的綜合評價值,為選擇最優(yōu)方案提供依據?!玻薄辰哟谓Y構模型。在深入分析實際問題的基礎上,將有關的各個因素按照不同屬性自上而下地分解成若干層次,同一層的諸因素從屬于上一層的因2I童薹簍菱萋?主薹萋薹耋謄霎妻薹霉囊囊吲曩冀萋薹薹;鋈:耋耄霎薹霎鬟薹蓁蔞窶薹囊5霎≤8襄霎霎耋萎霪羹薹羹。羹雩萋蓍霎塞薹霎羹善蓁囊薹萋|!耄耋薹囊薹鬟薹羹囊藿妻萋囊鍪鏨霧羹蠢譬耋耋鬟囊簍冀;薹萎圳建耄霎以塞季垂一囊蓁薹奏莖蔞8鴦莖藿蔞。j霎薹萎磊霎荔鍪羹2羹攀2藿妻薹攀蓁鎏,婺薹;薹萋j囊簍霾萋羹!霎差’薹薹霉窆囊蠶薹羹薹妻囊磐鰱??;囊霎霾’攀薹1莖羹冀萎薹鍪萋j簍薹羹霪;薹鍪囊蠢;霎霎囊鋈輦萎薹璧蠹,霎委耄萋萋薹囊囊薹簍藿薹蓁蠶il一?}薹囊霪荔曉囊。輦堂;驀囂薹鬢善囊囊薹霧豪鬟蓍耋霎蓁孽鍪墓琴萎萎鬟,囊薹墓冀塑蓁妻霎薹簍莖囊;羹薹冀墓羹藿薹?冀蓁嘉些盞窶羹耋!冀羹薹冀羹霪鬻薹妻.荔萋蓁霎圣垂嘉蓁羹萋?萋嬖薹:薹簍蓁霧塑磊耋羹霧萋:妻藿要霎萎耋霹霉霎冀囊鬟霎薹輦蕃奏羹薹需壘霉j霧霎耋羹霧鬈i薹~雩霉再薹羹霎囊薹羹和霉霧n喜譬蓁攀墓璧:萎薹蓬蠢蠹薹垂霧。臼E羹鬟蓁囊萋薹,霎萋藿囊矍薹!萋翼翦i暖掣篡爹各;;醚隧∞鞠蠛滏焉霧季崩酗吲亨摯j邑鎣嚆簍=喜蔞蓁差翰融圳李睡=≯鰱剮雨囊夼謗焉黿性鎏孽霉粕看茸輔馨羈稀。燮痿鬈全兩示表塞嵩簽;瓤弱引妻景替餌薄霞臣4;融答霧薹8簍妻霞一誓丞旨鼎羹鐾嚏坦蠢蒴萜醴疆j蠼翼毳墓爵萎簍謦益茬霎磊羹謇|霧墼羹黿。爹薯鑭辱;霧羹薹囊薹萋耋冀薹蓁型:季奏奏冀薹鍪戮霧乏唾撐靼=豳薹囊萎萋蓁奏:妻霪莖簍羹蠹。薹鏨萋輦3霎囊蔓蠢羹鋈摹。鬟薹鍪萋妻簦委羹囊羹薹羹萋址耄;霎鬟羹薹萋薹耄卅囊霎蓁薹i蓁霎薹囊墓耋蓁;囊簍?萋妻墓菱簍萋鍪羹妻;薹羹冀冀耋妻霎蠹;簍一季薹璧莖蓁鋈薹霎簍薹鋈耋薹一墓。耋蓬萋霎÷鍪薹蠢要螽薹妻縫霧薹霧望霪萋一蓁囊簍藿妻薹冀=妻霧萋萋羹鬟羹塹冀;冀霎莖霎j蠶霧餮一垂:囊莖蓁薹萎二薹薹莖耋蠢一薹攀奏奏蓁霎襄萎:霧一簍羹耋霾霪羹薛曼薹:薹奏囊鐾囊霎薹窶囊婁菱霧墓一。蓁f越多,A的非一致性程度也就越嚴重,k對應的標準化特征向量也就越不能真實地反映出X=扛.,x:,…,x。}在對因素z的影響中所占的比重。因此,對決策者提供的判斷矩陣有必要作一次一致性檢驗,以決定是否能接受它。對判斷矩陣的一致性檢驗的步驟如下:①計算一致性指標a:C/:蘭型二!刀一l②查找相應的平均隨機一致性指標肼。對療=I,.--,9,Saaty給出了尉的值,如下表所示:表2-7平均隨機一致性指標R/,zl23456789R/0OO.580.901.121.241.321.411.45礎的值是這樣得到的,用隨機方法構造500個樣本矩陣:隨機地從1,--.9與其倒數中抽取數字構造正互反矩陣,求得最大特征根的平均值旯二艤,并定義:盯:查釜二竺刀一1③計算一致性比例CR:衄:垡Ri當CR<O.10時,認為判斷矩陣的一致性是可以接受的,否則應對判斷矩陣作適當修正?!玻础硨哟慰偱判蚺c一致性檢驗。上面我們得到的是一組元素對其上一層中某元素的權重向量。我們最終要得到各元素,特別是最低層中各方案對于目標的排序權重,從而進行方案選擇,總排序權重要自上而下地將單準則下的權重進行合成。對層次總排序也需作一致性檢驗,檢驗仍象層次總排序那樣由高層到低層逐層進行。這是因為雖然各層次均已經過層次單排序的一致性檢驗,各成對比較判斷矩陣都已具有較為滿意的一致性。但當綜合考察時,各層次的非一致性仍有可能積累起來,引起最終分析結果較嚴重的非一致性。設曰層中與彳,相關的因素的成對比較判斷矩陣在單排序中經一致性檢驗,〔2〕求行和‘2善乃,并利用轉換公式勺2等+0.5將模糊判斷矩陣,=〔?!称龈脑鞛槟:恢滦耘袛嗑仃嚕遥健采住场?模糊一致性矩陣滿足一致性條件,無需再進行一致性檢驗。〔3〕利用行和歸一法得到排序向量∥〔。〕:〔川,…,%〕r=〔_},…,{L〕r?!啤?=l∑‘f=l〔4〕利用轉換公式P;,:皇將互補型判斷矩陣R:〔0〕蝴變?yōu)榛シ葱途仃嚕颍椋椋牛剑汛颉场??!玻怠骋耘判蛳蛄啃巍铩鳛樘卣髦捣ǖ牡踔担?進一步求精度較高的排序向量形〔n,即:①以%=%〔1,…v∽…,’,。?!常驗榈踔?利用迭代公式圪+。=E圪求特征向量圪+,,并求圪+。的無窮X數ll%+。憶。②判斷:若…圪+,憶一II圪叫<s,則l|圪+。憶即為最大特征值旯一,將圪+-進行歸一化處理后,圪+。=1-.一,■■一,…,●■一1,七+l,I1,盤+l,21,七+l,"所得向量∥‘七’=圪+l即為∑‰小∑VM,,f=1f=l∑V川,,i=l方案排序向量,迭代結束。…峨盤=船,最,…,揣卜…,再次迭代。‘下面舉一計算實例說明:O.5010.500ll0.50l1l0.5.優(yōu)先判斷矩陣F=00,行和1=3.5,吃=2.5,吩=1.5,■=O.5,0.500O.3750.6250.500O.3750.250O.7500.625O.5000.3750.875O.750O.625O.500則模糊一致性判斷矩陣為R=〔%〕~=0.2500.125,利用行和歸一法求得排序向量為礦‘o’=〔O.4375,O.3125,0。1875,O.0625〕r,互反型判斷矩陣1.OOOOO.60001.66671.00000.6000033333.00001.66671.0000O.60007.OOOO3.00001.66671.0000E=〔Pl,〕腳=0.33330.1429,以行和歸一法求得的排序向量形〔o’作為特征值法的迭代初值,迭代3次求得排序向量∥〔5〕=〔O.4952,0.2670,O.1541,O.0837〕r計算精度在O.OOOl,可以驗證計算結果與實際情況較相吻合。改進的模糊層次分析法其優(yōu)點在于:三標度法屬互補型標度,符合人們的思維邏輯,其形式簡單,由其度量各元素之間的比較關系;就其質而言,不存在度量不準確的可能性,建立的優(yōu)先判斷矩陣雖然粗糙,但極易建立;由優(yōu)先判斷矩陣改造而成的模糊一致性矩陣滿足一致性條件,無需再進行一致性檢驗。若把由方根法或行和歸一法求得的目標權重∥‘o’=〔Ⅵ,…,%〕,作為特征值法的迭代初值虼=%〔%。,‰,…,%。〕7’,則可大大減少迭代次數,提高收斂速度,同時又可以滿足計算精度要求[19]。2.3.3搿活躍度刀計算"關鍵聯(lián)系人’’是指那些高活躍人群,這些人群在其網絡中的短信使用頻繁、聯(lián)系人較多、具有高響應概率、通話頻繁、以與具有一定—6時U值。根據上述商業(yè)定義,我們將"關鍵聯(lián)系人"6個指標的線性組合從數學上定義為"活躍度",即"活躍度"=廠〔營銷活動響應度,~度社交圈人數,語音通話次數,短信收發(fā)次數,彩信收發(fā)次數,觸心U值〕,廠函數是這6個指標的一個線性組合。由于現(xiàn)有營銷數據中沒有代表活躍度的指標,因此難以進行建模來確定指標的權重,這里采用改進的模糊層次分析法CFAt-IP〕來確定各指標的權重。對"關鍵聯(lián)系人’’的6個指標,設語音通話次數為五,短信收發(fā)次數為彳:,彩信收發(fā)次數為也,一度社交圈人數為丘,營銷活動響應度為X,,剮姆U值為瓦。結合商業(yè)需求,我們確定了三個品牌在模糊層次分析法上的比較矩陣,分別為:表2-8A品牌的比較矩陣?A品牌五五O.511置O0.5l置0X‘l1五l托l五墨XtOO.5llOllO.5lOOOOOO0,5IXsO.5lX6OOOO.50O.5表2_9B品牌的比較矩陣;iB品膊五O.50五lO.5五lOx‘Oxs0Xbl墨五墨xl0OOO1Ol1IO.5lOO,5OO。5llXsl0lllOlO五0O.5表2-10C品牌的比較矩陣ic晶牌,。XIO.50置l0.5X,IlxO0LXsO五l五tX3XA0OlOOlOlO.5lOO.5O&5llXslOlOlll0xb0O.5根據模糊層次分析法的計算原理,可以求出三個品牌對應的6個指標的權重,結果如下:表2_11三個品牌的指標權重≯oi≥,權重。置A品牌O.16l0.235B品牌O.1590.048C晶牌0.159五五XAO.11003690.062O.1100.234O.0480.234五x6O."2O.373O.3730.075O.0620.075由于6個指標的量綱不一致,因此對其進行標準化,標準化公式=1000×〔指標值.指標最小值〕/〔指標最大值等旨標最小值〕。設6個指標標準化后的變量分別為膏l、叉:、牙,、又。、牙,、j。,由此可以分模型、分品牌構建"活躍度"的得分表達式,然后將得分按品牌進行排序,再根據商業(yè)上的需要選取一定比例的高活躍度用戶作為"關鍵聯(lián)系人"進行精確營銷,得分表達式如下:ScoreA=0.161Xl+0.235X2+0.369X3+0.062X4+O.112墨-I-0.062X6ScoreB=0.159Xl+0.048X2+0.1IOX3+0.234X4+0.373X5+0.075X6ScoreC=O.159Xl-I-0.11Oj,2+0.048X3+0.234X4+O.373X5-t-0.075X6第三章通信社會關系網絡的構建3.1構建流程六度空間理論是指社會關系網絡中的任意兩個節(jié)點,他們之間至少存在著一條度小于等于6的關聯(lián)路徑。該理論已經得到眾多實驗的驗證,包括微軟最近進行的一項調查研究,通過對2006年6月間1.8億人的300多億次即時對話進行了深入分析,這些信息占當時全部即時消息流量的一半左右,得出了這個星球上任意兩個人互相聯(lián)系的橋梁平均需要通過6.6個人的結論,也再次驗證了六度空間理論的正確性。由于通信社會關系網絡擁有完整社會關系網絡的幾乎所有性質,并且其數據規(guī)模的適中性,通信用戶之間的通信關系的可靠性以與通信數據的完整性,使得通信社會關系網絡更加適合于挖掘。因此,本章通過設計關聯(lián)路徑和最短路徑檢索算法,來構建前一章"關鍵聯(lián)系人"的通信社會關系網絡,該網絡主要包括通信用戶的"六度空間’’,即其朋友圈,以與用戶和用戶之間的通信路徑等,并通過界面開發(fā)將其通信社會關系網絡以Flash的界面形式展現(xiàn)出來,從而為該地區(qū)電信運營商的社會網絡分析提供數據基礎。本章通信社會關系網絡的構建流程主要包括:〔1〕匯總上述"關鍵聯(lián)系人"在2008年7月份的通信記錄清單數據,構建這些人群的l度空間數據,即1度朋友圈。〔2〕使用關聯(lián)路徑檢索算法,逐級構建2度至6度的通信路徑匯總數據,構建過程中,對于已經存在于低度空間中的路徑進行遞歸去重運算?!玻场硨⒁陨希敝粒抖鹊目臻g數據存儲于六度空間的數據存儲表中,并對該表中的通信主體字段加索引。〔4〕搜索兩個用戶〔如A,B用戶〕之間的最短路徑,以A〔或者B〕用戶作為通信主體,從六度空間的數據存儲表中過濾出該用戶的6度通信路徑數據,生成臨時數據表,然后使用最短路徑搜索算法,即SAS軟件運籌〔OR〕模塊的最短路徑計算過程〔NETFLOW過程〕,計算出A,B用戶間的最短距離和29〔4〕當所=門時,以=4一。并上滿足&。,=&-l':的4集合,然后遞歸去除么。=峨'i’s。,2]脹2中可能存在于么等,〔厶一2圓彳辨_I〕刪,……,〔4固…以一:@以一?!尺蟮穆窂浇M合。令D砌〔度〕=刀,將4存入六度空間的數據存儲表。通過以上的關聯(lián)路徑遞歸檢索可以得到一X用以存儲用戶通信關聯(lián)路徑的六度空間數據存儲表,如下所示:表3-l六度空間數據存儲表;手機號AA度ll起始AA結束CD總通話時長2000900通話頻數3020短信頻數5040彩信頻數"3010A22CDB800700202040402020AAAHXY33BH900600305020501030BlBX900800302020401020BlBC3.2.2最短路徑搜索算法最短路徑是最優(yōu)化重要問題之一,它不僅直接應用于解決生產實踐中的許多問題,如管道的鋪設、線路的安排、廠區(qū)的選址和布局、設備的更新等,而且也經常被作為一種基本工具,用于解決其他的最優(yōu)化問題和預測、決策問題。這種制約網絡問題都能夠使用SAS軟件運籌〔OR〕模塊的NETFLOW過程解決,該過程可以接受某種指定的網絡規(guī)格,也可以解決大部分線性規(guī)劃問題;單純形法算法雖然是求解線性規(guī)劃問題的有效方法,但是Ⅺee和Mny構造的例子證實了單純形算法不是多項式算法,因此NETFLOW過程使用了內點算法來解決網絡問題和線性規(guī)劃問題。本文在研究用戶之間的通信關系時設計的最短路徑搜索算法正是基于SAS軟件運籌〔OR〕模塊的NETFLOW運算過程,實現(xiàn)了包括DiikStra,Pr硫a1.Dual內點算法等圖論計算算法,具有精確,高效,適于處理大型數據矩陣的特性。在大量的求解最短路徑算法中,Dijkstra算法是一種最經典的算法,傳統(tǒng)的算法時間復雜度為0〔Ⅳ2〕,許多算法都是在此算法的基礎上改進發(fā)展而來的。D弘stra算法的基本思想是:以屹為起點,從圖中找出與其距離最短的頂點。假設該點為K,然后再以杉作為參照點,從余下的頂點中找出與其距離最短的頂點,依次類推,直到所有的頂點都對比完為止,至此,以到各頂點的最短距離就已經求出來了。至于具體的最短路徑,常用的方法是"反向追蹤法"。即從終點出發(fā),"順藤摸瓜"找到最短距離上的各個點,按照有向圖的方向,就可以得到最短路徑[211。近十幾年來內點算法已經成為數學規(guī)劃中非?;钴S的研究方向,其收斂性和計算速度均優(yōu)于單純形算法,并已形成勢函數投影、仿射尺度和路徑跟蹤法三大類內點算法。其中仿射尺度算法使用簡單的仿射變換替代了勛111a咄ar原來的投影變換,從而使人們可以直接解一般形式的線性規(guī)劃問題,K踟narkar算法對單純形結構的特殊要求被放松了。仿射尺度算法的的基本思想是:每步迭代先作仿射尺度變換,然后使用最速下降步驟。它分為原仿射尺度算法,對偶仿射尺度算法和原始.對偶仿射尺度算法三類。其中原始.對偶仿射尺度算法在初始點和迭代步長選取適當時,可證明為多項式算法。在原仿射尺度算法中尺度矩陣為X,而在對偶仿射尺度算法中尺度矩陣為Z,在此算法中尺度矩陣既不取x也不?。?而是?。模健玻冢痹Ox‘,X〕m。原始一對偶仿射尺度算法的基本框架如下[22]:〔y。,z‘〕分別為原問題和對偶問題的內點可行解,令x〕¨2,對線性規(guī)劃〔三P〕x=旃昭@?,…,x:〕,z=西昭@?,…,x:〕,D=〔z_1作D.仿射尺度變換,變?yōu)椋恚椋睿穑颍椋捎剑?i≥o},其中萬=眈,彳=么D,i=D-1x。仿照原仿射尺度算法取下降方向:血=D[,一刪r〔4D247’〕_1彳D]眈,仿照對偶仿射尺度算法取下降方向:緲=一〔彳D24r〕-16,止=么r〔么D2么r〕-16,令x七+1=x‘一a血,J,M=y七一a妙,z¨=z‘一a△Z,其中O<a<1。完成一次迭代,此算法由于在每次迭代中始終保持x‘的原可行性,〔y。,z七〕的對偶可行性,32并通過適當選取步長口使對偶問隙有固定比例的縮減,從而導致一個多項式算法。基于以上圖論算法,結合NETFLOW過程,我們設計如下算法:〔1〕設Ⅳ表示該地區(qū)某電信運營商的總數,A,=〔a〔i,J,1〕〕Ⅳx^r為1次關聯(lián)矩陣,當S。與Sj有通訊聯(lián)系時,a〔i,J,1〕=1,否則該元素取為+00。令A。=〔口〔,,J,m〕〕ⅣxⅣ是m次聯(lián)系矩陣,其元素口〔f,/,聊〕=min{a〔i,k,1〕+口〔后,J,m一1I1≤k≤N,k≠f,k≠/〕〕。該元素的意義為:若S,能夠通過擾次聯(lián)系與S』關聯(lián),則元素的取值為m,否則取值為+oo。設,z〔f,/〕=.m,ina〔i,J,m〕表示S,到S,的最小關聯(lián)次數,即S,最少要通過多少次聯(lián)系lS塒S∞。關聯(lián)到S/。我們將問題描述為,對任意兩個S,與S/,若咒〔f,J〕=.m…ina〔i,J,掰〕<佃,則給出由S,到達S,的最短路徑。ISmSO。〔2〕對S。,給出其~度關聯(lián)集合,即與S,有直接聯(lián)系的集合B?!玻妗?若J∈B?!玻妗?貝0,z〔f,J〕=1,否貝0,若日〔f〕n罵〔/〕≠驢,貝U,z〔i,J〕=2?!玻场硨担臁玻妗持械脑?再分別求一度關聯(lián)集合,可以記成B:〔f〕,若B1〔i〕nBl〔/〕=妒,B2〔f〕n且〔/〕≠妒,則,z〔f,J〕=3,否則,若B2〔f〕r、Bl〔/〕=妒,B2〔f〕廠、吃〔/〕≠驢,貝.1Jn〔i,/〕=4?!玻础愁愃瓶梢越o出色〔f〕,若芝〔f〕n吃〔/〕=≯,B3〔f〕廣、B2〔歹〕≠≯,則,z〔f,J〕=5,否則,若色〔f〕r、B:〔/〕=妒,B3〔f〕n馬〔/〕≠驢,則,z〔f√〕=6,若B〔f〕n色〔/〕=≯,貝,lJn〔i,J〕≥6,關聯(lián)失敗?!玻怠匙詈髮⒘瓤臻g數據存儲表與其生成的臨時數據表作為源數據輸入SAS軟件運籌模塊的NETFLOW過程,將需要查詢的起始,結束作為參數輸入以上NETFLOW計算過程,并設置NETFLOW計算過程的輸出結果。運行以上計算過程,輸出結果中即包含起始與結束之間的最短路徑長度,以與最短路徑上經過的節(jié)點〔如果兩個存在聯(lián)系〕。由于對所有的S。,給出集合局〔f〕,其存貯量可能非常巨大,總的可zH匕1.-,達到1000G到10000G級別,因此存貯資源的限制使得我們只能統(tǒng)計三度以內的關聯(lián)。3.3Flex技術開發(fā)為求將構建的通信社會關系網絡直觀地展現(xiàn)出來,本文考慮到Flex技術具有更好的網絡交互能力,更加絢麗的表現(xiàn)效果,同時在企業(yè)級的擴展上也游刃有余,并且對軟件開發(fā)人員的要求并不苛刻,用相對簡單的代碼就可以完成絢麗高效的Flex應用程序等特點,因此本文基于多層模式的體系結構,采用Flex技術來構建通信社會關系網絡的前端展現(xiàn)。Intemet已經是我們生活的一部分,而"看網頁"可以說是網絡瀏覽者與Intemet最簡單的溝通方式。打開瀏覽器,進入~個瀏覽,這就是瀏覽者們看到的最直觀的Imenlet的外表。盡管頁面上不是單一的文字,但也僅僅是"頁"。然而如今這些傳統(tǒng)的呆板的"頁"已經不再能滿足網絡瀏覽者的要求了。多媒體、多元化的信息表現(xiàn)在一個頁面上,的確很是單薄。另一方面,開發(fā)人員也一直在為過分依賴于頁面刷新、請求響應等諸多傳統(tǒng)網頁開發(fā)技術固有的問題而煩惱。當然我們不能忽略B/s架構能夠取代C/S長期大行其道有一個重要的因素,就是網絡帶寬問題。傳統(tǒng)網頁內容簡單,節(jié)省網絡帶寬的優(yōu)勢是與生俱來的,而如今網絡技術在不斷地發(fā)展,軟硬件發(fā)展又達到了一個并駕齊驅的時期,軟件系統(tǒng)已經不需要等待硬件的發(fā)展而發(fā)展。有了強烈的需求,又有了充足的硬件基礎,新技術應運而生,對A的出現(xiàn)給網絡瀏覽者和開發(fā)人員都帶來了全新的體驗[23]。砒A是RichIntemetApplications的縮寫,翻譯成中文為豐富互聯(lián)網應用程序,豐富互聯(lián)網應用程序是將桌面應用程序的交互的用戶體驗與傳統(tǒng)的Wreb應用的部署靈活性結合起來的網絡應用程序。ⅪA是集桌面應用程序的最佳用戶界面功能與W曲應用程序的普遍采用和快速、低成本布署以與互動多媒體通信的實時快捷于一體的新一代網絡應用程序。ⅪA中的礎chCIient〔豐富客戶端〕提供可承載己編譯客戶端應用程序〔以文件形式,用HTTP傳遞〕的運行環(huán)境,客戶端應用程序使用異步客戶/服務器架構連接現(xiàn)有的后端應用服務器,這是一種安全、可升級、具有良好適應性的新的面向服務模型,這種模型由采用的Wreb服34第四章通信社會關系網絡的應用過通并,掘挖行進點節(jié)鍵關的高較度躍活中絡網對術技據數用使文前關聯(lián)路徑和最短路徑算法構建了這些關鍵節(jié)點的通信社會關系網絡。利用這些關鍵節(jié)點在其網絡中的影響力,并結合其網絡屬性,我們對其實施口碑式營銷,通過它向它的朋友圈進行產品推廣,轉變傳統(tǒng)的運營商直接對用戶的營銷模式,體現(xiàn)出六度空間理論在商業(yè)應用上的價值。4.1應用方向分析隨著3G〔第三代移動通信〕時代的到來,對于消費者而言,手機可以集眾料.推動新型建材廠的發(fā)展:也可從中多功能于一身,視頻通話、收看電視、下載音樂、在線游戲、實時導航、網上購土的摻合分選漂珠、微珠、鐵精粉、碳、鋁等有用物、手機錢包等等使其更像一個網絡終端,其功能不再是"打"那么簡單。物質。此外.煤矸石還可用于造氣、回通信商完全可以突破原則只是滿足真實耋蓬霧霧蠢萋萋羹羹萋i薹囊霧薹蓁萎羹收伴生礦產資源、生產各種化工產品、建筑材料和復XX料等.煤層氣主要是瓦斯氣。瓦斯的溫室效應是CO,的21倍.直接排放會嚴重污染環(huán)境。然而.瓦斯又是一種潔凈霪熏霾鬟霎霧囂羹霪蠶。羹霎蓉冀羹囊瑟霎萋羹登塑毳可用作水泥、砂漿、混凝能源.純瓦斯的熱值大于33000千焦,立方米.與常規(guī)天然氣相當.每1000立方米瓦斯就相當于1噸原油.具有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論