版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
社交網(wǎng)絡(luò)中智慧搜索的研究綜述,搜索引擎論文在線社交網(wǎng)絡(luò)是一種在信息網(wǎng)絡(luò)上由社會(huì)個(gè)體集合及個(gè)體之間的連接關(guān)系構(gòu)成的社會(huì)性構(gòu)造。在線社交網(wǎng)絡(luò)可分為4類:1〕即時(shí)消息類應(yīng)用,是一種提供在線實(shí)時(shí)通信的平臺,如QQ、微信等;2〕在線社交類應(yīng)用,是一種提供在線社交關(guān)系的平臺,如Facebook、人人網(wǎng)等;3〕微博類應(yīng)用,是一種提供雙向發(fā)布短信息的平臺,如Twitter、新浪微博等;4〕分享空間等其他類應(yīng)用,是其他能夠互相溝通但結(jié)合不嚴(yán)密的Web2.0應(yīng)用,如論壇、博客等。當(dāng)下,在線社交網(wǎng)絡(luò)應(yīng)用正處在蓬勃發(fā)展期,F(xiàn)acebook已擁有超過14億的用戶,成為第一大人口國,新浪微博用戶數(shù)已到達(dá)5.36億,騰訊微博用戶數(shù)已到達(dá)5.7億。在線社交網(wǎng)絡(luò)應(yīng)用正深入地影響著人們生活的各個(gè)方面。在線社交網(wǎng)絡(luò)數(shù)據(jù)具有豐富價(jià)值,并蘊(yùn)含著大量智慧。主要具體表現(xiàn)出在:1〕蘊(yùn)含了大量用戶情感、立場和觀點(diǎn),進(jìn)而可開掘人類的思想和行為;2〕包含了各類具有時(shí)空特性的話題、事件信息,進(jìn)而可對它們的起源、傳播和發(fā)展規(guī)律進(jìn)行揭示和挖掘;3〕記錄了用戶和話題間豐富的關(guān)系數(shù)據(jù),進(jìn)而可發(fā)現(xiàn)朋友關(guān)系、社交圈子、用戶與話題、話題與話題等之間關(guān)系;4〕充滿了針對專業(yè)問題的豐富討論,進(jìn)而可會(huì)聚群體智慧,服務(wù)于人們的工作和生活。傳統(tǒng)的搜索引擎技術(shù),主要是面向Web1.0靜態(tài)網(wǎng)頁,是基于本文關(guān)鍵詞語的存在性搜索,不能支持面向Web2.0/3.0應(yīng)用,具有5V特性的大數(shù)據(jù),及其知足用戶需求智慧解答的搜索。因而不能開掘豐富的在線社交網(wǎng)絡(luò)智慧,且服務(wù)于用戶。本文研究在線社交網(wǎng)絡(luò)智慧搜索技術(shù),定義如下。在線社交網(wǎng)絡(luò)智慧搜索是在正確理解用戶意圖的基礎(chǔ)上,基于社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行加工、推演處理開掘知識,進(jìn)而給出智慧解答。在線社交網(wǎng)絡(luò)大搜索具有4S特點(diǎn):1〕意圖感悟〔sensingthecontext〕,結(jié)合用戶請求的上下文、時(shí)空特性、場景感悟等方式,支持在語義級別上對用戶搜索意圖進(jìn)行準(zhǔn)確理解;2〕多源綜合〔synthesisfrommultiplechannels〕,綜合、關(guān)聯(lián)多通道、多來源〔不同社交網(wǎng)絡(luò)〕的社交網(wǎng)絡(luò)數(shù)據(jù)和信息,進(jìn)行統(tǒng)一的知識開掘和推演;3〕安全可信〔securityprivacyandtrust〕,在線社交網(wǎng)絡(luò)搜索結(jié)果的安全可信的,并且支持隱私保衛(wèi);4〕智慧解答〔intelligentsolution〕,搜索的結(jié)果是基于在線社交網(wǎng)絡(luò)數(shù)據(jù)和信息,經(jīng)過開掘、推理和計(jì)算而得到的一組有序智慧解答。2相關(guān)工作在線社交網(wǎng)絡(luò)智慧搜索牽涉的相關(guān)理論和技術(shù)包括:搜索引擎技術(shù)、在線社交網(wǎng)絡(luò)分析、復(fù)雜對象關(guān)系建模、意圖理解與匹配及知識構(gòu)建與推演等。當(dāng)下的搜索引擎技術(shù)主要包括互聯(lián)網(wǎng)搜索引擎和在線社交網(wǎng)絡(luò)搜索。主要的互聯(lián)網(wǎng)搜索引擎包括全文搜索、元搜索引擎和垂直搜索引擎等。在互聯(lián)網(wǎng)搜索引擎中,為優(yōu)化搜索結(jié)果,通常采用倒排索引技術(shù)對網(wǎng)頁信息進(jìn)行索引,并采用排序算法對搜索結(jié)果進(jìn)行等級排名,典型的算法包括PageRank[1]和HITS[2]等;為提高搜索結(jié)果的關(guān)聯(lián)性,Google、百度、搜狗等引入知識圖譜技術(shù);為實(shí)現(xiàn)搜索信息的高效存儲管理,各互聯(lián)網(wǎng)廠商紛紛提出了解決方案,如Google的Bigtable[3],Amazon的Dynamo[4]、Yahoo的PNUTS[5]等。在在線社交網(wǎng)絡(luò)搜索方面,360推出的我的搜索,引入微博、微信等社交因素的影響,并在搜索結(jié)果中進(jìn)行展示。Facebook推出的社會(huì)搜索引擎GraphSearch,用戶可在社交網(wǎng)絡(luò)中對好友、照片、地點(diǎn)等進(jìn)行搜索。微軟推出的人立方關(guān)系搜索,自動(dòng)地計(jì)算每一個(gè)人名與本文關(guān)鍵詞語的距離,并可展示人的社會(huì)化關(guān)系。在線社交網(wǎng)絡(luò)分析為社交網(wǎng)絡(luò)中知識的獲取和推演提供了相應(yīng)的方式方法。主要的社交網(wǎng)絡(luò)分析包括話題發(fā)現(xiàn)與演化、虛擬社區(qū)發(fā)現(xiàn)與演化、信息傳播以及影響力分析等。話題發(fā)現(xiàn)與演化能有效支撐網(wǎng)絡(luò)時(shí)代的信息決策。代表性工作包括:Blei[6]提出的隱含狄利克雷分布的LDA模型、Lin等[7]提出的潛在擴(kuò)散途徑方式方法、美國馬里蘭大學(xué)研究的詞項(xiàng)間共現(xiàn)頻率反映語義關(guān)聯(lián)原理的方式方法[8].虛擬社區(qū)發(fā)現(xiàn)與演化有助于發(fā)現(xiàn)社交網(wǎng)絡(luò)中的拓?fù)錁?gòu)造信息。代表性工作包括:Newman等[9]提出的模塊性方式方法、Chakrabarti等[10]提出的社區(qū)演化模型、Mucha等[11]提出的多層網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)、Tang等[12]研究的多模態(tài)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)等。社交信息傳播機(jī)制有助于對社會(huì)網(wǎng)絡(luò)的認(rèn)識。代表性工作包括:Gruhl等[13]基于SIRS傳染病模型、Han等提出的高斯條件隨機(jī)場模型、Antulov-Fantulin等[14]提出的統(tǒng)計(jì)推理框架溯源方式方法。影響力分析能發(fā)現(xiàn)社交網(wǎng)絡(luò)中高影響力用戶和影響強(qiáng)度。代表性工作包括:Ellison等[15]研究了在線社交關(guān)系對現(xiàn)實(shí)社交關(guān)系的群體互動(dòng)影響;Woolley等[16]分析了心理因素、認(rèn)知空間對群體聚集的影響;Wen等[17]根據(jù)關(guān)注網(wǎng)絡(luò)和用戶興趣類似性計(jì)算個(gè)體在每個(gè)話題上的影響力;Romero等[18]綜合考慮了影響力與冷漠性,提出了類HITS的算法。對象關(guān)系模型是構(gòu)建在線社交網(wǎng)絡(luò)搜索知識倉庫的基礎(chǔ)。當(dāng)下復(fù)雜對象關(guān)系的建模通常用圖構(gòu)造來表示,常用圖模型包括PropertyGraph[19]、RDF[20]、MultiGraph模型[21]等。PropertyGraph在節(jié)點(diǎn)和邊上能夠存在任意數(shù)量的鍵值對表示屬性或標(biāo)簽,因此其表示出能力很強(qiáng)。RDF用三元組SPO〔subject,property,object〕來描繪敘述實(shí)體之間的關(guān)系,是當(dāng)下表示實(shí)體以及其關(guān)系的一種常見形式。MultiGraph模型可在2個(gè)實(shí)體之間保存多條邊以表示多種關(guān)系。近來年,很多研究將時(shí)空信息融入到復(fù)雜對象關(guān)系的建模中。微軟亞洲研究院分別從用戶、地理位置和事件3個(gè)層面對基于位置的地理社交網(wǎng)絡(luò)進(jìn)行了研究,發(fā)現(xiàn)單純社會(huì)網(wǎng)絡(luò)中個(gè)體之間無法表現(xiàn)的關(guān)系[22].Shekhar[23]將時(shí)空因素考慮到在線社交網(wǎng)絡(luò)數(shù)據(jù)分析中,提出一種時(shí)間聚集的圖模型。用戶意圖理解與匹配是搜索中的關(guān)鍵技術(shù)。在用戶意圖理解方面,Wolframalpha通過從公眾的和獲得受權(quán)的資源中開掘、構(gòu)建的數(shù)據(jù)庫,能夠理解用戶問題并直接給出答案:。搜狗的知立方通過引入語義理解技術(shù),試圖理解用戶的搜索意圖,對搜索結(jié)果進(jìn)行重新優(yōu)化計(jì)算。Etzioni等提出了基于規(guī)則模板抽取實(shí)體/概念之間的關(guān)系來描繪敘述和理解搜索意圖。Madhu等[24]利用語義網(wǎng)工具和技術(shù)提供分層模塊的方式方法解決搜索引擎對語義內(nèi)容的理解。在意圖匹配方面,主要包括文本模型和圖模型。基于文本模型的意圖匹配通過將以本文關(guān)鍵詞語查詢檢索的方式來把用戶的意圖進(jìn)行語義轉(zhuǎn)換和目的文檔的匹配,并獲取相關(guān)度排序?;趫D模型的意圖匹配通過圖搜索來實(shí)現(xiàn)搜索意圖與搜索空間中目的項(xiàng)的查找和匹配,主要包括[25]:本文關(guān)鍵詞語圖搜索技術(shù)、子圖匹配技術(shù)和近似圖匹配技術(shù)等。知識是實(shí)現(xiàn)智慧搜索的關(guān)鍵。當(dāng)下,知識構(gòu)建較多地從知識圖譜構(gòu)建角度加以展開,以互聯(lián)網(wǎng)網(wǎng)頁為來源的典型知識圖譜包括KnowItAll[26]、TextRunner[27]和Probase[28],以在線百科為數(shù)據(jù)來源的知識圖譜包括YAGO[29]和DBPedia[30]等。知識推演是在給定目的的情況下,在知識庫或網(wǎng)絡(luò)空間中進(jìn)行推演求解,以獲得答案:并產(chǎn)生新的知識。當(dāng)下知識推演的操作經(jīng)過包括利用統(tǒng)計(jì)、知識推理和眾包等方式方法。華而不實(shí),主要的推理方式方法包括:正向推理、逆向推理、雙向推理、非精到準(zhǔn)確推理、基于語義的推理和基于案例的推理等。上述技術(shù)的發(fā)展為在線社交網(wǎng)絡(luò)智慧搜索的研究奠定了研究基礎(chǔ),在理論、方式方法和技術(shù)方面存在眾多挑戰(zhàn),主要包括:在線社交網(wǎng)絡(luò)中智慧與知識的開掘與推演、用戶真實(shí)搜索意圖的理解與表示、知足用戶真實(shí)意圖的智慧解答在線響應(yīng)。3研究進(jìn)展及技術(shù)重點(diǎn)當(dāng)前,社交網(wǎng)絡(luò)智慧搜索與當(dāng)下的社交網(wǎng)絡(luò)搜索的區(qū)別主要具體表現(xiàn)出在智慧的能力,而智慧處理經(jīng)過是以知識圖譜為基礎(chǔ),主要研究內(nèi)容可劃分為在線社交網(wǎng)絡(luò)知識開掘與推演、知識聚合與組織管理、用戶搜索意圖理解、用戶意圖的搜索與匹配等部分,各研究點(diǎn)間交互構(gòu)成總體框架如此圖1所示。社交網(wǎng)絡(luò)知識開掘與推演。可支持對在線社交網(wǎng)絡(luò)空間中的數(shù)據(jù)獲取和推理,包括微博、博客、論壇、維基、分享網(wǎng)站等空間中采集文本、圖片、語音、視頻等各種類型的多模態(tài)數(shù)據(jù),以及各類已存在的對象知識和關(guān)系知識。數(shù)據(jù)獲取與采集經(jīng)過不間斷進(jìn)行,采集后的數(shù)據(jù)和知識是后續(xù)推理和搜索的基礎(chǔ)。知識聚合與組織管理。面向在線社交網(wǎng)絡(luò)空間的海量對象知識及關(guān)系知識進(jìn)行建模;在這里模型實(shí)例化的基礎(chǔ)上通過知識聚合,構(gòu)建知識倉庫空間,并通過索引、關(guān)聯(lián)和演算等聚合操作預(yù)先構(gòu)成知識聚合體。知識倉庫中的知識是不斷經(jīng)過二次加工的,經(jīng)過用戶的查詢、修改、反應(yīng)和自演化的經(jīng)過,逐步完善,根據(jù)應(yīng)用建立各類索引,同時(shí)知足用戶搜索時(shí)的準(zhǔn)確性需求和實(shí)時(shí)性需求。用戶搜索意圖理解。面向意圖理解的準(zhǔn)確性和歧義消除的基本需求。結(jié)合用戶的上下文和語義知識等方式方法,迅速、準(zhǔn)確地理解用戶的真實(shí)意圖,并轉(zhuǎn)變成與知識倉庫可匹配推演的表示方式。用戶意圖的搜索與匹配。基于意圖理解表示和知識倉庫,經(jīng)過匹配、推理、計(jì)算、乃至眾包等技術(shù)和方式方法的處理,構(gòu)成若干個(gè)知足用戶真正意圖的智慧綜合的解決方案,并通過結(jié)果評價(jià)排序方式給出其優(yōu)先級,為用戶提供智慧的解答方案。3.1在線社交網(wǎng)絡(luò)知識表示模型在線社交網(wǎng)絡(luò)中的對象知識具有多樣化特性,可通過文本解析、實(shí)體抽取、關(guān)系抽取、元數(shù)據(jù)分析、指代消解等技術(shù)來獲得在線社交網(wǎng)絡(luò)中的不同側(cè)面對象知識,并以特征關(guān)聯(lián)的形式對其進(jìn)行描繪敘述,建立針對個(gè)體對象的內(nèi)容語義描繪敘述模型。在線社交網(wǎng)絡(luò)中的內(nèi)在多層次、演化的關(guān)系型知識需要進(jìn)一步提取和挖掘,一般可采用支持語義關(guān)系的語義圖模型表示出;綜合對象知識和關(guān)系型知識,可借鑒當(dāng)前時(shí)態(tài)地理信息系統(tǒng)以及數(shù)據(jù)分析領(lǐng)域中的資源描繪敘述框架〔RDF〕、屬性圖〔propertygraph〕、多圖〔multi-graph〕等模型方式方法,通過模型的組合以及擴(kuò)展等方式方法,并通過整合現(xiàn)有語義庫〔包括Freebase和Probase等〕來統(tǒng)一表示語義信息。3.2在線社交網(wǎng)絡(luò)知識的開掘與推演在線社交網(wǎng)絡(luò)知識獲取與推演具有多樣化、關(guān)系復(fù)雜與演化等需求,可從個(gè)體行為及立場分析、群體社區(qū)發(fā)現(xiàn)及極化規(guī)律、話題的緣起與發(fā)展和信息傳播規(guī)律等在線社交網(wǎng)絡(luò)的角度出發(fā),進(jìn)行開掘和推演。研究主要針對社交實(shí)體的對象交互特性、時(shí)空特性、規(guī)模特性、多源特性等方面。在線社交網(wǎng)絡(luò)中的對象具有豐富的交互關(guān)系進(jìn)行推理挖掘,可采用基于時(shí)序語義圖的關(guān)聯(lián)算法。支持時(shí)空特性是社交網(wǎng)絡(luò)知識的主要特性,可基于類似性計(jì)算與多尺度空間匹配等方式方法,以及面向在線社交網(wǎng)絡(luò)的時(shí)態(tài)邏輯推理算法,利用關(guān)系傳遞和協(xié)同過濾等技術(shù),對在線社交網(wǎng)絡(luò)知識推理。在線社交網(wǎng)絡(luò)中的對象屬性具有個(gè)數(shù)規(guī)模大的特點(diǎn),可通過目的驅(qū)動(dòng)的基于屬性依靠關(guān)系的可伸縮的模態(tài)推理技術(shù),實(shí)現(xiàn)基于刻面的社交網(wǎng)絡(luò)大規(guī)模屬性推理。社交網(wǎng)絡(luò)中的知識含有大量多源異構(gòu)交互信息,可通過離線眾包推理與反應(yīng)相結(jié)合的多源知識融合方式方法,實(shí)現(xiàn)社交網(wǎng)絡(luò)交互信息的眾包推理與多專家信息的智慧解答的有機(jī)融合。3.3面向在線社交網(wǎng)絡(luò)知識聚合與組織管理開掘和推演生成的知識是粗糙、低層次的,可通過知識聚合來生成精煉、物化和泛化的知識來知足用戶搜索的需求,并構(gòu)成知識倉庫。知識預(yù)先聚合、組織并生成知識聚合體經(jīng)過應(yīng)具有效性、準(zhǔn)確性和順序性,在社交網(wǎng)絡(luò)知識表示模型基礎(chǔ)上,可參考Wikipedia/DBpedia/Freebase等多種語義概念層次,參考聯(lián)機(jī)分析處理的聚合計(jì)算機(jī)理,建立在線社交網(wǎng)絡(luò)中面向領(lǐng)域的對象知識、關(guān)系知識間的聚類方式方法,以及各概念層次間的聚合函數(shù)。在這里基礎(chǔ)上,基于特征空間的降維分解方式方法研究高維空間中各維度的可聚合性及相應(yīng)的聚合函數(shù)。華而不實(shí),對于時(shí)空屬性的聚合計(jì)算,將采用多時(shí)間粒度聚合、基于地理位置的空間聚合等方式方法,研究時(shí)空聚合計(jì)算函數(shù)和有效計(jì)算方式方法;在聚合計(jì)算的基礎(chǔ)上,采用基于時(shí)空類似度散列的知識聚合體模型表示和存儲方式方法,將時(shí)、空上類似或相近的對象和關(guān)系就近存儲并建立高效索引;在概率Skyline和概率Top-k算法框架下,可研究時(shí)變、不確定環(huán)境下的知識聚合體的動(dòng)態(tài)排序與更新演化算法。3.4用戶搜索意圖理解用戶搜索意圖主要具體表現(xiàn)出在用戶的歷史行為、場景環(huán)境、語言表示出等方面,其研究也基于各個(gè)方面的綜合感悟和理解。用戶搜索歷史行為,可根據(jù)由個(gè)體到群體,從點(diǎn)到軌跡的思路,采用頻繁形式挖掘相關(guān)技術(shù),挖掘用戶的行為形式和搜索形式,建立用戶搜索時(shí)空場景知識庫,用以辨別用戶的行為、情感、意圖、經(jīng)歷體驗(yàn)和生活形式。用戶場景環(huán)境,是用戶所處的時(shí)間上下文、空間上下文、歷史行為上下文、社交關(guān)系上下文等環(huán)境,一般采用基于內(nèi)容以及協(xié)同過濾等推薦方式方法和機(jī)器學(xué)習(xí)相結(jié)合的方式方法,加強(qiáng)用戶意圖理解的準(zhǔn)確性,并結(jié)合用戶偏好和當(dāng)下位置,根據(jù)用戶的滿意度、興趣度選擇與用戶當(dāng)下需求相關(guān)的信息,進(jìn)行空間信息的語義搜索,并建立基于語義的信息聚合模型,將個(gè)性化需求的信息進(jìn)行整合。用戶語言表示出,是用戶的自然語言文字或語音表述,在這里方面有大量研究成果??紤]搜索經(jīng)過的特殊性,應(yīng)針對用戶的搜索意圖的一些不定和模糊表示出等特征,在稀疏的搜索空間中,通過一些數(shù)據(jù)降維嵌入和相近分析等方式方法來進(jìn)行有效的推理演算,更好地支持用戶意圖的理解和匹配,并通過交互、反應(yīng)等方式對理解有偏差的意圖進(jìn)行糾正。3.5在線知識匹配求解在線知識匹配求解是知識倉庫中知識的查詢匹配、推理求解以及搜索答案:生成經(jīng)過。知識聚合體中的文本類知識的快速匹配算法,可基于深度學(xué)習(xí)思想,研究不同本文關(guān)鍵詞語間的深度語義關(guān)聯(lián),并在語義空間中研究基于時(shí)空類似的快速匹配算法,實(shí)現(xiàn)知識聚合體能快速準(zhǔn)確知足搜索用戶需求。針對知識聚合體中的關(guān)系類知識的快速匹配算法,可基于圖的分布式處理方式方法,研究大圖和巨圖并行匹配的分解算法及優(yōu)化方式方法,支持大圖和巨圖的高效查詢。對于混合屬性查詢請求,可采用地理信息等時(shí)空特性的知識快速匹配為重點(diǎn),處理地理信息、時(shí)空特性的快速知識匹配算法。針對用戶意圖的解答排序與評估反應(yīng),可采用半監(jiān)督加強(qiáng)學(xué)習(xí)方式方法和自反應(yīng)理論,突破在學(xué)習(xí)因素和反應(yīng)特征因子數(shù)量大、維度高的情況下高效反應(yīng)學(xué)習(xí)算法,實(shí)現(xiàn)搜索經(jīng)過的自我演化與更新需求。4研究發(fā)展趨勢社交網(wǎng)絡(luò)智慧搜索發(fā)展研究,將聚焦于3個(gè)主要問題,包括社交網(wǎng)絡(luò)中智慧與知識的挖掘與發(fā)現(xiàn)、用戶真實(shí)搜索意圖的理解與表示、快速給出知足用戶需求的智慧解答。在應(yīng)用方面,重點(diǎn)考慮知足決策的民意調(diào)查、輿情分析,以及企業(yè)市場的社會(huì)化營銷等各行業(yè)領(lǐng)域現(xiàn)實(shí)需求。為知足以上3個(gè)問題,主要關(guān)鍵技術(shù)發(fā)展將包括下面5個(gè)方面內(nèi)容,如此圖2所示。4.1支持時(shí)空特性的在線社交網(wǎng)絡(luò)知識表示模型針對在線社交網(wǎng)絡(luò)中的人物情感立場、事件緣起發(fā)展、群體互動(dòng)與聚集等巨規(guī)模、復(fù)雜、演化的對象和關(guān)系,需要研究支持時(shí)空特性的社交網(wǎng)絡(luò)知識表示模型,實(shí)現(xiàn)對社交網(wǎng)絡(luò)知識的建模。關(guān)鍵技術(shù)發(fā)展將包括下面幾方面。1〕在線社交網(wǎng)絡(luò)中的對象知識表示方式方法。針對在線社交網(wǎng)絡(luò)中的對象知識多樣化特性,包括人物、話題、信息等各種各樣的社交網(wǎng)絡(luò)對象,且每個(gè)對象屬性多樣,深層挖掘?qū)ο蟮母鞣N屬性的特點(diǎn)以及其隨時(shí)間演化的規(guī)律,研究統(tǒng)一的對象建模與知識表示模型。2〕在線社交網(wǎng)絡(luò)巨復(fù)雜關(guān)系型知識表示方式方法。針對在線社交網(wǎng)絡(luò)中各種關(guān)系規(guī)模宏大、種類繁多,粒度不同、時(shí)間演化的特點(diǎn),包括用戶、社區(qū)、話題之間的各種關(guān)系,需要分析關(guān)系的不同特點(diǎn)以及演化規(guī)律,建立合適社交網(wǎng)絡(luò)對象關(guān)系的統(tǒng)一語義表示模型。3〕在線社交網(wǎng)絡(luò)對象與關(guān)系統(tǒng)一融合的表示計(jì)算模型。針對不同來源、跨通道的在線社交網(wǎng)絡(luò)中的復(fù)雜對象與關(guān)系,需要研究能夠統(tǒng)一融合表示的在線社交網(wǎng)絡(luò)知識歸一化表示模型,實(shí)現(xiàn)對巨規(guī)模、復(fù)雜、演化的在線社交網(wǎng)絡(luò)知識建模。4.2在線社交網(wǎng)絡(luò)知識的開掘與推演針對在線社交網(wǎng)絡(luò)中知識多樣化,關(guān)系復(fù)雜及時(shí)空演化等特點(diǎn),包括個(gè)體行為及立場分析、群體社區(qū)發(fā)現(xiàn)及極化規(guī)律、話題的緣起與發(fā)展和信息傳播規(guī)律等,研究以復(fù)雜社會(huì)計(jì)算為基礎(chǔ)的在線社交網(wǎng)絡(luò)知識的開掘和推演。關(guān)鍵技術(shù)發(fā)展如下所示。1〕面向在線社交網(wǎng)絡(luò)關(guān)系的新型關(guān)聯(lián)推理機(jī)制。針對在線社交網(wǎng)絡(luò)中的對象具有豐富的交互關(guān)系,以及知識之間具有關(guān)聯(lián)關(guān)系的特點(diǎn),需要研究合適于在線社交網(wǎng)絡(luò)知識的表性、隱性、虛實(shí)結(jié)合的關(guān)聯(lián)關(guān)系挖掘與發(fā)現(xiàn)推理方式方法。2〕面向在線社交網(wǎng)絡(luò)知識時(shí)空屬性的推演機(jī)制。針對在線社交網(wǎng)絡(luò)知識具有豐富的時(shí)空屬性的特點(diǎn),需要研究時(shí)空類似性計(jì)算和時(shí)空推理技術(shù),及面向社交網(wǎng)絡(luò)的時(shí)態(tài)邏輯推理技術(shù),實(shí)現(xiàn)多尺度的時(shí)空數(shù)據(jù)融合推理。3〕基于刻面的在線社交網(wǎng)絡(luò)大規(guī)模屬性推理機(jī)制。針對在線社交網(wǎng)絡(luò)中的對象屬性個(gè)數(shù)規(guī)模諸多的特點(diǎn),需要研究目的驅(qū)動(dòng)的基于屬性依靠關(guān)系的可伸縮的模態(tài)推理模型,以及面向多屬性刻面的沖突消解方式方法。4〕面向在線社交網(wǎng)絡(luò)交互信息的眾包推理與融合。針對在線社交網(wǎng)絡(luò)中的知識含有大量交互信息的特點(diǎn),需要研究基于離線眾包推理的智能知識的挖掘框架,以及基于標(biāo)注與反應(yīng)相結(jié)合的多源知識融合機(jī)理。4.3面向在線社交網(wǎng)絡(luò)知識聚合與組織管理針對在線社交網(wǎng)絡(luò)知識具有層次性和多粒度特點(diǎn),以及用戶不可預(yù)測的在線知識查詢需求,需要對知識進(jìn)行預(yù)先聚合與組織,生成在線社交網(wǎng)絡(luò)知識聚合體,并進(jìn)行有效排序,進(jìn)而支持實(shí)時(shí)多維度的搜索請求。關(guān)鍵技術(shù)發(fā)展將包括下面幾方面。1〕高維特征空間的知識聚合計(jì)算。針對在線社交網(wǎng)絡(luò)知識跨時(shí)空、多層次、多維度的特點(diǎn),基于開掘與推演技術(shù),需要研究在線社交網(wǎng)絡(luò)知識聚合計(jì)算方式方法,及各知識聚合計(jì)算的相關(guān)性與計(jì)算策略技術(shù)。2〕社交知識聚合體的表示與存儲模型。針對在線社交網(wǎng)絡(luò)聚合體歸一化表示問題和存儲空間隨維度增加呈指數(shù)增長的維災(zāi)難特點(diǎn),需要研究面向在線社交網(wǎng)絡(luò)搜索的社交知識聚合體的模型表示和存儲管理方式方法。3〕社交知識聚合體的排序與更新演化形式。針對用戶搜索需求不斷變化和無法預(yù)測的特點(diǎn),需要研究在線社交網(wǎng)絡(luò)知識聚合體的索引排序,以及獲取的數(shù)據(jù)不斷更新經(jīng)過中,知識聚合體的自我演化與更新模型。4.4基于場景感悟的用戶意圖理解面向用戶查詢輸入的本文關(guān)鍵詞語、語音、手勢等內(nèi)容,結(jié)合用戶手機(jī)終端、所處運(yùn)動(dòng)軌跡的時(shí)空場景以及歷史記錄和個(gè)人偏好等信息,準(zhǔn)確理解用戶的意圖,并采用支持高效查詢推演的統(tǒng)一模型進(jìn)行表示。關(guān)鍵技術(shù)發(fā)展將包括下面幾方面。1〕支持時(shí)空屬性的用戶搜索意圖建模。針對在線社交網(wǎng)絡(luò)的各種時(shí)空軌跡數(shù)據(jù),具體表現(xiàn)出了用戶當(dāng)下在真實(shí)世界中的場景的特點(diǎn),需要研究基于時(shí)空信息的用戶行為形式分析技術(shù),實(shí)現(xiàn)對用戶真實(shí)搜索意圖的建模。2〕支持上下文的語義級用戶意圖理解方式方法。針對用戶搜索意圖與上下文嚴(yán)密相關(guān)的特點(diǎn),需要研究基于上下文感悟的用戶意圖理解方式方法,及基于情感分析的用戶意圖理解方式方法,實(shí)現(xiàn)語義級用戶意圖的理解。3〕基于交互式的用戶搜索意圖理解方式方法。針對用戶搜索意圖單次表述具有二義性等特點(diǎn),需要研究基
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合伙人技術(shù)入股協(xié)議書合同
- 大班音樂《小白船》課件
- 2024年遼寧駕駛員客運(yùn)從業(yè)資格證考試題及答案
- 2024年重慶2024年客運(yùn)從業(yè)資格證考試試題
- 2024【房屋拆除合同范本】建筑拆除合同范本
- 2024職工食堂承包合同范本
- 2024家居工程裝修合同范本
- 2024農(nóng)村水庫承包合同書
- 2024項(xiàng)目投資咨詢合同版
- 深圳大學(xué)《游泳俱樂部》2023-2024學(xué)年第一學(xué)期期末試卷
- 《百團(tuán)大戰(zhàn)》歷史課件
- 銀行涉農(nóng)貸款專項(xiàng)統(tǒng)計(jì)制度講解
- DB31-T 540-2022 重點(diǎn)單位消防安全管理要求
- 兒化音變課件
- 國家開放大學(xué)《傳感器與測試技術(shù)》實(shí)驗(yàn)參考答案
- 工程造價(jià)司法鑒定實(shí)施方案
- 材料成型工藝基礎(chǔ)習(xí)題答案
- 劇本寫作課件
- 計(jì)算方法第三章函數(shù)逼近與快速傅里葉變換課件
- 五年級上冊英語課件-Unit7 At weekends第四課時(shí)|譯林版(三起) (共13張PPT)
- 2022年秋新教材高中英語Unit2SuccessTheImportanceofFailure教案北師大版選擇性必修第一冊
評論
0/150
提交評論