曾劍平代表性成果說明_第1頁
曾劍平代表性成果說明_第2頁
曾劍平代表性成果說明_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、曾劍平代表性成果說明代表性成果(1):不良文本內(nèi)容在線感知的關(guān)鍵技術(shù)及理論論文-(1) J. P. Zeng, C. R. Wu, W. Wang. Multi-grain Hierarchical Topic Extraction Algorithm for Text Mining. Expert Systems with Applicatio ns 2010 37 (4), 3202-3208.(2)J. P. Zeng, J. J. Duan, C. R. Wu. Adaptive Topic Modeling for Detection Objectionable Text. The

2、2013 IEEE/WIC/ACM In ternatio nal Conference on Web In tellige nee, 2013.11.成果描述與說明:網(wǎng)絡(luò)不良信息內(nèi)容檢測是內(nèi)容安全研究領(lǐng)域的一個重要課題。在國家自然科學(xué)基金面上項目的支持下,本人在不良信息內(nèi)容粒度語義模式表示及運用方面做了深入研究。代表性成果的是在論文(1)中所論述的多粒度分層話題提取算法以及論文(2)中進一步強化模式關(guān) 聯(lián)的自適應(yīng)建模方法。具體包括:(1)明確為層次話題給出了一種粒度量化值的定義和計算方法。針對文本中特征詞的分布特征,提出了 0, 1區(qū)間中的層次粒度值計算方法,解決了目前作為描述文本話題的分層

3、結(jié)構(gòu)缺乏對節(jié)點話題粒度特征描述的問題。(2) 提出了一個粒度話題提取算法TG-HAC。該算法以混合高斯分布描述子話題的詞 匯分布結(jié)構(gòu),給出了最佳粒度數(shù)的計算方法,通過話題產(chǎn)生算法及粒度計算構(gòu)建了話題的層 次結(jié)構(gòu)關(guān)系,給出了節(jié)點的粒度值。該算法為話題粒度量化的應(yīng)用提供了一個良好的實例。(3)基于詞匯網(wǎng)絡(luò)圖結(jié)構(gòu),提出了進一步強化不良模式關(guān)聯(lián)的自適應(yīng)建模方法。通過綜合詞匯的重要性、不良性和敏感度量化,在話題建模中設(shè)計不良話題判定準(zhǔn)則,實現(xiàn)了準(zhǔn)確地對一些上下文敏感的不良內(nèi)容進行檢測。引用與評價:該成果的特色在于其話題粒度的思路。雖然之前的相關(guān)研究論文已經(jīng)對層次話題進行了研究,但是在層次的粒度關(guān)系上尚沒

4、有給出量化表達方法。因此,論文發(fā)表后引起了相關(guān)同行的注意,并得到了積極評價。主要有加拿大University of Waterloo電子和計算機工程系、德國杜塞爾多夫大學(xué)Universit?t D u sseldorfGhent University、華中科技大學(xué)計算科學(xué)技術(shù)學(xué)院智能與分布計算實驗室等大學(xué)和科研機構(gòu)的引用1-5。其中,TG-HAC算法作為一個關(guān)鍵步驟,被應(yīng)用到針對 的TSTR和TLA標(biāo)簽推薦算法中2,用來計算資源的 多粒度話題概率值,所得的推薦結(jié)果"surprisingly good ”,“ The precision is even higher thanthat

5、of the tags recommended by delicious website and other methods. ”, 其準(zhǔn)確度高于現(xiàn)有方 法,體現(xiàn)了研究成果應(yīng)有的價值。代表性成果(2):網(wǎng)絡(luò)用戶敏感信息擴散行為建模及算法論文-(1) J. P. Zeng, S. Y. Zhang, C. R. Wu. A Framework for WWW User Activity Analysis Based on User In terest. Kno wledge-Based Systems 2008 21 (8), 905-910.(2)J. P. Ze ng, S. Y. Zha

6、ng, C. R. Wu, X. Ji. Modelli ng Topic Propagation Over the In ternet. Mathematical and Computer Modelli ng of Dyn amical Systems 2009 15 (1), 83-93.(3)王玨, 曾劍平(通訊作者),周葆華, 吳承榮.基于聚類分析的網(wǎng)絡(luò)論壇意見領(lǐng)袖發(fā) 現(xiàn)方法.計算機工程 2011 37 (5), 44-46,49.成果描述與說明:用戶行為是導(dǎo)致網(wǎng)絡(luò)信息內(nèi)容傳播變化不可忽視的因素,在這方面的研究中,從網(wǎng)絡(luò)用戶在網(wǎng)絡(luò)論壇中對敏感信息的行為特征、傳播行為及關(guān)鍵人物識別等方

7、面進行了一系列研究,代表性的成果由三篇論文組成。具體成果包括:(1) 提出了一種 Web網(wǎng)絡(luò)論壇中的用戶興趣建模和量化方法?;诰W(wǎng)絡(luò)論壇用戶的相關(guān)帖子的文本信息所建立的話題模型,使用話題模型的概率計算能力來衡量用戶對于某個文本信息可能存在的興趣度。在此基礎(chǔ)上,提出了一種用戶群體發(fā)現(xiàn)算法GDA,揭示了用戶興趣變化與其在網(wǎng)絡(luò)內(nèi)容變化中的行為所存在的關(guān)聯(lián)性。(2)在敏感話題傳播行為建模方面,提出了一種基于傳播節(jié)點話題狀態(tài)變遷及話題影響力擴散描述的動態(tài)話題傳播模型。 模型中引入了節(jié)點抗感染能力、恢復(fù)能力及有效傳播能 力等與敏感信息擴散緊密相關(guān)的量化因素,并基于Markov假設(shè)建立了節(jié)點的微觀狀態(tài)。所提

8、出的話題傳播模型能夠很好地復(fù)原多種不同情境的話題傳播效果。(3)在網(wǎng)絡(luò)論壇意見領(lǐng)袖識別分析方面,提出了一種潛在特征構(gòu)造及聚類分析的意見領(lǐng)袖識別方法。相比之前基于圖結(jié)構(gòu)的分析方法,該方法在準(zhǔn)確性和執(zhí)行效率方面都有一定提升,因此得到了北京郵電大學(xué)方濱興等在內(nèi)的國內(nèi)外同行的積極評價和引用。引用與評價:本人比較早地意識到用戶興趣變化與其在網(wǎng)絡(luò)敏感信息內(nèi)容變化中的行為存在一定關(guān) 聯(lián),并在這方面做了較深入的研究。相關(guān)成果發(fā)表后引起了一些從事網(wǎng)絡(luò)用戶行為相關(guān)研究 的科研人員的關(guān)注。作為一個主要的用戶興趣度量和行為分析方法、敏感話題傳播和意見領(lǐng)袖識別方法,到目前為止得到了來中國(如中科院計算所、 南京航空航天

9、大學(xué)計算機科學(xué)技術(shù)學(xué)院等)、德國、加拿大等多個國家大學(xué)和科研機構(gòu)的研究人員引用1-8。 Kahraman博士認(rèn)為用戶興趣的相關(guān)成果是一個“powerful ”的方法6。在敏感話題動態(tài)傳播模型及意見領(lǐng)袖識別分析方面也得到了國內(nèi)外同行引用,主要的有中科院合肥智能所、北京郵電大學(xué)方濱興課題組、四川大學(xué)信息安全研究所等9-15。在網(wǎng)絡(luò)用戶行為分析與建模方面的多篇研究論文引起美國認(rèn)知科學(xué)Robert W. Proctor教授(Purdue University)及 Kim-Phuong L. Vu 教授(California State University, Long Beach ) 的關(guān)注,并受邀為

10、其編著的Web用戶行為分析建模方面的新書編寫其中的一章,已經(jīng)完成并評價為"excellent ”,于2011年4月由CRC出版社出版。代表性成果(3):網(wǎng)絡(luò)輿情態(tài)勢建模與評估的理論與方法這方面的成果包括:(1)J. P. Ze ng, J. J. Dua n, C. R. Wu. A New Dista nee Measure for HiddenMarkov Models. Expert Systems with Applicatio ns 2010 37 (2), 1550-1555.成果描述與說明:本人在進行基于歷史序列的網(wǎng)絡(luò)輿情態(tài)勢建模與預(yù)測研究中發(fā)現(xiàn)正確度量兩個HMM模型的

11、距離對于計算結(jié)果的性能有很大影響,因此對這個問題進行進一步研究。 取得的成果包括:(1)對HMM所能刻畫的隨機過程進行了分析,將它劃分為穩(wěn)態(tài)過程和暫態(tài)過程兩部分。提出了一種新的觀點,即為了準(zhǔn)確度量HMM的距離,必須將這兩種過程分開,以避免相互影響帶來的不準(zhǔn)確性問題。(2) 提出了一種基于穩(wěn)態(tài)累積概率分布函數(shù)的距離HSD。在兩個模型對應(yīng)的穩(wěn)態(tài)累積分布函數(shù)的基礎(chǔ)上給出了HSD的定義和計算方法。從理論上證明了 HSD能夠很好地滿足作為距離度量的四個基本條件,特別是三角不等性這個條件。從而解決了 HMM距離不滿足 三角不等性的問題,取得了突破性成果。許多國內(nèi)外研究人員都將HSD列為一種主要的HMM 距

12、離度量方法, 認(rèn)為該 HSD距離度量具有 “ more in formative than the likelihood ”的特 點。( 3)基于所提出的 HSD 距離,給出了在時間序列聚類算法中運用 HSD 進行基于模型 的時間序列聚類的方法。在不同的隱狀態(tài)個數(shù)下,相比傳統(tǒng)的、也是最為廣泛應(yīng)用的 KL 計 算方法,基于 HSD 計算的聚類方法都可以得到更加優(yōu)越的聚類性能。引用與評價: 論文所提出的觀點獨特, HSD 的計算方法解決了在這之前一些常用方法不滿足三角不 等性的問題,因此,該論文發(fā)表后就得到了國內(nèi)外同行的關(guān)注和積極評價。 引用者包括來 自荷蘭代爾夫特理工大學(xué)( Delft Univ

13、ersity of Technology )、美國 University of Florid 、 Texas A&M University 、 Clemson University 、意大利 University of Milan 、瑞士 Lugano Institute for Artificial Intelligence 、重慶大學(xué)等大學(xué)和研究機構(gòu)的相關(guān)領(lǐng)域研究人員,在他們的研究論文 中都將 HSD 列為一種主要的 HMM 距離度量方法 1-7 。Delft University of Technology 的研究人員 L. Bouarfa 根據(jù)本文提出的觀點, 為他們進行 序列長度的設(shè)定找到了相對可靠的依據(jù)。意大利 University of Milan 計算機科學(xué)系、瑞士 Lugano Institute for Artificial Intelligence 的相關(guān)領(lǐng)域研究人員采用 HSD 作為距離度量進行行 為識別研究 7 ,獲得了 “higher accuracies with a significantly lower determinacy ”的研究結(jié)果, 認(rèn)為 HSD 距離度量具有 “

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論