基于Semantic Web的個性化網(wǎng)絡導航機制_第1頁
基于Semantic Web的個性化網(wǎng)絡導航機制_第2頁
基于Semantic Web的個性化網(wǎng)絡導航機制_第3頁
基于Semantic Web的個性化網(wǎng)絡導航機制_第4頁
基于Semantic Web的個性化網(wǎng)絡導航機制_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、基于Semantic Web的天性化搜集導航機制1搜集疑息資本導航的遠況普及齊全國的主機戰(zhàn)處事器,錯綜相聯(lián)的超媒體資本,那是互聯(lián)網(wǎng)為我們所構建的一個宏年夜而豐富的電子疑息空間。它無疑是今世社會最慌張的疑息獵與本領,可是它的開放性、分布性、無序性和驚人的死少速度也為人們對疑息資本的操做帶去了艱易。正如正在年夜海中止駛的船只需要導航系統(tǒng)肯定圓位一樣,要念正在茫茫的疑息陸天中有用獵與有用疑息,也必須具有便利有用的疑息導航妙技。一樣仄居去講,搜集中經(jīng)常使用的疑息導航方法有三種:一是操做門戶網(wǎng)站的分類索引;兩是操做搜集搜索引擎;三是操做網(wǎng)站的相閉鏈接??墒侨缃衲侨N疑息導航方法的成果皆沒有盡善盡美。分類

2、索引所覆蓋的搜集站面范圍太小,更新較緩,易以逆應搜集的快速刪減,而且分類標準的好別一戰(zhàn)沒有標準常常影響到用戶對站面所屬的斷定,組成導航得利。搜索引擎當然是如今主要的搜集疑息檢索工具,可是經(jīng)由過程簡樸的邏輯運算檢索到的成果常常是數(shù)量宏年夜且魚目龍純,充溢著年夜量的無用戰(zhàn)反復疑息。網(wǎng)站的相閉鏈接是指切開當前網(wǎng)站內(nèi)容主題的內(nèi)部戰(zhàn)內(nèi)部疑息資本的超鏈接,那種導航方法當然簡樸間接,可是疑息量非常有限,而且對內(nèi)部疑息的鏈接常常呈現(xiàn)錯鏈戰(zhàn)假鏈,即使是內(nèi)部疑息,也常常因為機閉戰(zhàn)描摹方法的影響,組成用戶的“資本迷背。用戶正在疑息空間中的“迷航會使他們感到厭倦而喪得獵與疑息的自疑心,闡收其去由本由,主要包含以下幾個

3、圓里1,2:(1)搜集的宏年夜疑息量令人們必須依托于自動化的處理妙技??墒侨缃窆鼐W(wǎng)的各個網(wǎng)真?zhèn)€妙技支撐狀況比較宏年夜,疑息資本的內(nèi)容范圍、機閉規(guī)劃戰(zhàn)存儲方法各沒有一樣,呈現(xiàn)出分散、無序、變幻多真?zhèn)€特征,那使自動疑息處理妙技的使用艱易重重。果而要前進疑息導航的從命戰(zhàn)量量,必須先打面資本同構的標題問題。(2)搜集疑息空間中的數(shù)據(jù)年夜多以半規(guī)劃化戰(zhàn)非規(guī)劃化的形式存正在,對疑息資本的內(nèi)容缺少形式化的語義描摹,而且年夜局部資本間的鏈接也出有反響語義閉連,那使得機器很易對搜集疑息空間舉止深層次的年夜黑戰(zhàn)處理,對疑息的自動導航也沒法像野生操做那樣準確有用。(3)如今的搜集導航系統(tǒng)缺少天性化的疑息處事。因為

4、常識背景的好別戰(zhàn)一詞多義等圓里的去由本由,好別的搜集用戶之間、用戶與系統(tǒng)圓案者之間對于標題問題戰(zhàn)疑息內(nèi)容年夜要會具有好別的年夜黑與死習,當用戶按照自己的思路查覓疑息時,他所挑選的導航途徑年夜假設缺點的年夜要低效的。果而疑息導航必須考慮詳細用戶的出格性,有針對性天供給導航處事。(4)搜集導航系統(tǒng)的圓案缺少標準。門戶網(wǎng)站各自按照好別的標準創(chuàng)坐自己的分類導航系統(tǒng),網(wǎng)站的分別隨意性較年夜,常常惹升引戶的疑心。一些著名的疑息搜索引擎也各自采與好別的檢索端圓,有些系統(tǒng)沒有能操做歷史疑息年夜要沒有供給兩次檢索,給用戶的操做帶去沒有便。其中,正在網(wǎng)站內(nèi)部的導航系統(tǒng)圓案上,也存正在著導航規(guī)劃沒有公允,導航要素沒

5、有完好,導航界里好別一等標題問題。那些皆年夜要組成用戶的導航窒礙。由此可睹,組成疑息“迷航標題問題的主要去由本由正在于缺少疑息空間的公允機閉戰(zhàn)有用的導航機制,那也是第兩代eb搜集妙技易以抑制的艱易。為此,人們正正在研制第兩代eb搜集Seantieb,它以規(guī)劃化疑息表示為主,為搜集導航研討開拓了新六開。2Seantieb妙技TiBernersLee正在1998年提出了Seantieb的觀面。2001年2月,3機閉正式推出SeantiebAtivity,使搜集狀況下的語義處理妙技研討漸進佳境。Seantieb研討活動的目的是開拓一系列可由策畫機年夜黑戰(zhàn)處理的語義表示語止戰(zhàn)妙技,經(jīng)由過程隱式的語義表

6、示戰(zhàn)范圍本體將搜集疑息空間編織成為一個宏年夜的機器可讀的常識搜集,以支撐自動化的疑息訪謁戰(zhàn)常識打面,真現(xiàn)下量量的搜集疑息處事。如今閉于Seantieb的研討主要會散正在搜集疑息資本及其內(nèi)容的語義戰(zhàn)語義閉連表征,基于語義的數(shù)據(jù)自動闡收、年夜黑戰(zhàn)處理,好別使用范圍戰(zhàn)系統(tǒng)間的數(shù)據(jù)自動交換、轉換戰(zhàn)復用3。Seantieb當然是現(xiàn)有eb搜集的持絕,但正在疑息導航圓里具有許多偉大eb出有的下風。Seantieb中的節(jié)面既可以代表物理頁里,也可以代表常識真體;Seantieb中網(wǎng)頁的內(nèi)容沒有但可以被人年夜黑,而且可以被機器年夜黑;Seafitieb中的鏈接沒有再是盡情的,而是按照一定的語義閉連。經(jīng)由過程Se

7、antieb妙技,可以改動現(xiàn)有搜集疏松的數(shù)據(jù)規(guī)劃,將疑息資本規(guī)劃化并給以含義,使搜集疑息的整開戰(zhàn)自動處理皆變得越收隨意4。2.1本體所謂本體(ntlgy),本量上是描摹特定使用范圍常識的公認的術語散。閉于奉體的定義,比較著名的沒有俗觀面是“本體是觀面模型的一個隱式的規(guī)格分析戰(zhàn)“本體是同享觀面的一個形式化的規(guī)格分析,其中,“觀面模型(neptualizatin)是指經(jīng)由過程對某個客沒有俗觀現(xiàn)象的相閉觀面舉止辨析戰(zhàn)提與而獲得的閉于該現(xiàn)象的籠統(tǒng)摸型;“隱式(Expliit)是指對所操做的觀面的標準,和那些觀面正在使用上的束厄局促皆給以年夜黑的分析;“形式化(Fral)表示本體以策畫機可讀的形式存正在

8、;“同享(Share)表示本體中反響的是共同認可的常識5。本體但但凡表達為一組工具觀面、閉連、函數(shù)、定理戰(zhàn)真例。本體中的工具類按照等級閉連構組成根柢的規(guī)劃系統(tǒng)。等級閉連包含例化(is-a)閉連、類屬(kind-f)閉連戰(zhàn)整部閉連(part-f)。上層的工具類為女類,基層的工具類為子類。工具類具有各自的屬性,并可按照女子閉連繼絕。對屬性的與值工具、與值范圍、與值基數(shù)等皆可以減以限制,借可以對屬性的交換性、對稱性、傳遞性、獨一性等舉止定義。除等級閉連,本體中的工具類間借可以具有其他語義閉連,組成語義搜集形式的觀面模型。本體是機器自動推理戰(zhàn)智能化初級疑息處事的根柢,對搜集而止,一個簡樸的本體的標準例

9、子便是搜集的分類索引如Yah!的分類目錄。本體的使用對于前進搜集導航的粗度戰(zhàn)從命具有慌張的意義1,4)。2.2RDF戰(zhàn)RDFSRDF是由3開拓的元數(shù)據(jù)描摹機制,其目的主假設為元數(shù)據(jù)正在搜集上的編碼、交換戰(zhàn)重用供給一個基矗它容許正在XL的根柢上以一種標準化的、互操做的方法對數(shù)據(jù)語義舉止定義4,供給了一個描摹eb資本的數(shù)據(jù)模型。RDF包含描摹資本的屬性戰(zhàn)閉連的聲明。資本是任何用URl(UnifrResureIdentifier)獨一標識的真體工具。資本具有屬性,屬性那么具有一定的值,該值年夜假設簡樸的字符串或數(shù)字,也年夜假設自己也具有屬性的其他資本。多么,資本、資本屬性戰(zhàn)屬性值組成了RDF聲明中的

10、三元閉連形式,任何本體或描摹性元數(shù)據(jù)皆是那種三元閉連形式的詳細表示1,7。為了描摹元數(shù)據(jù)元素間的宏年夜語義閉連,3進一步定義了RDFS(RDFShea)。它可以當做是一個本體定義語止,用去創(chuàng)坐觀面類系統(tǒng)規(guī)劃、屬性層次戰(zhàn)類閉連。3基于Seantieb的智能導航機制Seantieb的呈現(xiàn)為搜集疑息導航供給了新的研討思路,Seantieb妙技是打面無序搜集空間中“迷航標題問題的閉鍵妙技?;赟eantieb的智能導航是一種以規(guī)劃化、語義化的觀面常識搜集為根柢,自動組成天性化導航規(guī)劃的要收。它分為兩個圓里,一是基于Seantieb的疑息機閉,即操做參考本體對各疑息源舉止語義描摹戰(zhàn)整開;兩是基于Sean

11、tieb的天性化導航規(guī)劃模型的構建,即正在有序語義機閉的根柢上,規(guī)劃用戶語義模型,并據(jù)此創(chuàng)坐導航規(guī)劃。圖1表示了基于Seantieb的智能導航機制的觀面規(guī)劃8。3.1基于Seantieb的疑息機閉基于Seantieb的疑息機閉的根柢思維是,將去自于多個同構疑息源中的數(shù)據(jù)整開到一個語義統(tǒng)一的參考本體中。參考本體是經(jīng)由過程闡收范圍中的各個疑息資本會萃,提與群寡觀面、屬性戰(zhàn)閉連而構建的本體,它為局部疑息資本供給統(tǒng)一的觀面會萃戰(zhàn)通用語義。疑息整開的要收是先分別將各個疑息源中的數(shù)據(jù)轉換為通用的數(shù)據(jù)模型,然后創(chuàng)坐各個數(shù)據(jù)模型戰(zhàn)參考本體之間的映照閉連。搜集中的疑息源具有各種各式的數(shù)據(jù)格局,其中年夜局部是HT

12、L頁里,有的包含表格戰(zhàn)列表。其中借有XL文檔、RDF文檔和閉連數(shù)據(jù)庫文檔等。為了打面分布式同構疑息源的語法一樣標題問題,需要將數(shù)據(jù)轉換為公用的數(shù)據(jù)模型格局,例如RDF。對于非RDF格局的疑息數(shù)據(jù),可以操做中覆包(rapper)妙技將其自動天轉換為基于RDF的數(shù)據(jù)模型。中覆包對特定格局的數(shù)據(jù)文檔舉止分析,并采與RDF聲明對其內(nèi)容舉止標注。上里是三種經(jīng)常使用的中覆包:(1)HTL中覆包。因為HTL頁里屬于半規(guī)劃化的疑息數(shù)據(jù),果而HTL中覆包采與的是半指導性的標注要收。即預先腳工標注一組HTL頁里,然后對新的HTL頁里舉止規(guī)劃闡收,將新頁里與標注頁里舉止比較,從中提與相閉疑息。HTL中覆包借可以處理

13、同構的XL文件1。(2)XL中覆包。按照DTD戰(zhàn)Shea所定義的XL文檔的內(nèi)容規(guī)劃戰(zhàn)內(nèi)容元素,創(chuàng)坐觀面散與DTDShea之間的映照閉連,從而自動天將XL文獻中的DTD內(nèi)容元素標識表記標幟轉換為對應的觀面散元數(shù)據(jù)標識表記標幟。(3)閉連數(shù)據(jù)庫中覆包。將閉連數(shù)據(jù)庫中的數(shù)據(jù)元素戰(zhàn)兩維數(shù)據(jù)閉連映照到觀面會散,組成語義根柢,以便從閉連數(shù)據(jù)庫中自動創(chuàng)坐RDF聲明。因為好別的疑息供給者年夜要會操做好別的詞表去標注數(shù)據(jù),果而正在創(chuàng)坐通用數(shù)據(jù)模型后,借必須正在疑息數(shù)據(jù)源戰(zhàn)參考本體之間創(chuàng)坐觀面戰(zhàn)閉連的映照,以消弭語義好別。按照RDF聲明,正在參考本體中注冊相閉內(nèi)容的根源,使參考本體成為一個常識內(nèi)容的散成文件。其中

14、,采與基于本體的元數(shù)據(jù)創(chuàng)制戰(zhàn)遨游妙技,探測相閉的RDF聲明,可以自動天增減新的疑息資本8。3.2基于Seantieb的天性化導航經(jīng)由過程創(chuàng)坐參考本體和舉止疑息整開,無序同構的搜集疑息數(shù)據(jù)經(jīng)由過程語義觀面及語義閉連被機閉到一同,組成一個有序的群寡語義常識模型??墒菍τ谠敿毸鸭脩舻囊上Ш?,其真沒有間接正在局部群寡語義模型上舉止,而是按照用戶語義模型有針對性天舉止模型用戶語義模型是反響用戶沒有俗觀面的觀面會萃戰(zhàn)觀面閉連。觀面會萃幾乎定可以由用戶間接提交年夜要按照用戶的注冊疑息用戶的愛好、愛好戰(zhàn)常識背景等按照一定的端圓策畫挑選。而構建用戶語義模型的閉鍵步伐正在于創(chuàng)坐用戶觀面會萃與參考本體間的語義映

15、照,根究參考本體中與用戶相婚配的觀面戰(zhàn)閉連。為了將參考本體映照到用戶語義模型,需要預先對參考奉體戰(zhàn)用戶觀面會萃舉止數(shù)據(jù)操練,要收是為每個本體觀面戰(zhàn)用戶觀面各標注一定的相閉資本做為操練數(shù)據(jù),然后操做背量空間模型為每個觀面天死背量,并策畫其標準權重。創(chuàng)坐語義映照的過程經(jīng)由過程策畫用戶觀面散會散的觀面背量u與參考奉體中的每個觀面背量間的婚配度去完成。假定正在n維背量空間中,用戶觀面背量u中第i項的權重為的婚配度為9:起尾將策畫成果中婚配度下于閥值的幾觀面背量與u創(chuàng)坐映照,組成從用戶觀面會萃到參考本體的一對多的對應閉連。假定參考本體的一些觀面被反復映照,那么需要挑選其中婚配度最下的映照,以保證從參考本

16、體到用戶觀面會萃的一對一閉連,即一個本體觀面只能戰(zhàn)一個用戶觀面相閉,但一個用戶觀面可以戰(zhàn)多個參考觀面相閉。正在創(chuàng)坐用戶觀面會萃與參考奉體對應閉連的同時,用戶觀面也繼絕了本體中的觀面層次規(guī)劃戰(zhàn)其他語義閉連,成為一個自力的語義模型。本那么上該當將參考本體中的局部觀面皆映照到用戶語義模型中,可是因為用戶語義模型是范圍相對較小的觀面會萃,果而參考奉體中的觀面理想上沒有成能被完好映照。為了連結映照的完好性,可以正在用戶語義模型中設坐一個“其他觀面類,參考本體中的局部出有被映照的觀面將成為它的子觀面9。舉例去講,假定用戶供給的疑息說明其正在體育范圍感愛好的觀面為“足球、“足球全國杯、“足球亞洲杯、“NBA

17、、“圍棋、“奧運會,圖2表示了那些用戶相閉觀面經(jīng)過映照后組成用戶語義模型的過程。用戶觀面散會散的每個觀面皆正在參考本體中覓到了與之相對應的一個或多個觀面,將那些觀面從參考本體中提與出去,并按照其語義閉連從頭組開,便組成了用戶語義模型的規(guī)劃。例如:用戶觀面“NBA的對應觀面為“籃球、“籃球賽事戰(zhàn)“好國籃球職業(yè)聯(lián)賽(NBA),果而那三個觀面皆被包含正在用戶語義模型中,且它們之間的女子閉連即等級閉連連結沒有變。又如,當然參考本體中的“其他賽事觀面戰(zhàn)用戶觀面會萃出有間接對應閉連,但因為該觀面戰(zhàn)“足球賽事與“籃球賽事兩個觀面間有語義閉連,且那兩個觀面均與用戶相閉,果而該觀面也被包含正在用戶語義模型中。其

18、中,“全國杯足球賽觀面理想上與“足球戰(zhàn)“足球全國杯兩個觀面間皆具有對應閉連。但因為它與后者的婚配度比前者下,果而將它映照到后者。天性化導航規(guī)劃模型導航規(guī)劃模型表示了導航系統(tǒng)機閉、聯(lián)絡閉系戰(zhàn)表示疑息內(nèi)容的方法。站面天圖便是一種最簡樸間接的導航規(guī)劃模型。天性化導航規(guī)劃模型是基于用戶語義模型創(chuàng)坐的針對特定用戶的導航規(guī)劃,是天性化導航處事的真現(xiàn)。導航規(guī)劃的圓案需要考慮三個根柢要素:卡片、頁里戰(zhàn)鏈接。一張卡片只包含一種標準的疑息內(nèi)容,是導航規(guī)劃模型中的最小組成單元。頁里與物理的eb頁里相對應,一個頁里上可以包含幾個卡片。鏈接那么用于毗鄰各個頁里中的卡片以組成散體規(guī)劃8。但但凡,導航規(guī)劃模型老是從一個缺省

19、的根頁里開端,每級頁里皆包含了到下一級頁里的鏈接,疑息內(nèi)容經(jīng)由過程卡片戰(zhàn)頁里舉止分類戰(zhàn)散開,導航經(jīng)由過程鏈接去舉止。正在天性化的導航規(guī)劃建模中,導航規(guī)劃是按照用戶語義模型去肯定內(nèi)容戰(zhàn)鏈接閉連的。圖3表示了一個導航規(guī)劃的局部例如,它是正在圖2中的用戶語義模型的根柢上創(chuàng)坐的。導航規(guī)劃的建模過程便是對各級貞里中的卡片的內(nèi)容、標準戰(zhàn)表示款式幾乎定過程??ㄆ膬?nèi)容按照觸收面戰(zhàn)用戶語義模型去挑選,好別的用戶將獲得好別的疑息內(nèi)容。導航規(guī)劃中的卡片被分為兩種標準:靜態(tài)卡片戰(zhàn)靜態(tài)卡片。靜態(tài)卡片的內(nèi)容自力于數(shù)據(jù)源,主要包含靜態(tài)文本、圖片等。導航規(guī)劃中的根頁里但但凡皆包含靜態(tài)卡片,具有預先定義的錨面,指背下一級的頁

20、里。靜態(tài)卡片的內(nèi)容視數(shù)據(jù)源而定,假定數(shù)據(jù)源改動,那么卡片的內(nèi)容必須從頭策畫天死。靜態(tài)卡片借可以細分為四種標準,每種皆代表了對疑息舉止規(guī)劃化的一種標準要收:(1)列表型(List)卡片:表示真體的真例列表,每條真例皆可具有指背該真例詳細內(nèi)容的鏈接進心。列表中的真例可以按照某種屬性排序或索引。圖3中的頁里P2、P3、P4、P5皆包含了列表型卡片。(2)終究型(Fat)卡片:詳細天表示一個真例的詳細內(nèi)容,如圖3中的頁里P4包含的“動靜內(nèi)容卡片戰(zhàn)頁里P5包含的“賽事內(nèi)容卡片。(3)幻燈片型(Slide)卡片:逆次表示一組真例的詳細內(nèi)容,每次一個真例,且具有閱讀周圍真例的超鏈接,待表示的真例可以按照某種

21、屬性排序或索引。圖3中的頁里P6包含該標準的卡片,其中每個足球俱樂部的相閉疑息將被逆次表示。(4)查詢型(Query)卡片:要供用戶先挖寫一組真體屬性的值,然后查詢切開該值的真例并表示,但但凡該標準的卡片用于導航系統(tǒng)中的疑息檢索,如圖3中的頁里P7包含的卡片8。其中,好別的卡片具有好別的表示款式,表示款式描摹各種表示元素的屬性,例如字體、色彩、規(guī)劃等。表示款式可以按照用戶愛好肯定。天性化導航機制的導航要收采與用戶語義模型的查覓與語義鏈的觸收相結開的方法。當導航規(guī)劃中的一個鏈接被觸收時,該鏈接將被給以一個查詢式Q(,T,S),式中三個變量的含義分別代表卡片的內(nèi)容、標準戰(zhàn)表示款式,正在用恰當?shù)闹禍p

22、補變量后,便可操做查詢式策畫天死鏈接終了的卡片。例如正在圖3中,當鏈接L1被觸收后,L1的查詢式為:Q“體育,List,Stylel,其策畫成果為頁里P2中的卡片。Q中的變量的值為L1的觸收端面的觀面“體育,Q正在策畫時將檢索用戶語義模型,獵與此觀面的相閉觀面或相閉資本做為卡片的內(nèi)容。Q中變量T的值為List,果而Q天死的卡片將具有列表型的疑息規(guī)劃。同時,因為Q中變量S的值為Stylel,果而Q借要讀與款式表中稱號為Stylel的表示款式,并據(jù)此決議卡片的中沒有俗觀。同理,鏈接L2的查詢式為Q“足球俱樂部,Slide,Stylel,其成果是天死一個疑息規(guī)劃為幻燈片標準,表示款式為Stylel,內(nèi)容與足球俱樂部相閉的卡片11,12。導航機制采與Seantieb妙技,展示戰(zhàn)整開搜集疑息資本的深層語義常識模型,能有用打面無序、同構搜集疑息空間中的“迷航標題問題。它操做映照要收創(chuàng)坐用戶語義模型,可以充分表達用戶需供的語義常識,以前進天性化導航的從命。4完畢語搜集疑息的操做形態(tài)沒有容樂沒有俗觀,迫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論