![【畢業(yè)學(xué)位論文】(Word原稿)基于本體的高校數(shù)字圖書(shū)館語(yǔ)義檢索系統(tǒng)的研究與應(yīng)用-軟件工程_第1頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf161.gif)
![【畢業(yè)學(xué)位論文】(Word原稿)基于本體的高校數(shù)字圖書(shū)館語(yǔ)義檢索系統(tǒng)的研究與應(yīng)用-軟件工程_第2頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf162.gif)
![【畢業(yè)學(xué)位論文】(Word原稿)基于本體的高校數(shù)字圖書(shū)館語(yǔ)義檢索系統(tǒng)的研究與應(yīng)用-軟件工程_第3頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf163.gif)
![【畢業(yè)學(xué)位論文】(Word原稿)基于本體的高校數(shù)字圖書(shū)館語(yǔ)義檢索系統(tǒng)的研究與應(yīng)用-軟件工程_第4頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf164.gif)
![【畢業(yè)學(xué)位論文】(Word原稿)基于本體的高校數(shù)字圖書(shū)館語(yǔ)義檢索系統(tǒng)的研究與應(yīng)用-軟件工程_第5頁(yè)](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf165.gif)
已閱讀5頁(yè),還剩58頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
中圖分類(lèi)號(hào): 學(xué)校代碼: 10055 密級(jí): 公開(kāi) 碩 士 專(zhuān) 業(yè) 學(xué) 位 論 文 基于本體的高校數(shù)字圖書(shū)館語(yǔ)義檢索系統(tǒng)的研究與應(yīng)用 要 I 摘 要 在知識(shí)大爆炸的信息化社會(huì),高校數(shù)字圖書(shū)館成為重要的信息傳承介質(zhì),目前其檢索平臺(tái)完全采用字符匹配的模式,缺乏表達(dá)檢索需求的語(yǔ)義信息,致使 檢索結(jié)果與檢索需求出現(xiàn)偏差。 本論文深入研究了本體的概念、應(yīng)用領(lǐng)域、描述語(yǔ)言以及本體的創(chuàng)建規(guī)則,提出了基于軟件工程方式的本體創(chuàng)建流程,以計(jì)算機(jī)圖書(shū)為例,詳細(xì)論述了需求分析、設(shè)計(jì)、形式化編碼以及本體評(píng)價(jià)的全過(guò)程。在分析傳統(tǒng)模型的基礎(chǔ)上,引入本體語(yǔ)義層,提出基于本體語(yǔ)義的檢索模型,設(shè)計(jì)了用戶(hù)交互層、數(shù)據(jù)管理層和本體語(yǔ)義層的應(yīng)用功能,設(shè)計(jì)了檢索系統(tǒng)的整體結(jié)構(gòu)模型。研究了數(shù)字圖書(shū)館檢索的擴(kuò)展查詢(xún),提出了基于單關(guān)鍵詞、多關(guān)鍵詞的查詢(xún)算法和處理流程,在研究目前推理機(jī)工作機(jī)制的基礎(chǔ)上,提出并設(shè)計(jì)了基于本體概念與關(guān)系的語(yǔ)義 推理模型。 在檢索模型設(shè)計(jì)的基礎(chǔ)上,詳細(xì)描述了檢索系統(tǒng)的本體維護(hù)、語(yǔ)義推理等操作的具體實(shí)現(xiàn)過(guò)程。通過(guò)樣例試驗(yàn)數(shù)據(jù)驗(yàn)證了本體檢索系統(tǒng)在查準(zhǔn)率和查全率兩方面優(yōu)于傳統(tǒng)檢索系統(tǒng)。論文實(shí)現(xiàn)的檢索系統(tǒng)可在目前高校圖書(shū)館中推廣應(yīng)用,能夠提高書(shū)目檢索的查準(zhǔn)率和查全率。 關(guān)鍵詞 :本體 ,語(yǔ)義檢索 ,語(yǔ)義推理 ,數(shù)字圖書(shū)館 I he an in on is of of so of of of on of in by an of On of of on of It of on of of of on of on of is to in be in it of 目錄 錄 第一章 緒論 . 1 第一節(jié) 研究的背景與意義 . 1 第二節(jié) 國(guó)內(nèi)外研究現(xiàn)狀分析 . 2 內(nèi)研究現(xiàn)狀 . 2 外研究現(xiàn)狀 . 3 第三節(jié) 論文的主要內(nèi)容 . 3 第四節(jié) 論文的組織與結(jié)構(gòu) . 4 第二章 相關(guān)理論與技術(shù) . 6 第一節(jié) 數(shù)字圖書(shū)館 . 6 第二節(jié) 本體概 念 . 6 體概念 . 6 體的應(yīng)用 . 7 體的構(gòu)成 . 8 體的描述語(yǔ)言 . 9 體庫(kù)建立 . 10 第三節(jié) 數(shù)字圖書(shū)館領(lǐng)域本體的形式化描述 . 11 第四節(jié) 本章小節(jié) . 13 第三章 計(jì)算機(jī)圖書(shū)本體庫(kù)建設(shè) . 14 第一節(jié) 計(jì)算機(jī)本體庫(kù)的構(gòu)建背景 . 14 第二節(jié) 本體庫(kù)采用的語(yǔ)言和工具 . 14 第三節(jié) 計(jì)算機(jī)本體庫(kù)的構(gòu)建步驟 . 15 求分析階段 . 16 計(jì)階段 . 16 目錄 形式化編碼 . 19 體的評(píng)價(jià) . 20 第四節(jié) 本章小節(jié) . 21 第四章 數(shù)字圖書(shū)館本體語(yǔ)義檢索模型設(shè)計(jì) . 22 第一節(jié) 總體結(jié)構(gòu)設(shè)計(jì) . 22 統(tǒng)數(shù)字圖書(shū)館檢索系統(tǒng)總體結(jié)構(gòu) . 22 于本體的數(shù)字圖書(shū)館檢索系統(tǒng)總體結(jié)構(gòu) . 23 統(tǒng)總體流程結(jié)構(gòu) . 25 第二節(jié) 擴(kuò)展查詢(xún)?cè)O(shè)計(jì) . 26 第三節(jié) 資源映射管理設(shè)計(jì) . 29 第四節(jié) 語(yǔ)義推理設(shè)計(jì) . 31 第五節(jié) 基于語(yǔ)義檢索的關(guān)鍵技術(shù) . 34 第六節(jié) 本章小節(jié) . 36 第五章 數(shù)字圖書(shū)館本體語(yǔ)義檢索系統(tǒng)的實(shí)現(xiàn) . 37 第一節(jié) 系統(tǒng)開(kāi)發(fā)環(huán)境 . 37 第二節(jié) 系統(tǒng)總體結(jié)構(gòu)實(shí)現(xiàn) . 37 統(tǒng)服務(wù)總體結(jié)構(gòu) . 37 統(tǒng)模塊框架 . 38 第三節(jié) 本體庫(kù)維護(hù)處理的實(shí)現(xiàn) . 40 體庫(kù)創(chuàng)建的實(shí)現(xiàn) . 40 體文檔管理器的操作實(shí)現(xiàn) . 41 體操作的實(shí)現(xiàn)方法 . 41 第四節(jié) 語(yǔ)義推理的實(shí)現(xiàn) . 42 理機(jī)的創(chuàng)建 . 42 義推 理的實(shí)現(xiàn) . 43 第五節(jié) 實(shí)驗(yàn)分析 . 45 目錄 V 第六節(jié) 本章小結(jié) . 50 第六章 總結(jié)與展望 . 51 第一節(jié) 總結(jié) . 51 第二節(jié) 展望 . 52 參考文獻(xiàn) . 53 致謝 . 56 個(gè)人簡(jiǎn)歷 在學(xué)期間發(fā)表的學(xué)術(shù)論文與科研成果 . 57 第一章 緒論 1 第一章 緒論 第一節(jié) 研究的背景與意義 隨著信息化和知識(shí)經(jīng)濟(jì)的不斷發(fā)展,高校圖書(shū)館作為我國(guó)教育的重要知識(shí)載體越來(lái)越龐大,存書(shū)量越來(lái)越大,形成千萬(wàn)的圖書(shū)。同時(shí)由于近些年計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和信息處理技術(shù)有很大的發(fā)展,促使了數(shù)字圖書(shū)館的產(chǎn) 生,對(duì)一所高校來(lái)說(shuō)有兩個(gè)方面的重要影響,通過(guò)信息化的存儲(chǔ)對(duì)圖書(shū)館文獻(xiàn)資料的保存、繼承等方面起到重要的作用,同時(shí)通過(guò)計(jì)算機(jī)信息檢索技術(shù)的運(yùn)用,為高校師生圖書(shū)檢索提供高效、快捷的手段,能夠讓檢索用戶(hù)快速找到出所需要的圖書(shū)文獻(xiàn)。 目前,國(guó)內(nèi)大部分高校已經(jīng)完成了數(shù)字圖書(shū)館的基礎(chǔ)建設(shè),學(xué)校的圖書(shū)文獻(xiàn)索引、主題詞、作者信息、文獻(xiàn)題目等信息已經(jīng)存檔入庫(kù),已經(jīng)建設(shè)了完善的基于關(guān)鍵字的圖書(shū)檢索方法,這種檢索方法是完全基于字符之間的匹配,即通過(guò)用戶(hù)輸入的查找關(guān)鍵字與圖書(shū)信息的關(guān)鍵字進(jìn)行匹配,匹配成功后,找出找到相關(guān)圖書(shū)數(shù)據(jù),很 明顯這種采用字符匹配的檢索方法,沒(méi)有準(zhǔn)確地表達(dá)出關(guān)鍵詞豐富的語(yǔ)義信息,造成系統(tǒng)給出的檢索結(jié)果與用戶(hù)原有的檢索需求存在一定的偏差,使檢索結(jié)果不能完全表達(dá)出作者所想要的圖書(shū)信息,降低了檢索的查全率和查準(zhǔn)率。 基于上述背景,作者所在高校為提高本校的數(shù)字圖書(shū)館中信息檢索的準(zhǔn)確率和查全率,更好地讓圖書(shū)館為全校師生服務(wù),在原有數(shù)字圖書(shū)館傳統(tǒng)的基于字符串匹配檢索技術(shù)的基礎(chǔ)上引入本體語(yǔ)義概念,研究了基于本體語(yǔ)義的數(shù)字圖書(shū)館檢索技術(shù),本體概念的引入,能夠挖掘出概念之間復(fù)雜的語(yǔ)義關(guān)系,在檢索系統(tǒng)中運(yùn)用本體,可以由原來(lái)的字符串匹 配方式完全轉(zhuǎn)為基于概念的匹配方式,實(shí)現(xiàn)能夠反映用戶(hù)檢索意圖的語(yǔ)義檢索。該技術(shù)的運(yùn)用使檢索系統(tǒng)如同一個(gè)智能的領(lǐng)域?qū)<遥淖兞藗鹘y(tǒng)數(shù)字圖書(shū)館檢索系統(tǒng)的技術(shù)局限性,引入了語(yǔ)義,提高了檢索的精度和覆蓋率。 第一章 緒論 2 第二節(jié) 國(guó)內(nèi)外研究現(xiàn)狀分析 內(nèi)研究現(xiàn)狀 國(guó)內(nèi)有關(guān)檢索系統(tǒng)的研究大部分面向公眾服務(wù)領(lǐng)域,如門(mén)戶(hù)的 索系統(tǒng),這種檢索的特點(diǎn)是面向廣泛的搜索領(lǐng)域。針對(duì)一些特定領(lǐng)域的需求,要求檢索范圍限定于特定的專(zhuān)業(yè)范圍之內(nèi)的檢索成為近年來(lái)的搜索領(lǐng)域研究的熱門(mén)課題。本體作為專(zhuān)業(yè)領(lǐng)域內(nèi)的知識(shí)庫(kù)的存儲(chǔ)形式,這一概念的提出 給廣大檢索研究者,提供了信息的表示、存儲(chǔ)方面的研究方向的同時(shí),更為重要的是為信息檢索、語(yǔ)義推理等方面提供研究方向。 目前國(guó)內(nèi)有許多研究者將本體語(yǔ)義作為檢索數(shù)據(jù)結(jié)構(gòu)、存儲(chǔ)、管理的載體,實(shí)現(xiàn)專(zhuān)業(yè)領(lǐng)域內(nèi)語(yǔ)義檢索,把用戶(hù)模糊的需求轉(zhuǎn)化為概念的標(biāo)準(zhǔn)詞,提高了檢索精度。在這些研究過(guò)程中,一般都建立了本專(zhuān)業(yè)領(lǐng)域內(nèi)的本體庫(kù)。如中國(guó)農(nóng)業(yè)大學(xué)的李景 1在分析、歸納花卉學(xué)領(lǐng)域的基礎(chǔ)上,建立了此領(lǐng)域的本體,并通過(guò)開(kāi)發(fā)檢索系統(tǒng),研發(fā)了基于本體庫(kù)的專(zhuān)業(yè)檢索系統(tǒng);趙慶齡 2在分析農(nóng)業(yè)學(xué)科中的土壤專(zhuān)業(yè)、農(nóng)業(yè)化學(xué)專(zhuān)業(yè)的基礎(chǔ)上,建立了土壤 和農(nóng)業(yè)化學(xué)領(lǐng)域的本體庫(kù),這一本體庫(kù)在農(nóng)業(yè)領(lǐng)域內(nèi)得到了較為廣泛的應(yīng)用;另外以山西大學(xué)為代表的高校承擔(dān)的“現(xiàn)代漢語(yǔ)框架語(yǔ)義系統(tǒng)研究” 3,項(xiàng)目組構(gòu)建了漢語(yǔ)框架語(yǔ)義知識(shí)本體庫(kù),這些研究大部分集中在各個(gè)領(lǐng)域的本體庫(kù)的建設(shè)與檢索系統(tǒng)的開(kāi)發(fā)上。 此外,國(guó)內(nèi)許多學(xué)者對(duì)本體 檢索 理論和方法進(jìn)行了深入的研究,比如 中國(guó)科學(xué)院計(jì)算技術(shù)研究所 的 武成鋼 4等人在本體理論的基礎(chǔ)上研究了基于本體的與多智能主體的信息檢索,設(shè)計(jì)了檢索服務(wù)器,此項(xiàng)成果可用在按專(zhuān)業(yè)領(lǐng)域分類(lèi)處理互聯(lián)網(wǎng)上的數(shù)據(jù),根據(jù)不同的關(guān)注度建立信息資源的索引,使用戶(hù)的信息 檢索模式得到了優(yōu)化和規(guī)范,能夠動(dòng)態(tài)地把互聯(lián)網(wǎng)上更新的數(shù)據(jù)分類(lèi)索引,提高了檢索的準(zhǔn)確率。 通過(guò)查閱相關(guān)參考文獻(xiàn),近幾年來(lái)國(guó)內(nèi)學(xué)者在本體領(lǐng)域方面的研究一般集中在以下幾個(gè)方面:( 1)具體專(zhuān)業(yè)本體庫(kù)的建設(shè),本體庫(kù)是本體語(yǔ)義檢索的基礎(chǔ),一些專(zhuān)業(yè)領(lǐng)域的專(zhuān)家根據(jù)多年來(lái)在本行業(yè)的知識(shí)積累,研究設(shè)計(jì)了基于本專(zhuān)業(yè)的本體庫(kù)。( 2)本體庫(kù)的應(yīng)用方面的研究,一些學(xué)者根據(jù)已建本體庫(kù)研究了具體應(yīng)用,如本體庫(kù)概念之間的關(guān)系研究、本體庫(kù)概念的邏輯規(guī)則研究和本體庫(kù)語(yǔ)義檢索的研究等。 第一章 緒論 3 外研究現(xiàn)狀 國(guó)外在本體檢索方面的研究比較早,形 成了一些較為成熟的研究成果,通過(guò)查閱文獻(xiàn)資料,國(guó)外的軍事國(guó)防、大型研究所、商業(yè)公司都對(duì)有關(guān)本體檢索進(jìn)行了研究,把一些成果應(yīng)用到具體的應(yīng)用中。 美國(guó)國(guó)防部高級(jí)研究計(jì)劃署(究了 實(shí)施的高性能知識(shí)庫(kù)系統(tǒng) (課題建立了一個(gè)基于智能學(xué)習(xí)的自適應(yīng)知識(shí)庫(kù),這個(gè)知識(shí)庫(kù)完全基于本體的組織形式的,在數(shù)據(jù)表示、存儲(chǔ)、檢索方面都基于本體庫(kù)中的概念實(shí)現(xiàn)的。 美國(guó)斯坦福大 學(xué)下屬的知識(shí)系統(tǒng)實(shí)驗(yàn)室的學(xué)者對(duì)本論的應(yīng)用、建模工具、管理等一些基礎(chǔ)層面的應(yīng)用做了許多的研究成果,學(xué)者 在 1993 年提出了本體的定義,學(xué)者 計(jì)了本體的頂層結(jié)構(gòu)。 項(xiàng)目是歐洲信息技術(shù)委員會(huì)實(shí)施的 信息社會(huì)技術(shù) 計(jì)劃中的一個(gè)課題,課題的研究是在眾多的分布式應(yīng)用系統(tǒng)中引入本體庫(kù),實(shí)現(xiàn)各種分布式資源的描述信息管理,為資源信息管理建立了一個(gè)可視化的本體維護(hù)工具。 意大利的國(guó)家生物工程研究所與 司合作完成了一項(xiàng)課題研究,研發(fā)了基于本體驅(qū)動(dòng)的網(wǎng)上在線產(chǎn)品目 錄的檢索系統(tǒng) ,系統(tǒng)通過(guò)運(yùn)用本體與專(zhuān)業(yè)數(shù)據(jù)庫(kù)集成關(guān)聯(lián),通過(guò)本體提供的概念,實(shí)現(xiàn)概念上的內(nèi)容匹配,為檢索用戶(hù)提供在選定專(zhuān)業(yè)領(lǐng)域內(nèi)的任意詞匯的組合的綜合智能檢索系統(tǒng)。 除此之外,國(guó)外許多科研學(xué)者,研發(fā)了許多面向 本體檢索系統(tǒng)。如 通過(guò)運(yùn)用分布式數(shù)據(jù)的概念的結(jié)構(gòu)化技術(shù),用戶(hù)可以在此系統(tǒng)中檢索 已經(jīng)存在的共享本體,實(shí)現(xiàn)信息的檢索。 通過(guò)查閱相關(guān)參考文獻(xiàn),近幾年來(lái)國(guó)外在有關(guān)本體研究方面由本體庫(kù)的建設(shè)研究逐漸轉(zhuǎn)為本體的應(yīng)用研究,國(guó)外的本體庫(kù)建 設(shè)已經(jīng)逐步完善,并且提供一些開(kāi)放的接口供其他科研單位使用,提高了本體庫(kù)的使用效率。隨著近幾年來(lái)互聯(lián)網(wǎng)技術(shù)的發(fā)展,基于本體的檢索系統(tǒng)不僅僅限于局部小范圍的應(yīng)用,逐步在互聯(lián)網(wǎng)信息檢索方面應(yīng)用。 第三節(jié) 論文的主要內(nèi)容 1)本論文深入研究了本體的概念、定義、應(yīng)用領(lǐng)域、采用的建模語(yǔ)言、描述語(yǔ)言以及本體的創(chuàng)建規(guī)則。提出了基于軟件工程方式的本體創(chuàng)建流程,以計(jì)第一章 緒論 4 算機(jī)圖書(shū)為例,詳細(xì)論述了需求分析、設(shè)計(jì)、形式化編碼以及本體評(píng)價(jià)的全過(guò)程。 2)結(jié)合數(shù)字圖書(shū)館的數(shù)據(jù)庫(kù)特征,設(shè)計(jì)了數(shù)字圖書(shū)館領(lǐng)域的本體形式化描述定義 ,并對(duì)本體的概念集 進(jìn)行了規(guī)范的設(shè)計(jì),提出了基于語(yǔ)義檢索要求的數(shù)字圖書(shū)館本體概念及關(guān)系的集合定義。 3)論文在研究傳統(tǒng)的數(shù)字圖書(shū)館檢索模型的基礎(chǔ)上,提出了基于本體語(yǔ)義檢索功能的改進(jìn)的數(shù)字圖書(shū)館檢索系統(tǒng)框架,設(shè)計(jì)了用戶(hù)交互層、數(shù)據(jù)管理層和本體語(yǔ)義層的不同功能應(yīng)用,提出了檢索系統(tǒng)的整體結(jié)構(gòu)模型設(shè)計(jì)。 4)深入研究了數(shù)字圖書(shū)館檢索的擴(kuò)展查詢(xún),提出了基于單關(guān)鍵詞、多關(guān)鍵詞的查詢(xún)算法和處理流程,在研究目前推理機(jī)工作機(jī)制的基礎(chǔ)上,提出并設(shè)計(jì)了基于本體概念與關(guān)系的語(yǔ)義推理模型。 5)在檢索模型設(shè)計(jì)的基礎(chǔ)上,對(duì)檢索系統(tǒng)的整體流程做了詳細(xì)的實(shí)現(xiàn) 描述,詳細(xì)描述了本體的維護(hù)、語(yǔ)義推理等技術(shù)實(shí)現(xiàn)。系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)完成后,通過(guò)輸入測(cè)試實(shí)驗(yàn)數(shù)據(jù),對(duì)比分析本系統(tǒng)與傳統(tǒng)檢索系統(tǒng),驗(yàn)證了本論文設(shè)計(jì)的檢索模型在查準(zhǔn)率和查全率兩方面優(yōu)于傳統(tǒng)檢索模型。 第四節(jié) 論文的組織與結(jié)構(gòu) 本文具體結(jié)構(gòu)如下: 第一章介紹論文的研究背景、國(guó)內(nèi)外研究現(xiàn)狀以及本文所做的工作。 第二章介紹了數(shù)字圖書(shū)館的概念,研究了本論的概念、定義、描述語(yǔ)言、構(gòu)建步驟和采用的工具,在此基礎(chǔ)上提出了數(shù)字圖書(shū)館領(lǐng)域本體的形式化描述。 第三章以計(jì)算機(jī)圖書(shū)為例介紹本體庫(kù)建設(shè)過(guò)程,提出了基于軟件工程方式的本體的創(chuàng)建流 程,詳細(xì)論述了計(jì)算機(jī)本體領(lǐng)域建設(shè)的需求分析、設(shè)計(jì)、形式化編碼以及本體評(píng)價(jià)的全過(guò)程。 第四章在研究傳統(tǒng)的數(shù)字圖書(shū)館檢索模型的基礎(chǔ)上,結(jié)合語(yǔ)義檢索的需求,設(shè)計(jì)了基于本體語(yǔ)義檢索功能的改進(jìn)的數(shù)字圖書(shū)館檢索系統(tǒng)框架,詳細(xì)設(shè)計(jì)了用戶(hù)交互層、數(shù)據(jù)管理層和本體語(yǔ)義層的不同應(yīng)用功能。 第五章對(duì)檢索系統(tǒng)的整體架構(gòu)和功能進(jìn)行實(shí)現(xiàn)的詳細(xì)描述,描述了本體的維護(hù)、語(yǔ)義推理的技術(shù)實(shí)現(xiàn)。通過(guò)樣例數(shù)據(jù)驗(yàn)證了基于本體語(yǔ)義的數(shù)字圖書(shū)館檢索模型在查準(zhǔn)率和查全率兩方面優(yōu)于傳統(tǒng)檢索模型。 第一章 緒論 5 第六章總結(jié)論文的主要內(nèi)容,總結(jié)了檢索模型的設(shè)計(jì)和實(shí)現(xiàn),對(duì)此模 型的后期改進(jìn)工作做了展望,提出了完善改進(jìn)的方向。 第二章 相關(guān)理論與技術(shù) 6 第二章 相關(guān)理論與技術(shù) 第一節(jié) 數(shù)字圖書(shū)館 圖書(shū)館作為傳播知識(shí)的載體,它一直是學(xué)者、研究人員、師生等查閱文獻(xiàn)資料、獲取知識(shí)的重要場(chǎng)所。隨著信息化技術(shù)的發(fā)展和計(jì)算機(jī)應(yīng)用普及 ,傳統(tǒng)的圖書(shū)館的服務(wù)模式逐漸向智能化方向轉(zhuǎn)變 ,尤其在檢索方式上需要更能夠達(dá)到檢索者的需求,在新的需求下,通過(guò)計(jì)算機(jī)建模實(shí)現(xiàn)圖書(shū)檢索的智能化在此背景下產(chǎn)生 9。數(shù)字圖書(shū)館突出的特征是提供信息檢索的工具,是圖書(shū)文獻(xiàn)數(shù)字化信息存儲(chǔ)和檢索的高層次的綜合應(yīng)用平臺(tái) 10。 數(shù)字圖書(shū)館與傳 統(tǒng)圖書(shū)館相比,其在信息采集、存儲(chǔ)、檢索等方面有較大提高,數(shù)字圖書(shū)館綜合了圖書(shū)訂購(gòu)入庫(kù)、數(shù)據(jù)更新、信息檢索與網(wǎng)上瀏覽等業(yè)務(wù)功能,使圖書(shū)資源實(shí)時(shí)更新,使傳統(tǒng)圖書(shū)館工作模式在信息存儲(chǔ)、管理、檢索等方面的效率得到較大的提高,最終為圖書(shū)管理人員、檢索者不受時(shí)間地點(diǎn)的限制實(shí)現(xiàn)信息的管理和檢索。數(shù)字圖書(shū)館發(fā)展的方向就是使圖書(shū)檢索模型和算法更為智能,滿(mǎn)足檢索者的需求,為讀者提供高質(zhì)量的綜合信息服務(wù) 11 第二節(jié) 本體概念 體概念 在計(jì)算機(jī)學(xué)科中,數(shù)據(jù)信息的存儲(chǔ)與管理,是計(jì)算機(jī)研究的一個(gè)熱門(mén)課題,隨 著人工智能處理信息技術(shù)的出現(xiàn),數(shù)據(jù)傳輸技術(shù)也有了突飛猛進(jìn)的發(fā)展,海量數(shù)據(jù)的出現(xiàn)使許多海量數(shù)據(jù)處理技術(shù)應(yīng)用產(chǎn)生,如何在海量數(shù)據(jù)中有效地對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化管理,提供快捷的數(shù)據(jù)獲取模式是信息處理領(lǐng)域的學(xué)者和科研人員研究的重點(diǎn)方向,本體( 概念的管理的這種模式能夠滿(mǎn)足學(xué)者們研究需求。 本體概念最初的提出是來(lái)哲學(xué)領(lǐng)域,自本體引入到計(jì)算機(jī)中,使之成為信息資源組織和語(yǔ)義表達(dá)的工具,更多地通過(guò)概念層次去表達(dá)客觀世界。目前本體在信息檢索、數(shù)據(jù)管理等科學(xué)工程領(lǐng)域得到了較為廣泛的應(yīng)用,其結(jié)構(gòu)化數(shù)據(jù)描述和概念的關(guān)系 描述使其在有關(guān)數(shù)據(jù)處理領(lǐng)域中得到全面應(yīng)用,如自然語(yǔ)言處理、情報(bào)檢索、人工智能、語(yǔ)義表述與推理等 13。 第二章 相關(guān)理論與技術(shù) 7 本體的定義的提出是經(jīng)學(xué)者們經(jīng)過(guò)多年逐步完善的,起初學(xué)者 出本體是由相關(guān)領(lǐng)域內(nèi)詞匯術(shù)語(yǔ)組成,并且通過(guò)它定義其外延規(guī)則 14 ,隨后從事知識(shí)智能研究的 本體的定義進(jìn)行了改進(jìn), 提出本體是針對(duì)概念模型的規(guī)范化表示 15, 士在 1997 年在以上學(xué)者研究的基礎(chǔ)上進(jìn)一步完善其定義,從概念共享的角度定義本體 16,研究員 出了一個(gè)至今被廣泛認(rèn)可的定義,提出 本體 的定義為:“本體是共享概念模型的明確的形式化規(guī)范說(shuō)明” 17 。 從本體的定義來(lái)分析,其包含四層含義,分別是概念模型、明確、形式化和共享?!案拍钅P汀敝竿ㄟ^(guò)計(jì)算機(jī)語(yǔ)言進(jìn)行抽象化處理,建立與現(xiàn)實(shí)世界無(wú)關(guān)的模型,能夠被計(jì)算機(jī)識(shí)別、存儲(chǔ)和處理?!懊鞔_”指通過(guò)定義,概念比較確切,各類(lèi)條件標(biāo)準(zhǔn)明確,不存在其他的語(yǔ)義。“形式化”指通過(guò)本體建立的概念及關(guān)系能夠在計(jì)算機(jī)中識(shí)別、處理?!肮蚕怼敝父拍钅軌蜃裾展矘?biāo)準(zhǔn)體系,能夠在其他研究領(lǐng)域中應(yīng)用 18 19。 體的應(yīng)用 1)本體的應(yīng)用領(lǐng)域 本體的概念 一提出來(lái),立即成為相關(guān)領(lǐng)域的概念、知識(shí)表示、管理的工具和平臺(tái),其計(jì)算機(jī)的層面的表示,為信息系統(tǒng)中概念處理的引用提供了方便的計(jì)算機(jī)處理模型,隨著本體體系結(jié)構(gòu)的不斷發(fā)展,逐漸成為數(shù)字圖書(shū)館、教育、語(yǔ)義網(wǎng)格、互聯(lián)網(wǎng)檢索等領(lǐng)域的知識(shí)管理的工具 20 21。除了本體作為知識(shí)庫(kù)管理的工具之外,越來(lái)越多的應(yīng)用體現(xiàn)在信息集成,這是因?yàn)楸倔w作為知識(shí)的表示,其存取遵循特定的標(biāo)準(zhǔn),任何信息系統(tǒng)可根據(jù)此標(biāo)準(zhǔn)實(shí)現(xiàn)本體庫(kù)的維護(hù)與存取,多個(gè)系統(tǒng)可對(duì)同一本體庫(kù)進(jìn)行操作,最終達(dá)到各個(gè)應(yīng)用領(lǐng)域的數(shù)據(jù)和知識(shí)集成的目的 22 ,這種應(yīng)用主 要體現(xiàn)在并發(fā)處理系統(tǒng)和一些商業(yè)系統(tǒng)的信息集成等方面。 根據(jù)本體的應(yīng)用范圍和應(yīng)用層面,本體的應(yīng)用功能可分為三種:信息共享、信息傳輸和信息集成。 信息共享:本體通過(guò)統(tǒng)一的描述語(yǔ)言,實(shí)現(xiàn)對(duì)知識(shí)領(lǐng)域的概念的定義,這種規(guī)范化的定義最終通過(guò)計(jì)算機(jī)語(yǔ)言來(lái)描述,使不同層面的研究人員通過(guò)這種無(wú)二義的描述完成知識(shí)概念的理解和交流,達(dá)到實(shí)現(xiàn)領(lǐng)域知識(shí)的信息共享的目的 23。 信息傳輸:本體的最終表示通過(guò)計(jì)算機(jī)描述語(yǔ)言來(lái)表示,本體庫(kù)建立后,第二章 相關(guān)理論與技術(shù) 8 各使用者通過(guò)讀取存儲(chǔ)在計(jì)算機(jī)的本體庫(kù)完成在各不同應(yīng)用的信息傳輸,同時(shí)在權(quán)限允許的條件下,一些 應(yīng)用者可以更新、完善本體庫(kù)的概念結(jié)構(gòu)和關(guān)系定義,這些方式的應(yīng)用最終實(shí)現(xiàn)信息的傳輸。 信息集成:本體庫(kù)的構(gòu)建過(guò)程采用軟件工程實(shí)施的方法和步驟,通過(guò)需求分析、設(shè)計(jì)、描述、實(shí)現(xiàn)、維護(hù)各個(gè)階段建立本體庫(kù),這種方式有利于各個(gè)應(yīng)用單位共同參與,實(shí)現(xiàn)信息的集成,同時(shí)建立的本體庫(kù)在不同的領(lǐng)域應(yīng)用系統(tǒng)中作為信息管理的基礎(chǔ)平臺(tái),通過(guò)此平臺(tái)可實(shí)現(xiàn)多應(yīng)用系統(tǒng)中的信息集成 24 。 2)本體在信息檢索中的應(yīng)用 一般來(lái)說(shuō)信息檢索的應(yīng)用要求兩個(gè)方面:第一需要最終信息的存儲(chǔ)表示,實(shí)現(xiàn)信息的存取和維護(hù),另一方面需要信息組織方式的邏輯化,各 信息的存儲(chǔ)表示能夠?yàn)檫壿嬐评硖峁┗A(chǔ)。本體是通過(guò)概念之間的語(yǔ)義關(guān)聯(lián)實(shí)現(xiàn)推理的,此特征與檢索系統(tǒng)的需求相符合 25 26。 通過(guò)本體工具,在查詢(xún)系統(tǒng)中具體應(yīng)用的步驟如下: ( 1) 構(gòu)建本體庫(kù):選取查詢(xún)的專(zhuān)業(yè)范圍或者子領(lǐng)域,通過(guò)咨詢(xún)本學(xué)科的專(zhuān)家或者由其直接參考,對(duì)領(lǐng)域內(nèi)的主題概念進(jìn)行分析、歸并,運(yùn)用本體描述語(yǔ)言建立本體庫(kù)。 ( 2)本體的存儲(chǔ):目前信息檢索的往往通過(guò)關(guān)系數(shù)據(jù)庫(kù)來(lái)實(shí)現(xiàn),本體庫(kù)建立后,為提高信息檢索的效率和本體庫(kù)的管理,需要把本體庫(kù)按照規(guī)范的標(biāo)準(zhǔn)格式進(jìn)行存儲(chǔ)。 ( 3)分析 用戶(hù)查索需求:把用戶(hù)提交 的查詢(xún)請(qǐng)求,解析成語(yǔ)義推理接受的模式,轉(zhuǎn)換成能夠借助推理機(jī)完成推理的表示,最終在數(shù)據(jù)庫(kù)中檢索能夠滿(mǎn)足檢索需求的信息。 ( 4)檢索結(jié)果處理 :把檢索的結(jié)果按照系統(tǒng)設(shè)定的規(guī)則進(jìn)行排序,根據(jù)用戶(hù)興趣度或者設(shè)定的標(biāo)準(zhǔn)實(shí)現(xiàn)檢索結(jié)果的輸出。 體的構(gòu)成 由本體的定義可知,本體包括兩部分:本體的概念和概念之間的關(guān)系。從數(shù)學(xué)角度分析, 7等人認(rèn)為本體由概念、關(guān)系、函數(shù)、公理以及實(shí)例構(gòu)成,具體描述如下: 1)概念( 指描述客觀世界中事物性質(zhì)的特征集合,能夠通過(guò)計(jì)第二章 相關(guān)理論與技術(shù) 9 算機(jī)實(shí)現(xiàn)其事件的推 理。 2)關(guān)系( 表示領(lǐng)域內(nèi)概念之間存在的相互作用,用數(shù)學(xué)語(yǔ)言描述為: : . . . . . 3 )函數(shù)( , 表 示 關(guān) 系 的 一 種 特 例 , 其 定 義 為 F : . . . . . 4)公理 (表示其定義的規(guī)則是永遠(yuǎn)成立的,不需要證明的,常用來(lái)表示概念的屬性和關(guān)系的一些約定規(guī)則。 5)實(shí)例 (用來(lái)表示概念的一些具體的對(duì)象。如 體的描述語(yǔ)言 1) 本體描述語(yǔ)言的特征 本體的最終服務(wù)對(duì)象是檢索系統(tǒng),從表示的結(jié)構(gòu)分析,其結(jié)果能夠被計(jì)算機(jī)接受和處理,為此本體描述語(yǔ)言必須具備以下特征: ( 1)具備規(guī)范、精確的語(yǔ)法定義規(guī)則( 2)具備規(guī)范、精確的語(yǔ)義定義( 3)能夠支持邏輯推理( 4)具備強(qiáng)大的信息表達(dá)能力和處理規(guī)則 ( 5)表示形式易讀,方便維護(hù)。 2) 本體描述語(yǔ)言的類(lèi)別 從應(yīng)用領(lǐng)域和范圍來(lái)看,本體描述語(yǔ)言可分為基于 ( 1)基于 理應(yīng)用,以標(biāo)記語(yǔ)言作為基礎(chǔ),通過(guò)這種開(kāi)放性的語(yǔ)言表示概念的存儲(chǔ)和 處理,具有代表性的有以下幾種: 8、 ) 29、0、 1。 ( 2)基于人工智能處理的本體語(yǔ)言:此種描述規(guī)則為自行定義,沒(méi)有嚴(yán)格的統(tǒng)一標(biāo)準(zhǔn),但定的規(guī)則能夠被自行編寫(xiě)的程序識(shí)別和處理,如 233,這是一種本體的形式化定義, 4助一些邏輯謂詞用以概念的表示,這些本體語(yǔ)言一般都是根據(jù)各自的專(zhuān)業(yè)項(xiàng)目研究的描述規(guī)則,不具有開(kāi)放、共享性。 3) 采用的標(biāo)準(zhǔn) 在實(shí)際應(yīng)用中,本體描述語(yǔ)言一般有兩種:形式化和非形式化。非形式化方 式中可用自然語(yǔ)言描述本體,同時(shí)也可采用一些規(guī)范定義和標(biāo)準(zhǔn)來(lái)描述本體,第二章 相關(guān)理論與技術(shù) 10 如常見(jiàn)的語(yǔ)義網(wǎng)、資源框架等,比如與本體有關(guān)的語(yǔ)言標(biāo)準(zhǔn)有: 7語(yǔ)言標(biāo)準(zhǔn)包括了從網(wǎng)絡(luò)數(shù)據(jù)的表示、顯示處理、數(shù)據(jù)集成、數(shù)據(jù)傳遞的各個(gè)階段的 的應(yīng)用,不同的操作系統(tǒng)平臺(tái)通過(guò) 現(xiàn)信息的交換和共享,具體標(biāo)準(zhǔn)包括基于 過(guò)結(jié)構(gòu)化的標(biāo)記語(yǔ)言,把數(shù)據(jù)結(jié)構(gòu)和屬性分開(kāi)表示,語(yǔ)義的定義通過(guò)規(guī)則約束來(lái)實(shí)現(xiàn)的,一般通過(guò) 結(jié)構(gòu)定義,實(shí)現(xiàn)其與本體的概念結(jié)構(gòu)相關(guān)聯(lián),然后利用文檔結(jié)構(gòu)中數(shù)據(jù)內(nèi)容的表示將 數(shù)據(jù)項(xiàng)與本體的概念相關(guān)聯(lián),最終實(shí)現(xiàn)對(duì)本體中的概念及其關(guān)系的描述,具體操作通過(guò) 現(xiàn)。 隨著本體概念的不斷完善, 能滿(mǎn)足描述的要求,為此 出了一種采用元語(yǔ)方式實(shí)現(xiàn)描述本體的方法,即通過(guò) 述簡(jiǎn)單的本體, 一種基于三元組框架容器,它也是基于式實(shí)現(xiàn)數(shù)據(jù)的語(yǔ)義定義,數(shù)據(jù)采用 “ 資源 屬性值 ”形式,此結(jié)構(gòu)能夠完全基于計(jì) 算處理的。 表示本體方面具有很大的不同,在 通過(guò)定義約束規(guī)則描述本體,而 通過(guò)標(biāo)準(zhǔn)化的元語(yǔ)或元語(yǔ)組合來(lái)實(shí)現(xiàn)的, 構(gòu)的轉(zhuǎn)換機(jī)制實(shí)現(xiàn)最終 檔的生成,完成本體的描述。 雖然 本體描述方面功能有較大的提高,但隨著各領(lǐng)域?qū)Ρ倔w的語(yǔ)義推理的要求的規(guī)范化,一些弊端顯示出來(lái),其表示不能準(zhǔn)確地表示各概念之間的語(yǔ)義關(guān)系,為解決此弊端, 2001 年 計(jì)制定了 目前已成為行業(yè)標(biāo) 準(zhǔn),通過(guò) 夠明確的表示概念含義及其之間的關(guān)系,與其他的描述語(yǔ)言相比, 通過(guò)更多的技術(shù)機(jī)制來(lái)實(shí)現(xiàn)語(yǔ)義的表達(dá)。 體庫(kù)建立 本體庫(kù)的建立方法一直是眾多學(xué)者研究的熱點(diǎn),由于本體面向特定的專(zhuān)業(yè)領(lǐng)域,需要一套規(guī)范的、可行的技術(shù)路線作為指導(dǎo),依照此路線或標(biāo)準(zhǔn)建設(shè)本體庫(kù)。 截止目前為止,國(guó)際上還未建立一套被普通認(rèn)可的方法,但各個(gè)學(xué)者根據(jù)各自的項(xiàng)目、課題提出了一些原則、步驟和方法,一些學(xué)者提出了本體構(gòu)建的第二章 相關(guān)理論與技術(shù) 11 規(guī)范,通過(guò)這些規(guī)范能夠使建立的本體庫(kù)在概念表示、語(yǔ)義處理方面更加規(guī)范,方便了應(yīng)用系統(tǒng)的推理。雖然 目前尚未形成一套標(biāo)準(zhǔn)的本體構(gòu)建方法,但 前較為廣泛地應(yīng)用于本體庫(kù)的構(gòu)建工作中,其五條規(guī)則包括:明確性和客觀性、完整性、一致性、可擴(kuò)充性、最少約束。 在眾多的領(lǐng)域本體構(gòu)建的方法中,斯坦福大學(xué)制定的七步法被廣泛采用,構(gòu)建步驟為: 1)分析本體所在的專(zhuān)業(yè)領(lǐng)域,劃定知識(shí)結(jié)構(gòu)范圍; 2)考慮是否能夠重用已經(jīng)存在的本體庫(kù); 3)詳細(xì)列舉、描述出本體構(gòu)建領(lǐng)域的重要專(zhuān)業(yè)術(shù)語(yǔ); 4)選擇本體描述語(yǔ)言和支撐環(huán)境; 5)定義本體中的概念的屬性及其關(guān)系;6)定義概念的屬性中存在的約 束條件; 7)構(gòu)建概念的實(shí)例化。 第三節(jié) 數(shù)字圖書(shū)館領(lǐng)域本體的形式化描述 本體可通過(guò)形式化進(jìn)行定義描述,通過(guò)描述可以表示概念、屬性、關(guān)系,定義描述是本體存存和語(yǔ)義推理的基礎(chǔ)。在本節(jié)中以計(jì)算機(jī)圖書(shū)的一部分概念子集為例說(shuō)明本體的形式化描述。 計(jì)算機(jī)圖書(shū)館領(lǐng)域本體的本體為 包括概念集、屬性集、概念之間的關(guān)系、概念層次、推理規(guī)則。 假定本體定義 ,H,A,R,A, O n t o l o g y c其中, 計(jì)算機(jī)概念集合, 個(gè)概 念對(duì)應(yīng)一個(gè)屬性集, 于表示計(jì)算機(jī)概念之間的關(guān)系集合, 個(gè)關(guān)系對(duì)應(yīng)一個(gè)集合, 于表示計(jì)算機(jī)圖書(shū)概念的概念層次, 于表示推理規(guī)則或者公理。 下面通過(guò)選取計(jì)算機(jī)頂級(jí)的幾個(gè)概念說(shuō)明描述的方法: 1)概念集合 計(jì)算機(jī)基礎(chǔ)理論與方法、基礎(chǔ)知識(shí)概念、計(jì)算機(jī)硬件知識(shí)、計(jì)算機(jī)軟件知識(shí) 2)概念的屬性集 = 計(jì)算機(jī) 基礎(chǔ)理論與方法 ), C 基礎(chǔ)知識(shí)概念 ), C 計(jì)算機(jī)硬件知識(shí) ), 計(jì)算機(jī)軟件知識(shí) ) 第二章 相關(guān)理論與技術(shù) 12 其中: 計(jì)算機(jī)基礎(chǔ)理論與方法 ) = 計(jì)算機(jī)編譯理論、離散數(shù)學(xué)、自動(dòng)機(jī)理論、程序算法、系統(tǒng)結(jié)構(gòu) 基礎(chǔ)知識(shí)概念 ) = 設(shè)備安全、系統(tǒng)的軟硬備份、數(shù)據(jù)庫(kù)的安全操作、數(shù)據(jù)加密、計(jì)算機(jī)日常維護(hù) 計(jì)算機(jī)硬件知識(shí) ) =處理器、存儲(chǔ)設(shè)備、輸入輸出設(shè)備 計(jì)算機(jī)軟件知識(shí) ) =操作系統(tǒng)、應(yīng)用系統(tǒng)、程序語(yǔ)言、算法設(shè)計(jì) 3)概念之間的關(guān)系 由于計(jì)算機(jī)概念比較多,為表示概念之間的關(guān)系,在計(jì)算機(jī)其他概念作為說(shuō)明。 聯(lián)網(wǎng)), 構(gòu)化查詢(xún)語(yǔ)言), 件開(kāi)發(fā), 需求分析 ), 網(wǎng)絡(luò),局域網(wǎng)), 4)關(guān)系的屬 性 = = 同義領(lǐng)域 = 部分關(guān)系 5)概念層次結(jié)構(gòu) ( 6)推理規(guī)則或公理 推理規(guī)則是推理的基礎(chǔ),假如用 )表示概 念 ,其中的取值為 0 用 示概念 關(guān)系( 屬性 如同義關(guān)系的相關(guān)度為 1,則表示 2, 1)。如 聯(lián)網(wǎng)) =1。 第二章 相關(guān)理論與技術(shù) 13 第四節(jié) 本章小節(jié) 本章為相關(guān)知識(shí)和技術(shù)介紹部分,研究了本體的概念、定義、應(yīng)用領(lǐng)域、采用 的建模語(yǔ)言、描述語(yǔ)言以及本體的創(chuàng)建規(guī)則,這些知識(shí)為后面的本體的建立和系統(tǒng)的設(shè)計(jì)提供基礎(chǔ)。 第三章 計(jì)算機(jī)圖書(shū)本體庫(kù)建設(shè) 14 第三章 計(jì)算機(jī)圖書(shū)本體庫(kù)建設(shè) 第一節(jié) 計(jì)算機(jī)本體庫(kù)的構(gòu)建背景 本課題是研究基于本體語(yǔ)義的數(shù)字圖書(shū)館查詢(xún)系統(tǒng),本體庫(kù)的建設(shè)是課題研究的重要內(nèi)容,從前面的相關(guān)知識(shí)理論可以知道,本體庫(kù)是以專(zhuān)業(yè)領(lǐng)域中的知識(shí)概念為基礎(chǔ)實(shí)現(xiàn)語(yǔ)義上的知識(shí)庫(kù)的組織,課題本體庫(kù)是服務(wù)于數(shù)字圖書(shū)館數(shù)據(jù)檢索的,很顯然,目前數(shù)字圖書(shū)館數(shù)據(jù)庫(kù)中存儲(chǔ)的專(zhuān)業(yè)門(mén)類(lèi)和領(lǐng)域復(fù)雜,知識(shí)分類(lèi)比較龐雜,建設(shè)一個(gè)基于全部專(zhuān)業(yè)領(lǐng)域的本體庫(kù)是一件不可能完成的, 因此在課題的研 究過(guò)程中,以選取一個(gè)專(zhuān)業(yè)、學(xué)科的某一分支的知識(shí)為例進(jìn)行本體庫(kù)的搭建是切實(shí)可行的。 基于論文的作者的專(zhuān)業(yè)知識(shí),本論文以計(jì)算機(jī)類(lèi)圖書(shū)為例,結(jié)合相關(guān)參考文獻(xiàn),對(duì)現(xiàn)有的計(jì)算機(jī)類(lèi)的主要概念進(jìn)行提取、合并,構(gòu)建語(yǔ)義上的關(guān)系來(lái)實(shí)現(xiàn)計(jì)算機(jī)圖書(shū)本體庫(kù)。論文中本體庫(kù)的構(gòu)建的數(shù)據(jù)來(lái)源于作者所在高校的圖書(shū)館數(shù)據(jù)庫(kù),在構(gòu)建過(guò)程中,作者參考了中國(guó)文獻(xiàn)編目規(guī)則 38和 計(jì)算機(jī)科學(xué)技術(shù)漢語(yǔ)敘詞表 39,對(duì)計(jì)算機(jī)專(zhuān)業(yè)概念的術(shù)語(yǔ)、詞匯進(jìn)行規(guī)范化處理。 第二節(jié) 本體庫(kù)采用的語(yǔ)言和工具 論文本體庫(kù)構(gòu)建時(shí)采用的描述語(yǔ)言為 計(jì)的規(guī)范的基于專(zhuān)業(yè)領(lǐng)域的語(yǔ)言標(biāo)準(zhǔn), 它能夠準(zhǔn)確地表示出概念主題詞的含義及其之間的關(guān)系,能夠支持多種推理機(jī),開(kāi)發(fā)者可以通過(guò)其提供的程序二次開(kāi)發(fā)編程接口實(shí)現(xiàn)對(duì)本體庫(kù)的操作。在課題研究中,我們通過(guò)運(yùn)用 計(jì)算機(jī)的專(zhuān)業(yè)詞匯進(jìn)行了準(zhǔn)確的描述,并且設(shè)計(jì)了概念之間的關(guān)系。 本體庫(kù)構(gòu)建采用了斯坦福大學(xué)設(shè)計(jì)開(kāi)發(fā)的 0,目前它已經(jīng)被廣泛使用,成為本體庫(kù)開(kāi)發(fā)者的普通選用的工具,它支持 言,給創(chuàng)建者提供了本體的概念類(lèi)、屬性、關(guān)系和實(shí)例的構(gòu)建,其構(gòu)建過(guò)程與具體的描述語(yǔ)言無(wú)關(guān)的。 第三章 計(jì)算機(jī)圖書(shū)本體庫(kù)建設(shè) 15 第三節(jié) 計(jì) 算機(jī)本體庫(kù)的構(gòu)建步驟 由第二章相關(guān)理論內(nèi)容可以知道,本體庫(kù)構(gòu)建過(guò)程一般分為七步法來(lái)完成,每個(gè)過(guò)程清晰明確,但在課題項(xiàng)目的設(shè)計(jì)時(shí),發(fā)現(xiàn)其過(guò)程不是建立在工程實(shí)踐的基礎(chǔ)上的,為達(dá)到構(gòu)建本體庫(kù)的創(chuàng)建過(guò)程的流程化,使本體的設(shè)計(jì)、創(chuàng)建、維護(hù)工作減少工作量,實(shí)現(xiàn)其標(biāo)準(zhǔn)化,為此我們?cè)谡n題研究時(shí)提出了一種借鑒計(jì)算機(jī)學(xué)科中軟件工程中的項(xiàng)目設(shè)計(jì)開(kāi)發(fā)步驟來(lái)完成本體庫(kù)構(gòu)建的,這種方法是參考了傳統(tǒng)的七步法和軟件工程方法,具體步驟如圖 示。 圖 體庫(kù)構(gòu)建步驟 本體專(zhuān)業(yè)領(lǐng)域的確定 本體構(gòu)建規(guī)劃 本體信息的獲取 需求分析階段 列舉本體中的重要術(shù)語(yǔ) 定義類(lèi)及其繼承關(guān)系 定義屬性和關(guān)系 設(shè)計(jì)階段 定義屬性的限制 定義實(shí)例 形式化編碼 本體的評(píng)價(jià) 第三章 計(jì)算機(jī)圖書(shū)本體庫(kù)建設(shè) 16 求分析階段 1)本體專(zhuān)業(yè)領(lǐng)域的確定 近年來(lái)隨著計(jì)算機(jī)應(yīng)用的普及,計(jì)算機(jī)專(zhuān)業(yè)知識(shí)已經(jīng)成為一個(gè)應(yīng)用范圍較廣的知識(shí)體系。論文建設(shè)的計(jì)算機(jī)領(lǐng)域本體是其中一個(gè)子集,由于計(jì)算機(jī)專(zhuān)業(yè)門(mén)類(lèi)較為龐大,信息量大,不可能把全部的計(jì)算機(jī)知識(shí)點(diǎn)都考慮進(jìn)去,并且本體庫(kù)需要更新維護(hù)的,需要一個(gè)更新維護(hù)、不斷完善的過(guò)程。本論文的本體庫(kù)構(gòu)建好之后,將提供給語(yǔ)義檢索的用戶(hù),通過(guò)本體對(duì)輸入的關(guān)鍵詞進(jìn)行語(yǔ)義擴(kuò)展,提高查全率。 2)本體構(gòu)建規(guī)劃 本體構(gòu)建規(guī)劃分為三個(gè)階段: 第一階段:確定本體領(lǐng)域,收集專(zhuān)業(yè)領(lǐng)域內(nèi)的詞匯表。 第二階段 :對(duì)前一段收集的詞匯進(jìn)行整理取舍,以概念的形式表示,在本階段詳細(xì)設(shè)計(jì)和形式化編碼,完成后需要進(jìn)一步實(shí)施本體評(píng)價(jià)。 第三階段:屬于本體庫(kù)完善的過(guò)程,由本體庫(kù)維護(hù)人員根據(jù)學(xué)科的不斷發(fā)展,吸取新出現(xiàn)的專(zhuān)業(yè)詞匯,補(bǔ)充到本體概念中,并且刪除一些過(guò)時(shí)的概念。 3)本體信息的獲取 在本階段,以作者所在高校的圖書(shū)館的數(shù)據(jù)庫(kù)中計(jì)算機(jī)類(lèi)圖書(shū)中的主題詞為基礎(chǔ)進(jìn)行分析、歸類(lèi),結(jié)合計(jì)算機(jī)專(zhuān)業(yè)的漢語(yǔ)敘詞表,把這些概念合同整理后,得到本體信息的基礎(chǔ)數(shù)據(jù)。 計(jì)階段 1)列舉本體中重要的術(shù)語(yǔ) 由于計(jì)算機(jī)領(lǐng)域知識(shí)繁雜,分類(lèi)較多, 本體的頂層結(jié)構(gòu)的劃分是個(gè)比較復(fù)雜的問(wèn)題,作者根據(jù)計(jì)算機(jī)學(xué)科的框架結(jié)構(gòu),把計(jì)算機(jī)本體的頂層結(jié)構(gòu)劃分為四部分:計(jì)算機(jī)基礎(chǔ)理論與方法、基礎(chǔ)知識(shí)概念、計(jì)算機(jī)硬件知識(shí)以及計(jì)算機(jī)軟件知識(shí)。其結(jié)構(gòu)圖 示。 計(jì)算機(jī)基礎(chǔ)理論與方法是針對(duì)有關(guān)計(jì)算機(jī)理論方面的概念的集合,一般集中在計(jì)算理論、組合數(shù)學(xué)、算法等相關(guān)課程。 基礎(chǔ)知識(shí)問(wèn)題一般包括計(jì)算機(jī)方面的日常維護(hù)知識(shí),具體包括計(jì)算機(jī)設(shè)計(jì)方面的工藝、日常維護(hù)和檢修方面的知識(shí)。計(jì)算硬件知識(shí)主要針對(duì)計(jì)算機(jī)體系結(jié)構(gòu)、計(jì)算機(jī)組成原理課程涉及的相關(guān)概念。具體性能計(jì)算、體系結(jié)構(gòu)、硬件第三章 計(jì)算機(jī)圖書(shū)本體庫(kù)建設(shè) 17 結(jié)構(gòu)等。 計(jì)算機(jī)軟件知識(shí)主要從軟件工程、操作系統(tǒng)、程序設(shè)計(jì)等課程組合的相關(guān)知識(shí)等。 圖 算機(jī)本體庫(kù)概念結(jié)構(gòu) 以上分類(lèi)是作者在自己的計(jì)算機(jī)知識(shí)結(jié)構(gòu)的基礎(chǔ)上,再通過(guò)征求老師意見(jiàn)形成的框架結(jié)構(gòu),基本涵蓋了計(jì)算機(jī)領(lǐng)域的知識(shí),以上框架的分類(lèi)不是唯一的,在本課題研究中,采用了以上框架結(jié)構(gòu)設(shè)計(jì)了計(jì)算機(jī)本體庫(kù)。 ( 1)計(jì)算機(jī)理論與方法概念 本論文本體庫(kù)劃定的計(jì)算機(jī)理論與方法概念主要面向一些計(jì)算機(jī)學(xué)科的基礎(chǔ)理論,包括計(jì)算機(jī)編譯理論、離散數(shù)學(xué)、自動(dòng)機(jī)理論、程序算法、系統(tǒng)結(jié)構(gòu)等。 ( 2)基礎(chǔ)知識(shí)概念 本論文本體庫(kù)劃定的基礎(chǔ)知識(shí) 概念主要指一些有關(guān)計(jì)算機(jī)硬件工藝設(shè)計(jì)、制造、硬件檢測(cè)和故障排查等方面的概念。具體包括計(jì)算機(jī)的設(shè)備安全、系統(tǒng)的軟硬備份、數(shù)據(jù)庫(kù)的安全操作、數(shù)據(jù)的加密和計(jì)算機(jī)日常維護(hù)等知識(shí)。 第三章 計(jì)算機(jī)圖書(shū)本體庫(kù)建設(shè) 18 ( 3)計(jì)算硬件知識(shí)概念 本論文本體庫(kù)劃定的計(jì)算硬件知識(shí)概念主要硬件數(shù)字電路、邏輯電路等方面的知識(shí);具體包括計(jì)算機(jī)基礎(chǔ)組成的處理器、存儲(chǔ)設(shè)備、輸入輸出設(shè)備等方面的概念知識(shí);還包括有關(guān)網(wǎng)絡(luò)的硬件資源,如 域網(wǎng)、城域網(wǎng)、局域網(wǎng)絡(luò)等方面的網(wǎng)絡(luò)設(shè)備知識(shí)概念,如網(wǎng)卡、集線器、路由器等。 ( 4)計(jì)算軟件知識(shí)概念 本論文本體庫(kù)劃定的計(jì)算 軟件知識(shí)概念主要包括操作系統(tǒng)、應(yīng)用系統(tǒng)、程序語(yǔ)言、算法設(shè)計(jì)等,另外還包括計(jì)算機(jī)網(wǎng)絡(luò)的軟件資源,如網(wǎng)絡(luò)的操作系統(tǒng)、網(wǎng)絡(luò)協(xié)議、網(wǎng)絡(luò)算法等。 2)定義類(lèi)及其繼承關(guān)系 本體中的類(lèi)的繼承結(jié)構(gòu)可采用自頂向下或自底向上的方法,從層次結(jié)構(gòu)模式中可采用自頂向下的方法,先建立頂層開(kāi)涮,然后逐步添加其下屬子概念,最終完成所有子類(lèi)的定義,例如“計(jì)算機(jī)軟件知識(shí)”概念中的“程序設(shè)計(jì)”、“操作系統(tǒng)”、“應(yīng)用軟件”等這些概念形成了“ 系,可把其作為“計(jì)算機(jī)軟件
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年五年級(jí)上學(xué)期英語(yǔ)教師工作總結(jié)范例(二篇)
- 2025年產(chǎn)品銷(xiāo)售運(yùn)輸三方協(xié)議(2篇)
- 2025年亮化工程施工合同標(biāo)準(zhǔn)版本(4篇)
- 2025年臨時(shí)人員勞動(dòng)合同常用版(2篇)
- 2025年個(gè)人購(gòu)買(mǎi)墓地協(xié)議(2篇)
- 旗艦店鋪內(nèi)墻裝修工程協(xié)議
- 2025年度安全生產(chǎn)費(fèi)用使用監(jiān)督合同
- 2025年度城市綜合體安全保衛(wèi)服務(wù)合同范本
- 化妝品運(yùn)輸保險(xiǎn)協(xié)議樣本
- 繩鋸切割樓板施工方案
- 山西省太原市2024-2025學(xué)年九年級(jí)上學(xué)期期末歷史試題(含答案)
- 2024年全國(guó)體育專(zhuān)業(yè)單獨(dú)招生考試數(shù)學(xué)試卷試題真題(含答案)
- 2025屆高三八省聯(lián)考語(yǔ)文試卷分析 課件
- 2025年江蘇連云港灌云縣招聘“鄉(xiāng)村振興專(zhuān)干”16人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年度檢修計(jì)劃
- 2024-2025學(xué)年冀教版數(shù)學(xué)五年級(jí)上冊(cè)期末測(cè)試卷(含答案)
- 商業(yè)綜合體市場(chǎng)調(diào)研報(bào)告
- 資源枯竭型城市的轉(zhuǎn)型發(fā)展 課件 2024-2025學(xué)年高二上學(xué)期地理人教版選擇性必修2
- 少兒素描課件
- 2025屆河北省衡水市衡水中學(xué)高考仿真模擬英語(yǔ)試卷含解析
- 天津市部分區(qū)2023-2024學(xué)年高二上學(xué)期期末考試 生物 含解析
評(píng)論
0/150
提交評(píng)論