


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
常見的信息檢索技術與文獻檢索應用,文獻檢索論文檢索技術的應用是在圖書館建設發(fā)展經(jīng)過中對電子資源查詢和整合的重要方式,也是提高學生信息素養(yǎng)和技能的必要手段。因而,檢索技術的應用是教育界特別關注的課題。1高校文獻檢索技術的發(fā)展情況從當前來看,我們國家多數(shù)高校圖書館電子資源建設及其文獻檢索教學處在一個相對基礎的階段,檢索技術運用程度還很粗淺,并不能全面知足用戶的需求。因而,非常有必要對當下幾種重要的檢索技術進行分析討論,以此提升電子資源建設中檢索技術運用的程度,進而讓用戶快速有效查詢其所需要的信息,假如高校圖書館想實現(xiàn)這一目的,首先要對圖書館數(shù)字資源建設中存在的分布式異構存儲問題進行解決。唯有真正的解決了這個問題,才能夠為用戶提供一體化服務體驗,進而全面知足用戶的需求。2當前常見的信息檢索技術2.1SFX技術SFX即通常所講的特效。這是一種新型的數(shù)字資源聚合軟件系統(tǒng)。其最早是由比利時的H薩姆堡爾等人提出。后隨著更多學者的參加,才實現(xiàn)了該信息系統(tǒng)建設方面的進一步優(yōu)化。這種技術的誕生在行業(yè)內(nèi)備受關注,同時也吸引了眾多數(shù)字圖書館的目光。當前在全球來講,使用這種技術的用戶已經(jīng)到達了將近2000家。作為一種相對成熟的聚合技術,SFX發(fā)展基于OpenURL協(xié)議展開。借助這個協(xié)議,能夠?qū)崿F(xiàn)將各種復雜的數(shù)據(jù)進行整合,進而將數(shù)據(jù)的檢索方式統(tǒng)一化[1].用戶在進行資源的使用和處理的經(jīng)過中能夠?qū)崿F(xiàn)對資源的不同轉(zhuǎn)化。從一種資源轉(zhuǎn)化到另外一種資源。借助這種OpenURL協(xié)議,用戶只需要簡單的幾步處理就能夠?qū)崿F(xiàn)資源的搜索。而OpenURL協(xié)議的優(yōu)勢表如今下面幾個方面:1〕OpenURL技術通過協(xié)議實現(xiàn)數(shù)字資源的無限擴大,任何資源都能夠能夠通過這種方式實現(xiàn)鏈接聚合;2〕在進行檢索的經(jīng)過中,OpenURL協(xié)議的使用能夠更好的實現(xiàn)資源間的互補兼容,提升整個信息資源搜索的效率。3〕在進行信息資源處理的經(jīng)過中,運用OpenURL協(xié)議還能夠更好的進行不同的兼容互補,進而更好的實現(xiàn)對元數(shù)據(jù)信息的處理,提升數(shù)據(jù)搜索效果,同時實現(xiàn)鏈接的動態(tài)處理效果。4〕在進行信息資源的搜索處理經(jīng)過中,不需要過多的關注細節(jié)方面的內(nèi)容,只需要進行簡單的管理機制的設置就能夠?qū)崿F(xiàn)數(shù)據(jù)信息的搜集與處理。5〕在智能化的實現(xiàn)方面,由最初的能夠進行單一的檢索到復合檢索功能的有效實現(xiàn)。用戶在檢索的經(jīng)過中只需要通過一次檢索,就能檢索出所有與要檢索內(nèi)容相關的信息。因而在這個背景下,整個檢索技術的實現(xiàn)更為人性化也愈加智能化。2.2WebService技術WebService是源于互聯(lián)網(wǎng)技術發(fā)展,以分布式為基礎的模塊組建[2].通過技術的運用,能夠在更多的平臺之間實現(xiàn)良好的信息溝通與互動。其工作的范疇主要是實現(xiàn)不同信息系統(tǒng)間的信息分享。詳細來講,其必須通過URL來實現(xiàn)接口的最終發(fā)布,同時在實現(xiàn)的經(jīng)過中還需要依循一定的行業(yè)技術標準來實現(xiàn)。除此之外在進行詳細操作的經(jīng)過中,使用WebService最大的優(yōu)勢在于能夠更好的對不同平臺間的差異信息加以融合,進而更好的實現(xiàn)平臺的互通。除此之外在信息的處理方面也有助于更好的進行數(shù)字信息資源的綜合和協(xié)調(diào),將不同的信息平臺以及不同系統(tǒng)間的信息搜索內(nèi)容加以更為有效的管控,進而實現(xiàn)信息處理的優(yōu)勢化成果。所以WebService資源的使用,其根本的目的在于將所有的信息處理后通過一個統(tǒng)一的平臺或者是構造形式予以表現(xiàn),進而一方面更好的實現(xiàn)不同資源間的互通,另一方面也有效的提升數(shù)字資源處理以及資源分享的成效。從構造的層面來講,WebService的構造則是統(tǒng)一的包含了服務的請求方、提供方以及注冊中心三方面的內(nèi)容。借助這種構造能夠更好的實現(xiàn)不同信息間互通有無,同時也實現(xiàn)良好的信息操作與處理功能。在進行該平臺操作經(jīng)過中,華而不實還牽涉到一些相關技術的應用,諸如網(wǎng)絡服務描繪敘述語言,以及聚合技術,等等,這些都是構成WebService順暢運行的重要技術內(nèi)容。在整個體系底部,最基礎的是數(shù)據(jù)資源信息,而每個數(shù)據(jù)資源之間都是相對獨立的,其進行信息的提供也都是通過相對獨立的數(shù)據(jù)支撐來實現(xiàn)的。而在進行信息檢索實現(xiàn)經(jīng)過中,本地搜索到的信息就是這些內(nèi)容。除了基礎信息之外,針對于各種不同的數(shù)據(jù)庫信息處理還有一些其它信息資源庫。這些資源庫通過一定的接口與本地信息資源庫相連接,用戶在進行信息搜索經(jīng)過中能夠使用本地系統(tǒng)資源來實現(xiàn)對其它與之相接口數(shù)據(jù)庫信息的讀取。所以WebService能夠?qū)崿F(xiàn)不同資源間的聚合調(diào)用,能夠有效的對圖書館數(shù)據(jù)資源整合及處理。2.3P2P技術P2P技術是從屬于互聯(lián)網(wǎng)覆蓋層網(wǎng)絡而存在的。其主要是在信息處理的經(jīng)過中,通過一定的技術手段,實現(xiàn)不同的信息主體間對等的信息溝通與溝通。在P2P技術的實現(xiàn)環(huán)境中,任何一臺與之連接的計算機都能夠?qū)崿F(xiàn)信息資源及時有效的分享,而這種信息資源的分享是通過最終技術支撐來實現(xiàn)的。當前在P2P構造實現(xiàn)的經(jīng)過中,包含了基本的構成構造,分別是樹形構造、DHT也稱哈希表構造,以及網(wǎng)絡構造。根據(jù)需求的不同,這些構造的詳細應用也存在一定程度的差異。P2P技術分類方式很多,能夠是通過服務器建設與否進行區(qū)分,可以以通過網(wǎng)絡中存儲內(nèi)容與網(wǎng)絡拓撲構造的相關性進行區(qū)別,同時可以以通過匿名性來進行區(qū)分等。通過這些方式的區(qū)分,最終來對整個P2P技術實現(xiàn)有層次、有規(guī)則的技術分類。2.4Grid技術Grid技術又稱作是網(wǎng)格技術,這一技術的出現(xiàn)是依托于電力網(wǎng)的概念產(chǎn)生的,它是一種相對靈敏、多變的信息處理形式。Grid技術的實現(xiàn)是將所有的計算機通過一個網(wǎng)絡聯(lián)絡在一起,進而實現(xiàn)不同信息技術的整合,以及資源的有效化利用。在整個經(jīng)過中,其具有多方面的優(yōu)勢,包含了資源的分享,知識的生產(chǎn),以及開放存儲等多方面的信息[3].在當下學術界中,與網(wǎng)格應用相關的內(nèi)容特別豐富,包含了遠程分布式計算與通信系統(tǒng)和地球系統(tǒng)格網(wǎng)系統(tǒng),除此之外在地震工程方面還有TeraGrid和國家地震工程仿真格網(wǎng),等等。就我們國家的現(xiàn)在狀況來講,主要的Grid技術落實多是在科研領域以及制造領域等四個領域中進行廣泛的應用。同時在數(shù)字圖書館的建設方面,Grid技術也有著特別突出的表現(xiàn)。諸如信息數(shù)據(jù)的處理,以及分享信息的實現(xiàn)等,通過這種技術來進行數(shù)字圖書館的建設,對整個數(shù)據(jù)資源的利用和處理都有著特別重要的作用。3文獻檢索技術的實際運用我們國家高校圖書館進行數(shù)字資源建設必須運用下面幾個方面的文獻檢索技術才能夠真正知足用戶需求。3.1數(shù)據(jù)挖掘agent數(shù)據(jù)挖掘階段是整個信息系統(tǒng)運行和實現(xiàn)的核心階段。在這個階段的處理經(jīng)過中,首先需要確定整個挖掘的目的和任務。確立了這些任務之后,還要進行詳細挖掘工作實現(xiàn)的計算方式。在施行的經(jīng)過中,即使是同樣的一種挖掘工作,其實現(xiàn)方式、計算方式也會有著多種不同的形態(tài)。比方在進行數(shù)據(jù)挖掘處理的經(jīng)過中,包含了兩個基本的要素,一是根據(jù)資源的詳細特點來進行處理,根據(jù)資源的詳細特點來進行算法的選擇與應用;其次是在詳細實踐的經(jīng)過中,也需要用戶的介入。也就是講在處理數(shù)據(jù)的經(jīng)過中必需要用戶能夠立即實現(xiàn)的方式來進行計算。通過這種計算導致的結(jié)果也是能夠知足用戶需求的內(nèi)容。有一部分用戶在使用計算形式的經(jīng)過中,其目的并非只是得到一個簡單的結(jié)果,更多的是希望獲取更為精準的預測內(nèi)容。在數(shù)據(jù)挖掘的經(jīng)過中,常講的KDD更多的是指在數(shù)據(jù)中的知識內(nèi)容。也就是用戶在進行信息搜索的經(jīng)過中,需要從整個的信息資源處理中去發(fā)現(xiàn)信息,進而進行合理化的處理,促使信息的內(nèi)容能夠充分知足數(shù)據(jù)處理的有用性[4].詳細來講,在詳細的數(shù)據(jù)處理之前就要進行數(shù)據(jù)挖掘方式的界定,同時根據(jù)這種挖掘方式找尋與之相適應的發(fā)現(xiàn)方式。一般講來,在進行數(shù)據(jù)挖掘的經(jīng)過中,更多的是針對整個項目信息層面內(nèi)容的挖掘,而較少牽涉到一些詳細圖片信息的挖掘。所以在進行數(shù)據(jù)挖掘的經(jīng)過中,每個任務或者形式的實現(xiàn)都必須知足基本的要求,這樣有助于挖掘更好的實現(xiàn)。詳細的內(nèi)容如下:N=﹛X1,X2,Xn﹜指的是在集合中存在有n個不同的結(jié)點。將華而不實〔Xi,Xj〕定義為一條邊,進而在形式的具體表現(xiàn)出中出現(xiàn)了〔Pv,PE〕華而不實Pv,PE分別對應的是結(jié)點的集合,以及邊的集合。由此能夠進行下面公式的計算PvN,PE=﹛〔Xi,XY〕丨Xi,XYPv﹜。但在這個公式中,呈現(xiàn)的不同的元素或者信息之間并沒有一個固定的關系,所以其集合呈現(xiàn)的僅僅僅是對定點的展現(xiàn),也就是講Pv=﹛X1,X2,Xn﹜,PE=。那么在這個時候還能夠?qū)涞男问浇缍ǔ蒔v=﹛X1,X2,Xn﹜。公式中的r指的是根結(jié)點。這個根結(jié)點所需要知足的基本要求如下:1〕首先根是不存在父結(jié)點的,也就是講?XiPv,〔Xi,r〕PE2〕PE邊存在向,假如講〔Xi,Xj〕PE是PE的構成內(nèi)容之一,其實〔Xj,Xi〕并非PE的組成元素。3〕任何一個結(jié)點,其相對應的父結(jié)點也只要一個。也就是講〔Xi,Xj〕是PE的一個元素,則〔Xi,Xy〕不是構成元素。4〕從樹的層面來講,樹本身是可連接的。例如在呈現(xiàn)的經(jīng)過中,所有的XiPE,都存在從r到Xi的途徑。值得一提的是,在進行圖的挖掘經(jīng)過中,其同時還牽涉到環(huán)內(nèi)容的存在。但是在整個樹型構造的挖掘開展經(jīng)過中則不會有環(huán)的呈現(xiàn)。同樣,假如一個形式應用起來相對頻繁,相對應的子形式也會頻繁。在詳細的操作經(jīng)過中,能夠借助下面幾種方式來詳細斷定子形式的存在。有兩個形式A和B,假設二者之間會存在單映射f,且知足了下面的幾個基本的條件:1〕Xi=f〔Xi〕,點標識一樣。2〕〔Xi,Xj〕=〔f〔Xi〕,f〔Xy〕〕,邊標識一樣。3〕Xi,XjAV,f〔Xi〕,f〔Xj〕BV,Xi,Xj,f〔Xi〕,f〔Xi〕,分屬兩個形式。如上所講,就能夠以為講形式A是B的子形式,標注為AB.根據(jù)這種分析,Agent完成了數(shù)據(jù)處理之后的信息就能夠根據(jù)不同的方式來進行進一步的數(shù)據(jù)挖掘。因而從整個形式方面來講,能夠以為Agent形式是一種通用的形式。3.2人機界面Agent在進行信息數(shù)據(jù)挖掘的經(jīng)過中,完全智能化的實現(xiàn)還需要時間與技術的雙重支撐。但是在當前的數(shù)據(jù)挖掘?qū)崿F(xiàn)經(jīng)過中,其不同的子系統(tǒng)之間是能夠通過人機共同來完成信息挖掘的。作為信息處理系統(tǒng)來講,其在運行的經(jīng)過中必然會牽涉到與人的溝通,也就是必須通過人來進行相關的信息或者命令輸入到系統(tǒng)中才能夠完成信息的處理[5].例如在進行單一信息處理的經(jīng)過中,用戶須首先要通過Agent來告訴系統(tǒng)哪些信息是該用戶偏愛的。系統(tǒng)就會根據(jù)告訴信息來進行信息的挖掘與整合。但是在數(shù)據(jù)挖掘的經(jīng)過中,同時還必須注意的是信息的處理具有一定的時效性。也就是講很有可能在某一段時間內(nèi),用戶對某些信息的關注熱門相對較高,但是一段時間之后,用戶的關注熱度則有可能會被轉(zhuǎn)移到另外的內(nèi)容上去。所以借助人機界面的實現(xiàn),能夠避免這種情況的出現(xiàn)。通過一定的計算標準來進行熱度信息的抓取。在進行系統(tǒng)詳細的設置時,從系統(tǒng)的建設之初就會植入一些信息和指令,用于判別不同信息數(shù)據(jù)的熱度。即使如此,在詳細的應用經(jīng)過中也仍然會出現(xiàn)很多的問題。以金錢效應為例來講,一般講來,在智能的系統(tǒng)方面,智能體所偏好的也往往是較多的金錢,所以在進行信息處理的經(jīng)過中,能夠發(fā)現(xiàn)智能體在對金錢愛好的偏向方面,但其更多的是追求單一數(shù)值大小。數(shù)據(jù)挖掘階段的形式是經(jīng)過評價得出的最終形式??赡軙嬖诤芏嚓惾叩膬?nèi)容,對于這些無法知足用戶需求的內(nèi)容就要進行合理的處理。一種處理方式是直接進行刪除,還有一種處理方式是進行數(shù)據(jù)的變化。無論是哪種處理方式,其最終的目的都是為了更好的推動數(shù)據(jù)信息挖掘或者處理結(jié)果的彰顯。而且在操作的經(jīng)過中,由于知識發(fā)現(xiàn)的本身是面向自然人的,所以在進行詳細發(fā)現(xiàn)形式的使用方面要進行可視化的處理,也就是講最終的結(jié)果必須是具有一定的效果,而且所呈現(xiàn)的內(nèi)容還必須是以能夠知足人們的需求來最終呈現(xiàn)。詳細人機界面的設置如此圖1所示:3.3總體構造在整體的構造實現(xiàn)經(jīng)過中,數(shù)據(jù)預處理Agent和人機界面Agent是分屬于兩個不同的架構。華而不實數(shù)據(jù)預處理Agent是從屬于背景描繪敘述的層面,而人機界面Agent則是從屬于接口的內(nèi)容。所以這兩部分內(nèi)容的存在,一方面促使信息的處理更為便捷,也愈加的高效,同時在進行信息處理經(jīng)過中,其最終所輸出的內(nèi)容也更容易得到廣大用戶的認可。一般來講,我們所提到的數(shù)據(jù)信息挖掘系統(tǒng)都是擁有特別龐大的體系,其在進行數(shù)據(jù)處理方面的處理經(jīng)過也是特別復雜的。采用多個Agent的形式就能夠有效的解決這種復雜的信息處理流程。通太多個Agent的實現(xiàn),將一個復雜的內(nèi)容轉(zhuǎn)變成為多重的信息處理層,進而更好的實現(xiàn)了Agent信息處理的效率。其大致的構造如此圖2所示:借助多個Agent
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中小學科創(chuàng)類競賽知到課后答案智慧樹章節(jié)測試答案2025年春四川師范大學
- 四級人力資源管理師-四級人力資源管理師考試《理論知識》考前沖刺卷1
- 安徽省六安市第一中學2017-2018學年高一下學期開學考試化學試題
- 基于MODBUS總線的倍捻機控制器設計
- 甲狀腺微小乳頭狀癌與直徑≥2cm甲狀腺乳頭狀癌臨床病理特點的比較研究
- 消化系統(tǒng)疾病老年住院患者抑郁狀態(tài)調(diào)查研究
- 新形勢下提升電力公司法律事務管理效能研究
- 高中生物物質(zhì)出入細胞的方式3教案浙科版必修1
- 鋸齒龍骨吊頂施工方案
- 人工勞務合同范例6
- 養(yǎng)豬場設施設備清單完整版
- 物聯(lián)網(wǎng)在安全生產(chǎn)中的應用
- 產(chǎn)科臨床診療指南及操作規(guī)范
- DB32T-網(wǎng)絡直播營銷管理規(guī)范編制說明
- 高職單招政治試題及答案
- 2024水利工程施工度汛方案編制導則
- 15建設美麗中國【中職專用】高一思想政治《中國特色社會主義》(高教版2023基礎模塊)
- 人教版(2024)六年級全一冊 第17課 設計我的種植園
- 尊師重教講義
- 2024小學數(shù)學義務教育新課程標準(2022版)必考題庫與答案
- 辦公用品及耗材采購服務投標方案(技術方案)
評論
0/150
提交評論