![數(shù)字圖書(shū)館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第1頁(yè)](http://file4.renrendoc.com/view/27b35cc30646d0bc18807db4abca06a5/27b35cc30646d0bc18807db4abca06a51.gif)
![數(shù)字圖書(shū)館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第2頁(yè)](http://file4.renrendoc.com/view/27b35cc30646d0bc18807db4abca06a5/27b35cc30646d0bc18807db4abca06a52.gif)
![數(shù)字圖書(shū)館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第3頁(yè)](http://file4.renrendoc.com/view/27b35cc30646d0bc18807db4abca06a5/27b35cc30646d0bc18807db4abca06a53.gif)
![數(shù)字圖書(shū)館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第4頁(yè)](http://file4.renrendoc.com/view/27b35cc30646d0bc18807db4abca06a5/27b35cc30646d0bc18807db4abca06a54.gif)
![數(shù)字圖書(shū)館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第5頁(yè)](http://file4.renrendoc.com/view/27b35cc30646d0bc18807db4abca06a5/27b35cc30646d0bc18807db4abca06a55.gif)
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)字圖書(shū)館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)
在今天,我們重視數(shù)字圖書(shū)館的建設(shè),基于現(xiàn)有圖書(shū)館的管理系統(tǒng),開(kāi)發(fā)和設(shè)計(jì)具有實(shí)際使用價(jià)值的計(jì)算機(jī)程序,減少圖書(shū)館服務(wù)人員的工作量是一個(gè)不容忽視的問(wèn)題。筆者于2001年領(lǐng)導(dǎo)開(kāi)發(fā)了香港浸會(huì)大學(xué)圖書(shū)館計(jì)算機(jī)自動(dòng)查重程序,以全自動(dòng)的方式取代耗時(shí)費(fèi)力的傳統(tǒng)人工采訪查重及館藏評(píng)價(jià)的書(shū)目核對(duì)法(Listchecking),具有較強(qiáng)的實(shí)際應(yīng)用價(jià)值.自動(dòng)查重程序的設(shè)計(jì)主要是充分發(fā)揮Innopac圖書(shū)館管理系統(tǒng)的網(wǎng)上聯(lián)機(jī)公共檢索目錄(WebOnlinePublicAccessCatalog,OPAC)的檢索技術(shù)而成.本文主要對(duì)該程序的算法簡(jiǎn)要述評(píng),以供各同業(yè)先進(jìn)指正.1完成訪談和評(píng)審后,將參考過(guò)程與藏書(shū)評(píng)估進(jìn)行比較1.1訪談與培訓(xùn)圖書(shū)館在進(jìn)行采訪工作時(shí),為避免浪費(fèi)經(jīng)費(fèi)購(gòu)買不需要的復(fù)本,必須核查待選書(shū)目中的每一筆紀(jì)錄是否為館藏所有,這樣的工作程序被稱為采訪查重.1.2核心目數(shù)和館藏檢數(shù)所占比例.書(shū)目核對(duì)法是館藏評(píng)鑒常用方法之一,圖書(shū)館先選擇某一學(xué)科的核心或權(quán)威書(shū)目,將書(shū)目中每一項(xiàng)資料逐一與館藏檢記錄核查,計(jì)算該書(shū)目在館藏中所占比例.館藏中擁有比例越高,館藏素質(zhì)的評(píng)價(jià)就越高.1.3館藏查核工序雖然采訪查重與書(shū)目核對(duì)法的作用有所不同,但在對(duì)館藏檢查核對(duì)的工作程序上來(lái)說(shuō),兩者是完全一樣的.所以,為了方便討論起見(jiàn),在下文的論述中將館藏查核工序,統(tǒng)一簡(jiǎn)稱為查重.1.4長(zhǎng)期重復(fù)單調(diào)工作長(zhǎng)久以來(lái),查重是一種勞力密集、千篇一律的重復(fù)性工作.工作雖然簡(jiǎn)單,但所耗費(fèi)的人力和時(shí)間卻不容忽視.而圖書(shū)館員在長(zhǎng)時(shí)間進(jìn)行重復(fù)單調(diào)的工作,亦會(huì)很容易產(chǎn)生漏檢和錯(cuò)檢的問(wèn)題.1.5計(jì)算機(jī)程序浸圖計(jì)算機(jī)自動(dòng)查重程序的設(shè)計(jì)目的,就是以計(jì)算機(jī)程序來(lái)取代傳統(tǒng)人工查重方式,它具有以下3個(gè)優(yōu)點(diǎn):減輕館員的勞動(dòng)強(qiáng)度;減低漏檢和錯(cuò)檢率;能在短時(shí)間內(nèi)完成大量查重工作.2自動(dòng)檢查程序的系統(tǒng)結(jié)構(gòu)和系統(tǒng)要求2.1系統(tǒng)結(jié)構(gòu)圖自動(dòng)查重程序的整個(gè)工作流程大致可分為四大部分,其結(jié)構(gòu)圖如圖1所示.2.2系統(tǒng)要求自動(dòng)查重程序由以下兩個(gè)程序組成:2.2.1tinumopac用MicrosoftVisualFoxPro6.0語(yǔ)言寫(xiě)成,可在PentinumⅢ或以上的個(gè)人計(jì)算機(jī)上運(yùn)行.其功能包括:①把待檢書(shū)目的各檢索字段轉(zhuǎn)換成可向OPAC系統(tǒng)進(jìn)行查詢的URL;②把待檢書(shū)目由客戶終端機(jī)上載至服務(wù)器進(jìn)行自動(dòng)查重;③把查核記錄由服務(wù)器下載回客戶終端機(jī)上,以供館員分析統(tǒng)計(jì).2.2.2ssac軟件用MicrosoftActiveServerPages3.0(MSASP)語(yǔ)言寫(xiě)成,在WindowsNT服務(wù)器上運(yùn)行.主要是把待檢書(shū)目對(duì)OPAC系統(tǒng)作自動(dòng)查重,并將查核結(jié)果登錄于待檢書(shū)目上.3自動(dòng)恢復(fù)過(guò)程和工作流的自動(dòng)控制3.1查詢數(shù)據(jù)的自動(dòng)查重程序主要受精密為免浪費(fèi)時(shí)間人力在OPAC系統(tǒng)上以人工鍵入書(shū)目查詢數(shù)據(jù),自動(dòng)查重程序只接受以MSExcel電子格式儲(chǔ)存的待檢書(shū)目,各項(xiàng)檢索字段(如作者、書(shū)名及ISBN等)必須儲(chǔ)存于列表的不同欄位中(見(jiàn)表1).3.2兩種方法的比較此部分程序主要是把待檢書(shū)目的各項(xiàng)檢索字段自動(dòng)鍵入OPAC系統(tǒng).浸圖是采用美國(guó)的Innopac圖書(shū)館自動(dòng)管理系統(tǒng),故自動(dòng)查重程序主要是因應(yīng)InnopacOPAC系統(tǒng)的檢索功能而設(shè)計(jì).但必須強(qiáng)調(diào)的是,自動(dòng)查重程序亦可應(yīng)用于其他以HTTPGet方法傳遞查詢數(shù)據(jù)的OPAC系統(tǒng)上.3.2.1HTTPGet數(shù)據(jù)傳遞方法根據(jù)萬(wàn)維網(wǎng)協(xié)定,傳遞查詢數(shù)據(jù)到HTTP服務(wù)器有HTTPGet和HTTPPost兩種不同的方法,它們分別是:(1)如果使用HTTPGet方法,查詢數(shù)據(jù)會(huì)被以一個(gè)統(tǒng)一資源地址(UniformResourceLocators,URL)中字符串的形式來(lái)傳遞.若使用HTTPPost方法,查詢數(shù)據(jù)便會(huì)以隱藏的數(shù)據(jù)區(qū)塊(Datablock)方式傳送到HTTP服務(wù)器.(2)在HTTPGet方法中,所傳遞的URL的字符串的總長(zhǎng)度不能超越255個(gè)英文字母,而HTTPPost方法則沒(méi)有此限制.HTTPGet方法雖然有字符串長(zhǎng)度的限制,但因?yàn)樗馨巡樵償?shù)據(jù)內(nèi)容公開(kāi)列明于URL中,所以程序員便可自由開(kāi)發(fā)程序生成URL連結(jié)來(lái)提取數(shù)據(jù)庫(kù)中的任何一條資料記錄.3.2.2InnopacOPAC的查詢指令I(lǐng)nnopacOPAC是使用HTTPGet方法把查詢數(shù)據(jù)傳遞給服務(wù)器,換言之,用來(lái)查詢的指令就是一條指向浸圖OPAC服務(wù)器的URL,其語(yǔ)法如下:http://[圖書(shū)館Innopac服務(wù)器網(wǎng)址]/search/[索引字符]?SEARCH=[檢索字段]其中,浸圖InnopacOPAC服務(wù)器網(wǎng)址為.hk/,而可使用的檢索點(diǎn)如表2所示.根據(jù)以上的指令模式,便可把在待檢書(shū)目中各檢索字段用程序自動(dòng)轉(zhuǎn)換為向OPAC查詢的URL,如表3所示.3.3查詢結(jié)果的獲取當(dāng)上述的URL被逐一導(dǎo)向浸圖InnopacOPAC系統(tǒng)后,OPAC系統(tǒng)會(huì)依據(jù)查詢數(shù)據(jù)在Innopac數(shù)據(jù)庫(kù)中找尋相應(yīng)的記錄,無(wú)論命中與否,皆會(huì)將搜尋結(jié)果的館藏記錄網(wǎng)頁(yè)傳回給客戶終端機(jī)上的瀏覽器.3.3.1自動(dòng)查重記錄若查核的檢索字段并非為館藏所有,InnopacOPAC系統(tǒng)在傳回的館藏記錄網(wǎng)頁(yè)上會(huì)出現(xiàn)“Nomatchesfound(意即[未查獲符合查詢條件館藏])”的提示語(yǔ)句(見(jiàn)圖2),亦即是“無(wú)命中”的意思,自動(dòng)查重程序便自動(dòng)把該檢索字段的查重記錄列為顯示藏館記錄網(wǎng)頁(yè)若查核的檢索字段為館藏,InnopacOPAC系統(tǒng)便會(huì)顯示藏館記錄網(wǎng)頁(yè),而在該網(wǎng)頁(yè)中亦不會(huì)出現(xiàn)“Nomatchesfound”的提示語(yǔ)句,這是“命中”的意思,查重程序便自動(dòng)把該檢索字段的查重記錄列為1.3.4自動(dòng)查重程序.根據(jù)檢查進(jìn)展的要求,將書(shū)目的查重記錄的各檢點(diǎn)的查重記錄通過(guò)數(shù)字結(jié)合的方式查重比自動(dòng)查重程序是可以清楚標(biāo)示各檢索點(diǎn)的查重記錄,但在處理一些少數(shù)有問(wèn)題或疑難的查重記錄時(shí),還是需要人工判斷.為了方便館員作分析統(tǒng)計(jì)及在有需要時(shí)進(jìn)行人工復(fù)檢,自動(dòng)查重程序會(huì)將書(shū)目的查核結(jié)果儲(chǔ)存在一個(gè)MSExcel電子格式文件檔內(nèi),內(nèi)容除了包括表1代檢書(shū)目中各項(xiàng)資料外,還會(huì)列出了各檢索點(diǎn)的查重記錄.表4便是針對(duì)表1對(duì)各條查重記錄的分析報(bào)告.3.4.1記錄1各項(xiàng)檢索點(diǎn)的查重記錄均為1,表示該項(xiàng)資料為復(fù)本.3.4.2用漢字文書(shū)進(jìn)行資料查重ISBN查重記錄為1,其余各項(xiàng)檢索點(diǎn)的查重記錄均為0.導(dǎo)致此類查重結(jié)果可能出于多個(gè)不同的原因,在此例子中,待檢書(shū)目是外文書(shū),而作者的姓名及書(shū)名都是中文譯名,但在浸圖的編目記錄中,外文作者均采用英文原名,故此作者的查重記錄便顯示為0.假設(shè)ISBN查重記錄被視為最值得信賴的,那么,只要ISBN查重記錄為1時(shí),館員便不須理會(huì)其余各項(xiàng)檢索點(diǎn)的查重記錄,而可以直接把該條資料判定為復(fù)本.3.4.3圖書(shū)館的《內(nèi)部文本》見(jiàn)表1ISBN查重記錄為0,其余各項(xiàng)檢索點(diǎn)的查重記錄均為1.這表示圖書(shū)館已擁有余秋雨的《千年一嘆》一書(shū)(見(jiàn)記錄1),但該書(shū)并不是在這條記錄中列出的北京作家出版社所出版,故此,被查核資料可被判定為非館藏所有.3.4.4記錄4各項(xiàng)檢索點(diǎn)的查重記錄均為0,該項(xiàng)資料可被判定為非館藏所有.3.4.5共藏/本企業(yè)的作者相關(guān)資料ISBN及作者+書(shū)名的查重記錄為0,而作者和書(shū)名的查重記錄均為1.這表示圖書(shū)館擁有該作者的其它作品,并且館藏中也可找到書(shū)名相同而作者不同的資料,但被查核的作者和書(shū)名并沒(méi)有在任何一條館藏記錄中同時(shí)出現(xiàn),因此,被查核資料可被判定為非館藏.3.4.6被查核資料可被判定為復(fù)本除了作者的查重記錄為1外,其余各項(xiàng)檢索點(diǎn)的查重記錄均為0.這表示圖書(shū)館擁有該作者的其它作品,而被查核資料可被判定為非館藏.簡(jiǎn)單來(lái)說(shuō),若以ISBN查重記錄為關(guān)鍵值,那只要ISBN查重記錄為1,如第1、2條記錄便可直接被判定為復(fù)本;反之,ISBN查重記錄為0,如第3~6條記錄則可被判定為非館藏所有.4最具創(chuàng)意大賽自動(dòng)查重程序查核1000項(xiàng)檢索點(diǎn)大約需時(shí)5min,浸圖自2001年使用該程序以來(lái),查重的工作效率大大提升.自動(dòng)查重程序的設(shè)計(jì),原先是浸圖系統(tǒng)部為采購(gòu)部開(kāi)發(fā)網(wǎng)上新書(shū)訂購(gòu)服務(wù)程序的一個(gè)有機(jī)組成部份.浸圖以網(wǎng)上新書(shū)訂購(gòu)服務(wù)程序榮獲Innopac系統(tǒng)的第一屆“最具創(chuàng)意獎(jiǎng)項(xiàng)”(FirstBeInnovativeAwards)比賽中的“最具創(chuàng)意館員模塊獎(jiǎng)項(xiàng)”(MostInnovativeUseofStaffModules).該獎(jiǎng)項(xiàng)已于2002年4月在美國(guó)德克薩斯州休斯敦市舉行的第10屆InnovativeUsers
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年二年級(jí)班主任年度考核個(gè)人總結(jié)例文(二篇)
- 2025年個(gè)人租房的合同協(xié)議(4篇)
- 2025年企業(yè)公轉(zhuǎn)私借款合同模板(2篇)
- 民航旅客運(yùn)輸安全協(xié)議
- 文化產(chǎn)業(yè)土地交易居間協(xié)議
- 汽車維修傭金居間合同樣本
- 洗浴中心裝修安全合同
- 教育機(jī)構(gòu)貸款居間協(xié)議
- 汽車維修廠租賃居間協(xié)議
- 消費(fèi)品以舊換新策略在市場(chǎng)中的適應(yīng)性與優(yōu)化
- 體育概論(第二版)課件第三章體育目的
- DB11T 1481-2024生產(chǎn)經(jīng)營(yíng)單位生產(chǎn)安全事故應(yīng)急預(yù)案評(píng)審規(guī)范
- 《氓》教學(xué)設(shè)計(jì) 2023-2024學(xué)年統(tǒng)編版高中語(yǔ)文選擇性必修下冊(cè)
- 化學(xué)元素周期表注音版
- 藥物過(guò)敏性休克
- T-GDASE 0042-2024 固定式液壓升降裝置安全技術(shù)規(guī)范
- 《電力系統(tǒng)自動(dòng)化運(yùn)維綜合實(shí)》課件-2M 同軸電纜制作
- 消防維保服務(wù)方案及實(shí)施細(xì)則
- 保衛(wèi)管理員培訓(xùn)課件
- 售前工程師工作總結(jié)
- 《智能物聯(lián)網(wǎng)導(dǎo)論》AIoT導(dǎo)論-第3章課件
評(píng)論
0/150
提交評(píng)論