中醫(yī)古籍電子化系統(tǒng)的研究與實現(xiàn)_第1頁
中醫(yī)古籍電子化系統(tǒng)的研究與實現(xiàn)_第2頁
中醫(yī)古籍電子化系統(tǒng)的研究與實現(xiàn)_第3頁
中醫(yī)古籍電子化系統(tǒng)的研究與實現(xiàn)_第4頁
中醫(yī)古籍電子化系統(tǒng)的研究與實現(xiàn)_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、中醫(yī)古籍電子化體系的研究與實現(xiàn)符永馳李斌郭敏華劉國正【關鍵詞】中醫(yī)藥信息古籍數(shù)字化中醫(yī)古籍古籍數(shù)字化是當前中醫(yī)古籍文獻整理事情的熱門。中醫(yī)古籍傳承了數(shù)千年中華醫(yī)藥文化,是名貴的汗青遺產(chǎn)。對中醫(yī)古籍文獻舉行數(shù)字化處置懲罰,不但可以再生性庇護這些貴重的中醫(yī)古籍,并且為越發(fā)便捷地開拓和利用古籍資源開拓了新的途徑。通過對如今國表里古籍數(shù)字化尤其是海內(nèi)中醫(yī)古籍數(shù)字化的研究與生長近況的深化研究,結合中國中醫(yī)科學院中醫(yī)藥信息研究所近幾年來在中醫(yī)藥珍籍秘典的整理救濟、庇護及相干研究方面所獲得的履歷,本研究提出了一種新的中醫(yī)古籍電子化體系的辦理方案。旨在先容一種實現(xiàn)無缺/錯字、圖文比較、通用性好、檢索快捷便利、

2、輸入/輸出機動、讀者互動交換、幫助研究性強的中醫(yī)古籍電子化體系。該體系具有電子化編纂、壓縮、上傳、存儲、圖書分組辦理、讀者分組辦理、讀者-圖書授權借閱、網(wǎng)絡在線閱讀、原文圖像欣賞、圖書需求信息闡發(fā)、計費電子借閱、古籍學術論壇、短信互動平臺、正確快速檢索等成效。其科學、便捷、寧靜、高效的古籍資源辦理,將進一步實現(xiàn)古籍閱覽由傳統(tǒng)方法向電子/網(wǎng)絡方法的龐大變化。1體系重要成效布局1.1中醫(yī)古籍編纂平臺中醫(yī)古籍編纂平臺提供對數(shù)字中醫(yī)古籍的編纂處置懲罰成效。我們開拓了?古籍編纂器?軟件,用來對古籍圖片元數(shù)據(jù)舉行標注和壓縮,輸出電子書。中醫(yī)古籍電子冊本一樣平常包羅的信息有:置標信息,古籍中的重要知識點,如

3、并證、方、藥等;用于全文檢索和欣賞古籍圖片;原掃描圖像,保待原圖原貌,用于與文本信息比較利用;書目的元數(shù)據(jù)信息,如分類、書名、成書年出書年代、作者、版本、館藏地、內(nèi)容提要、冊本特性、保管方法、復制狀態(tài)等;書的章節(jié)信息,用于分別清楚的冊本條理布局。其特點重要表如今以下方面:古籍的卷、章、節(jié)可以機動分級辦理;支持對圖片的標識表記標幟和編纂,不會改變原始圖片,可以搜刮圖片信息和圖片的標識表記標幟數(shù)據(jù);支持縮略圖方法欣賞章節(jié)中的圖片,支持鼠標放大/縮小圖片和旋轉(zhuǎn)檢察,圖片能主動播放和按照表現(xiàn)器區(qū)分率調(diào)解巨細;根據(jù)中醫(yī)古籍總目的分類尺度歸類冊本。1.2電子古籍公布體系電子古籍公布體系用于將中醫(yī)古籍編纂平

4、臺輸出的電子古籍上傳、解壓、導入并存貯到閱覽體系中。公布體系會按照古籍分類信息主動歸入準確的分類位置并創(chuàng)立索引,以樹狀情勢展示,且在樹的每個條理上表現(xiàn)該條理布局下的總條目數(shù),與原有書庫無縫集成。1.3電子古籍閱覽體系電子古籍閱覽體系實現(xiàn)了用戶在線舉行圖文閱覽,并可以記載用戶在線閱覽古籍的種類和時間信息,從而闡發(fā)讀者對各古籍的借閱和需求信息。同時,電子古籍閱覽體系具有網(wǎng)上計費借閱成效,以便于貴重古籍的庇護和有用利用。計費借閱方案機動,重要有定時計費(按現(xiàn)實借閱時間、包月/年等)、按冊本計費、按會員級別計費、按流量計費和綜合計費。1.4古籍信息搜刮平臺搜刮平臺具有簡樸查詢、組合查詢和全文搜刮成效。

5、對付中醫(yī)古籍涉及浩繁生僻字的題目,平臺創(chuàng)立了中醫(yī)古籍的繁簡字體比較表,增長繁簡字體關聯(lián)互檢成效,進步搜刮正確率,同時提供基于內(nèi)容的高效檢索和對知識的正確開掘成效。1.5學術論壇即時通訊古籍學術論壇和即時通訊平臺提供讀者與讀者之間、讀者與中醫(yī)古籍辦理員之間舉行互動古籍學術交換和即時通訊成效。1.6幫助軟件操縱平臺幫助軟件操縱平臺提供了字數(shù)詞頻統(tǒng)計、汗青年表、古今編年換算、干支/公元編年換算、六十四卦表等幫助成效,為古籍研究者對古籍數(shù)據(jù)舉行多角度的闡發(fā)研究提供便利,從而進步體系的有用性和友愛性。2體系接納的重要技能思量到基于java的eb應用技能的有用性、機動性和不變性,同時結合基于j2ee的st

6、ruts和實現(xiàn)數(shù)據(jù)長期化的hibernate框架的v方案形式所具有的精良特點,本文接納了該架構來構建高內(nèi)聚、弱耦合、可維護和可擴展的中醫(yī)古籍電子化體系。數(shù)據(jù)庫接納rale9i,數(shù)據(jù)搜刮接納raletext技能。下面臨此中一些關鍵技能予以先容。2.1v方案形式v(del-vie-ntrller,模子-視圖-操縱器)是一種知名的用戶界面軟件開拓方案形式,最早由xerx在20世紀80年代為saltalk-80語言生長提出,厥后被普及應用于別的面向東西的編程語言中。v方案形式把應用步伐分成了3個焦點部門,將應用步伐舉行了分層,視圖和模子通過操縱器毗連,從而淘汰了用戶界面和業(yè)務邏輯之間的耦合,使步伐方案

7、越發(fā)清楚、機動,也進步了軟件的可擴展性、可維護性,降服傳統(tǒng)eb體系的不敷之處2。2.2struts框架struts框架是apahe的一個開源工程,表現(xiàn)了v方案形式的特性,服從了j2ee的servlet、jsp等技能范例,同時按照j2ee的特點做了相應的變革和擴展,是j2ee體系架構的一種輕量級實現(xiàn)。作為一款良好的javaeb應用步伐的開拓框架,struts框架依附其清楚性和機動性,成為當前最為普及應用的輕量級javaeb開拓框架3。2.3hibernate框架hibernate框架是開放源代碼的東西干系映射東西(bjet-relatinalapping),是一款基于java情況的良好的東西長期

8、化開拓框架,按照/r(東西/干系)映射技能頭腦,對jdb舉行了輕量級封裝,使開拓職員可以利用一種面向東西的方法來把持和辦理干系數(shù)據(jù)庫,以是從技能本質(zhì)上來說該框架是一種提供面向東西的數(shù)據(jù)庫辦事中心件4。2.4raletext搜刮技能raletext是一種成效強盛的搜刮技能,內(nèi)置于rale數(shù)據(jù)庫中,其提供的開拓api使軟件方案職員能輕松實現(xiàn)成效齊備的內(nèi)容搜刮應用步伐,可用于搜刮布局化和非布局化文檔,是對sql通配符匹配技能的增補。raletext支持利用根本的布爾運算符(and、r、nt、near等)將多個搜刮條目組合到一起,同時具有更高級的成效,如sundex和模糊搜刮以及效果排序等。該技能支持

9、數(shù)百種文件范例,包羅irsftffie和pdf。2.5中醫(yī)古籍中生僻漢字處置懲罰古籍生僻漢字題目是中醫(yī)古籍電子化事情的一大停滯。如今很多電子化古籍體系接納偏旁相加的要領來寫,看起來非常別扭,并且假設碰到無法用偏旁相加的要領來輸入的漢字,表達起來會更為貧困。本體系通過對中醫(yī)古籍電子化中碰到的生僻漢字題目舉行深化研究并對生僻漢字舉行闡發(fā)統(tǒng)計后,對其舉行編碼、造字,創(chuàng)立繁簡字體比較表,增長繁簡字體關聯(lián)互檢成效,從而有用進步了搜刮正確率。用戶可以通過輸入相近的簡化字大概生僻漢字的模糊發(fā)音,即可舉行生僻漢字有關的查詢搜刮。這種簡樸易用的要領實現(xiàn)了古籍電子化中碰到的生僻漢字的存儲、檢索和表現(xiàn),較好地辦理了

10、古籍電子化中碰到的生僻漢字題目。3中醫(yī)古籍電子化體系的實現(xiàn)從2002年開始,中國中醫(yī)科學院中醫(yī)藥信息研究所先后負擔了科技部公益工程?1100種中醫(yī)珍籍秘典的救濟整理?、?中醫(yī)藥貴重文籍的庇護技能及相干題目研究?的事情,已開端創(chuàng)立起中醫(yī)古籍電子化體系。通過自主開拓的?古籍編纂器?、?古籍公布體系?,已經(jīng)完成了1500種中醫(yī)古籍的書目元數(shù)據(jù)信息編纂事情,850余種的數(shù)字中醫(yī)古籍的編纂事情;創(chuàng)立起的中醫(yī)古籍閱覽辦理體系,實現(xiàn)簡樸檢索、組合檢索、全文檢索、模糊檢索、正確檢索,實現(xiàn)了用戶的分級辦理,圖書分組辦理、讀者分組辦理、網(wǎng)絡在線閱讀、原文圖像欣賞等成效??蓹z索信息48多萬條。體系成效正在漸漸的建立

11、和美滿。在體系建立中我們也碰到很多題目,如據(jù)根工程支持的經(jīng)費,我們尚不克不及對數(shù)字化的中醫(yī)古籍全文本化,那么怎樣實現(xiàn)閱讀的檢索呢我們接納了對原書圖標注的要領,通過標注,根本能實現(xiàn)古籍中重要知識點的檢索。標注的度是到達檢索量的要點,標注度過細,會大量增長事情量,標注度過粗,又會遺漏重要認知點,為此我們訂定了標注的根本原那么。數(shù)字古籍的圖像,保待了原圖原貌,除外洋回歸古籍是縮微膠片掃描完成外,原書掃描都是彩色儲存。如許就大大地增長了儲存的量,使圖像的處置懲罰、圖像上傳及網(wǎng)上閱讀都出現(xiàn)了速率慢的題目,為進步檢索和閱讀的速率,我們對數(shù)據(jù)庫布局舉行了屢次優(yōu)化和裝備成效的提拔,根本上辦理了速率題目。速率題

12、目隨著數(shù)據(jù)量的加大,大概還會出現(xiàn)。4小結本研究結合中國中醫(yī)科學院中醫(yī)藥信息研究所多年來在中醫(yī)藥珍籍秘典的整理救濟、庇護及相干研究方面所獲得的履歷,提出了一種基于數(shù)據(jù)庫和eb網(wǎng)絡技能的中醫(yī)古籍電子化體系的辦理方案,并就辦理方案方案了技能途徑和體系架構。該方案已在中國中醫(yī)科學院中醫(yī)古籍電子化研究工程中得到了精良的應用并獲得了必然成效。隨著技能的進步和人們對電子古籍閱讀需求的變革,中醫(yī)古籍電子化體系是在不竭生長,很多題目還需進一步研究。如:古籍中同藥異名、異藥同名,古籍中的病證和當代病名題目,這些如今已有相干的研究效果,怎樣利用這些效果創(chuàng)立起關聯(lián)詞表,將為中醫(yī)古籍的閱讀檢索提供越發(fā)便捷的支持。電子古籍生僻漢字題目的研究。傳統(tǒng)的盤算機二字節(jié)編碼技能只能處置懲罰2萬多個漢字,對古籍中大量的生僻字、俗體字、異體字、通假字、避忌字無能為力。龍語瀚堂文籍數(shù)據(jù)庫接納unide四字節(jié)編碼技能辦理了古籍整理和研究中生僻漢字數(shù)字化的瓶頸,美滿了漢字信息網(wǎng)絡化的平臺?!?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論