下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
0、準備工作I用怡標識I歌件|CIA5ETATHCwSttcljAimiui速將裁明到HU纓希鬣莖疙1W雇用程序!0、準備工作I用怡標識I歌件|CIA5ETATHCwSttcljAimiui速將裁明到HU纓希鬣莖疙1W雇用程序!t詞良用;'?』F』刑(新I[壑環(huán)境壹量肯,計算機世I理逝擊特[蕓皇物瓦理頓成玖丁血站的常戶衰量苫曜):蒙量眉10:WMElitTEUFC1AZEFMK所更覆,...[wfittLyillgLucene是一套全文檢索的API,對其介紹的文章和應(yīng)用的案例都多,可參考lucene及本文的參考文獻。此次學習,以實用為主,一是簡單應(yīng)用,二是Web應(yīng)用,三是漢化,四相關(guān)應(yīng)用(Lucene主頁上在SandBox中)。去Lucene的主頁下載目前的穩(wěn)定版本lucene-1.2.tar.gz,解壓縮,將lucene-1.2目錄下的兩個jar文件lucene-1.2.jar和lucene-demo2-1.2.jar放到適當?shù)哪夸浵潞螅⑵浼尤氲紺LASSPATH環(huán)境變量中。tarzxvflucene-1.2.tar.gz<----解壓縮cdlucene-1.2cp*.jar$DP< 存放jar文件的目錄,根據(jù)具體工作要求用實際目錄替換CLASSPATH=$CLASSPATH:$DP/lucene-1.2.jar:$DP/lucene-demosT.2.jar;exportCLASSPATH如果不想在每次都登錄后,可以編輯/etc/profile或自己目錄下的.profile,將上面的最后一行加到文件的最后一行。Windows的設(shè)置,右擊桌面的“我的電腦”,選“高級”一〉“環(huán)境變量”一〉選中CLASSPATH一>“編輯”,在輸入框中加入兩個jar文件的全路徑名,注意分隔符是分號(;)。參見右圖。1、運彳亍demo$javaorg.apache.lucene.demo.IndexFiles/usr/local/man/manl/<--對man文件建立索引adding/usr/local/man/manl/mysql.ladding/usr/local/man/man1/cvs.11614totalmilliseconds$javaorg.apache.lucene.demo.SearchFiles<--進行檢索Query:passwordSearchingfor:password7totalmatchingdocuments0./usr/local/man/man1/mysql.16./usr/local/man/man1/mysqlshow.1Query:OK!Lucene自待的demo運行成功這個demo程序調(diào)用的主要API函數(shù):/*關(guān)于索引的主要函數(shù)*/Filefile=newFile(argv[]);IndexWriterwriter=newIndexWriter("index",newStandardAnalyzer(),true);Documentdoc=newDocument();doc.add(Field.Text(〃path〃,file.getPath()));doc.add(Field.Keyword(〃modified〃,DateField.timeToString(file.lastModified())));FileInputStreamis=newFileInputStream(f);Readerreader=newBufferedReader(newInputStreamReader(is));doc.add(Field.Text(〃contents〃,reader));writer.addDocument(doc);writer.optimize();writer.close();/*關(guān)于檢索的主要函數(shù)*/Searchersearcher=newIndexSearcher("index");Analyzeranalyzer=newStandardAnalyzer();Queryquery=QueryParser.parse(lineforsearch,"contents",analyzer);Hitshits=searcher.search(query);for(inti=start;i<hits.length();i++)(Documentdoc=hits.doc(i);Stringpath=doc.get("path");System.out.println(i+"."+path);}3、運行LuceneWeb假定tomcat裝在$TOMCATHOME目錄下,具體應(yīng)用時用真實的目錄替換$TOMCATHOME。cd$TOMCATHOME/webappsmkdirlucenedbcdlucenedbjavaorg.apache.lucene.demo.IndexHTML-create-index$TOMCAT/webapps/lucenedb../examples<--用相對路徑“..”,一來指明被索引的文件的位置,二來用來顯示被索引文件的URL,因為檢索的jsp程序在luceneweb子目錄下.examples可用其它的真實應(yīng)用的目錄名來替換cd..cp~/lucene-1.2/luceneweb.war.<--luceneweb.war在你解壓縮生成的lucene-1.2目錄下../bin/shudown.sh../bin/startup.sh
然后通過客戶端訪問:8080/luceneweb,如果順利瀏覽器應(yīng)出現(xiàn)右邊所示的內(nèi)容。.再到服務(wù)器端cdlucenewebWekometoHieLikeiieTeinphteapphtation(Tlusisthehe^dei}viconfiguration.jsp<--WekometoHieLikeiieTeinphteapphtation(Tlusisthehe^dei} n的值改為100 Poge Search "$TOMCATHOME/webapps/luc「口口」.. enedb";cd..jar-urluceneweb.warluceneweb再到客戶端,刷新剛才的頁面,然后就可以輸入單詞進行檢索了。遺憾的是,此是只能檢索英文單詞。且如果命中的html頁面的title是漢字的話,顯示也有問題。如圖。t口tlieLu<cueTemplateoppli<jhoniTIhmistliehe3<kifIhxument Sunun^jyB<>DY;8{?R<>LLB_AR-FA{JE-(:?L<>R=FEFFF4,SC1R<?LIHIGHLIGHT-=FFI?"!?E.S<E<^LLE_U>SILAIh:=FFI^I^E.S<Tj>LLE_AJ>3ITIGHT-<1<T<T.=FCRCEQLLEAR-ARRHSmOF=FFhhhj,RORILLEAKT<1<^L<T.=FFFFFF.B<>DY;S{?R<>LLB_AK-FA{?E-(:?L<>R=FEFFF4,SC1R<>LIHTGHLIGHT-<1<T<^R=FFI^"1.S<E<^LLB_AJ>SILAIh:toeeeeee =FFI^I^E.S<Tj>LLE_AJ>3ITKiHT-<1<T<T.=FC1PiJTR3口-3口口廠國V-LCT廠幣HHHF以LTiTTRAP-H此處的IndexHTML,可以對htm、html和txt類型的文件進行索引,用的是一個HTMLParser,除此以外與上一例基本相同。不僅僅在推廣和介紹方面,車東在Lucene的漢化及web應(yīng)用,也作出了極大的極大的貢獻。他將自己的漢化和web應(yīng)用兩方面的成果,放在sourceforge上成了開源的項目。下面主要是對這個項目的學習筆記。對發(fā)了兩個分,一個單字一個進行分引和檢索了。譯后一起打入了,如果不愿個Analyzer對發(fā)了兩個分,一個單字一個進行分引和檢索了。譯后一起打入了,如果不愿個Analyzer載。Analyzer,我IndexHTML和Analyzer也Lucene的漢化,車東開Analyzer,一個是二元切切分。利用這兩個中的任析,都可以進行漢字的索我把這兩個Analyzer編到lucene-1.2.jar中自己動手進行編譯這兩的朋友,可以從這兒下有了新的把IndexFiles、SearchFiles中的用了新CJKAnalyzer做Query:用戶管理Searchingfor:"用戶戶管管理10totalmatchingdocuments0+/test/yhgl+htm-中心用戶管理1+/test/jtyhglts+htm-信息出楚2+/test/jtyhgltz+htm-信息出韜3+/test/menuyh+htm-中心用戶管理4+/test/ytwyhts3+htm-佶息出雷5+/test/ytwyhts+htm-
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《TPS豐田生產(chǎn)方式》課件
- 決定銷售業(yè)績的重要心態(tài)(課件)
- LNG氣化站應(yīng)急備用氣源自用建設(shè)項目可行性研究報告模板-立項備案
- 一年級語文上冊拼音aoe
- 2024年江蘇省招聘社區(qū)工作者題庫及參考答案
- 單位管理制度收錄大合集【人員管理篇】十篇
- 單位管理制度品讀選集【職員管理】十篇
- 樓梯 欄桿 欄板(一)22J403-1
- 果凍袋行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報告
- 中國返利網(wǎng)站行業(yè)市場調(diào)研分析及投資戰(zhàn)略咨詢報告
- ATS技術(shù)交流(新型發(fā)動機智能恒溫節(jié)能冷卻系統(tǒng))100318
- 手術(shù)區(qū)皮膚的消毒和鋪巾ppt課件
- 日有所誦(二年級)
- 2022年度培訓工作總結(jié)
- 應(yīng)急照明裝置安裝施工方法
- 靜力觸探技術(shù)標準
- 鋼結(jié)構(gòu)、膜結(jié)構(gòu)安全技術(shù)交底
- DB34∕T 4057-2021 中小河流防汛特征水位分析規(guī)程
- 單肺通氣技術(shù)
- 學生基本情況分析(通用11篇)
- 明天會更好歌詞
評論
0/150
提交評論