從提問文檔中讀N個提問式_第1頁
從提問文檔中讀N個提問式_第2頁
從提問文檔中讀N個提問式_第3頁
從提問文檔中讀N個提問式_第4頁
從提問文檔中讀N個提問式_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、從提問文檔中讀N個提問式將讀進的提問式轉(zhuǎn)為展開表形式從順序文件數(shù)據(jù)庫中依次讀進M個文獻記錄,y=1構(gòu)成一個記錄標(biāo)引詞標(biāo)識表X=1第X個提問與該文獻記錄比較成功否?該記錄放入結(jié)果文檔中y=y+1yM?所有被檢索的文獻記錄完否?提問文檔結(jié)束否?YYYYN=XX=X+1將順序文檔倒回到初始狀態(tài)N菊池敏典檢索處理流程置參數(shù)為初始狀態(tài)取出邏輯表達式中一標(biāo)識進行判別填入層次值A(chǔ)FD或NFD欄目內(nèi)容提問結(jié)束符嗎?將“命中”以及“拒絕”標(biāo)記分別置入最后一項的AFD或NFD欄目中根據(jù)層次值,完成表中各項AFD或NFD欄目中未完成值取出檢索詞的編號將檢索詞號對應(yīng)在檢索表中信息置入提問表相應(yīng)位置中算項算子結(jié)束符NY

2、圖5-3 表變換處理流程5.3.1 逆波蘭表達式逆波蘭表達式提問表達式算子進棧軌跡算子退棧軌跡提問式算子保留棧算項軌跡順排文獻文檔用戶提問檢索處理命中文獻輸出圖5-1 主文獻數(shù)據(jù)庫文檔從文獻記錄中抽出可供檢索的關(guān)鍵詞,經(jīng)排序、整理后編制成各種倒排文檔。索引文檔各種倒排文檔檢索處理結(jié)果輸出轉(zhuǎn)換為逆波蘭以及其它處理方式用戶提問圖5-2 聯(lián)機檢索系統(tǒng)原理從檢索表中依次取出一條指令是終止指令嗎?判別操作碼?根據(jù)操作碼給出的操作性質(zhì),從第一,二操作地址中取出參加運算的文獻集合,進行邏輯運算將運算結(jié)果放入第三操作數(shù)地址指定的工作區(qū)內(nèi)將工作區(qū)中文獻記錄號集合放入特定工作區(qū)內(nèi)根據(jù)檢索詞地址對照表取出地址對應(yīng)的

3、檢索詞在倒排文檔中檢索,將命中文獻號放入相應(yīng)的第三操作數(shù)指定的工作區(qū)內(nèi)存貯輸入邏輯運算逆波蘭檢索處理流程圖語法檢查有錯誤嗎?將提問表達式轉(zhuǎn)換為等價的逆波蘭表達式形式將逆波蘭表達式形式轉(zhuǎn)換為檢索指令形式利用倒排文檔進行處理,并輸出結(jié)果打印出錯信息NY圖5-5 倒排文檔檢索算法基本流程圖機讀文獻語句分析語詞加權(quán)確定閾值選出標(biāo)引詞概念轉(zhuǎn)換受控詞停用詞處理抽詞關(guān)鍵詞文檔與索引生成手檢或機檢用戶相關(guān)性判斷反饋圖 4-5 自動標(biāo)引工作流程圖索引索引(小小)/mb文獻文獻集合集合(中中)200mb文獻文獻集合集合(大大)2Gb文獻集文獻集合合詞號地址詞號地址45% 73%36% 64%35% 63%文獻地址(記文獻地址(記錄)錄)19% 26%18% 32%26% 47%64k分塊地址分塊地址27% 41%18% 32%5% 9%256k分塊地址分塊地址18% 25%1.7% 24%0.5% 0.7%輸入文本Data切分字處理非用字表字典文件建立單漢字索引壓縮地址碼字倒排文檔圖4-6 單漢字檢索系統(tǒng)文本處理流程圖取文本取完否?依次取文本中字字取完否?在非用字表中找到了嗎?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論