

下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、N-Gram 的數(shù)據(jù)結(jié)構(gòu)ARPA 的 n-gram 語法如下:hLn!J |VKWpLuincij( prmi? riBtramJi IrljiiJiilinpum!=l:2冒Mlh1-14112-U 1VJLIMT -p L H4.675221cm T2 IKS7n屮口,科申7FiKtilE_L1 k:5558J-2 J 11W tJ 077-1 ilhjm -出?M4-1J7I4474h忡*5 1747fi2O.OJ鼻fbjrtj:,叩-1 4722J.Ml |K 77W7?-5-7By30K* DJJ i i-4 TOTJfJMJAR Hl MJ .訊同* -氐si 4iH-1:Nh2M
2、)5 7 syjiINiWIWll *O07()77657 抽耳J (#7 iahwMih317:具體說明見:ARPA 的 n-gram 語言模型格式整個 ARPA-LM 由很多個 n-gram 項組成,分別說明這兩個的數(shù)據(jù)結(jié)構(gòu)gram 數(shù)據(jù)結(jié)構(gòu)(hlmJ)MCWplumcopyprinl?Vdatakngram : =M(11x1ngnim 2=52253( 1ngram 3=1 v:445,n-words 表示當前的 n-gram 所涉及的單詞,如果是 1-gram,那就只有一個,如果是2-gram那么 words就包括這兩個單詞的序號。 log_bo表示n gram的回退概率。 log_
3、prob,表示 n gram 的組合概率。二,ARPA-LM 數(shù)據(jù)結(jié)構(gòu)多個項組成的整個 n-gram 語言模型的數(shù)據(jù)結(jié)構(gòu)如下:cpp view plaincopyprint?vocab 用于構(gòu)建語言模型的詞典指針。詞典定義見:詞典內(nèi)存存儲模型 entries, 語言模型的所有ngram項,是 ARPALMEntry類型的一個二維數(shù)組。 entriesO存儲 1-gram ,entries1存儲 2-gram 依此類推。n_ngrams 整型數(shù)組,依次包含 1-gram,2-gram,3-gram,.所包含的 ngram 項個數(shù)。unk_wrd,詞典中可以 不在語言模型中的 詞。un k_id,詞典中可以不在語言模型中的詞的 ID ,這個 ID 指定為詞典的最后一個 詞序號。n_unk_words,在讀語言模型之后,統(tǒng)計在詞典中,但沒有用來建立語言模型 的詞個數(shù),如果沒有指定 unk_wrd 的話,是不允許的,就表示所有的詞典中的詞都應(yīng) 該用來建語言模型。unk_words 存儲 6 中統(tǒng)計的詞序號。words_in_lm,這個標識詞典中的詞是否在語言模型中出現(xiàn)。ciass AKPALMpublic:Vocabularr svocab :intorder:ARPALMEnlry entries; 717)八 ;僅卜:intngrams;的的無普姜少個char unkwrd ;in
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- JJF 2199-2025數(shù)字式時鐘校準規(guī)范
- 前期策劃合同范本
- 養(yǎng)牛設(shè)備出售合同范本
- 保障性住房購房合同范本
- 加油卡租車合同范本
- 協(xié)議單位優(yōu)惠合同范例
- 醫(yī)藥物流合同范本
- 修叉車合同范本
- 勞務(wù)分包協(xié)議合同范本
- 勞務(wù)合同范本已填
- 脫硫自動化控制-洞察分析
- 醫(yī)務(wù)人員醫(yī)德醫(yī)風(fēng)培訓(xùn)
- 人教版初中歷史八上-第2課 第二次鴉片戰(zhàn)爭
- 2024湖北省金口電排站管理處招聘易考易錯模擬試題(共500題)試卷后附參考答案
- 油井供水合同范例
- 2025年人教部編版語文五年級下冊教學(xué)計劃(含進度表)
- 全國計算機等級考試一級試題及答案(5套)
- 銀河證券-科創(chuàng)板認知測評題目及答案
- 產(chǎn)品方案設(shè)計模板
- 部隊通訊員培訓(xùn)
- 物業(yè)公司水浸、水管爆裂事故應(yīng)急處置預(yù)案
評論
0/150
提交評論