![電子政務(wù)中中文文本分類技術(shù)的應(yīng)用_第1頁(yè)](http://file4.renrendoc.com/view/3e0e9ca7d554a4c2159d1ae7b1f152d7/3e0e9ca7d554a4c2159d1ae7b1f152d71.gif)
![電子政務(wù)中中文文本分類技術(shù)的應(yīng)用_第2頁(yè)](http://file4.renrendoc.com/view/3e0e9ca7d554a4c2159d1ae7b1f152d7/3e0e9ca7d554a4c2159d1ae7b1f152d72.gif)
![電子政務(wù)中中文文本分類技術(shù)的應(yīng)用_第3頁(yè)](http://file4.renrendoc.com/view/3e0e9ca7d554a4c2159d1ae7b1f152d7/3e0e9ca7d554a4c2159d1ae7b1f152d73.gif)
![電子政務(wù)中中文文本分類技術(shù)的應(yīng)用_第4頁(yè)](http://file4.renrendoc.com/view/3e0e9ca7d554a4c2159d1ae7b1f152d7/3e0e9ca7d554a4c2159d1ae7b1f152d74.gif)
![電子政務(wù)中中文文本分類技術(shù)的應(yīng)用_第5頁(yè)](http://file4.renrendoc.com/view/3e0e9ca7d554a4c2159d1ae7b1f152d7/3e0e9ca7d554a4c2159d1ae7b1f152d75.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
精品文檔放心下載、謝謝閱讀精品文檔放心下載具,以用戶為中心,以應(yīng)用為靈魂,以便民為目的,而電子政務(wù)建謝謝閱讀謝謝閱讀感謝閱讀謝謝閱讀謝謝閱讀設(shè)的重點(diǎn)問(wèn)題和面臨的新挑戰(zhàn)。(一)電子政務(wù)信息的特點(diǎn)當(dāng)前,我國(guó)黨政系統(tǒng)的信息80%以上都是以文檔形式存在,其中謝謝閱讀OFFICE或是精品文檔放心下載WPS應(yīng)用系統(tǒng),而公文在信息標(biāo)引上又具有其自身的特點(diǎn)。精品文檔放心下載、具有嚴(yán)格的格式要求。從字體、大小、排版格式都有嚴(yán)格的要求。謝謝閱讀精品文檔放心下載早可以追溯到1985年,中辦《公文主題詞表》通過(guò)了七感謝閱讀年9月和1994精品文檔放心下載年1月,中辦、國(guó)辦先后規(guī)定:凡報(bào)送中辦、國(guó)辦的正式文件,均需精品文檔放心下載標(biāo)注主題詞。1997年12月和1998年8月,國(guó)辦和中辦先后修訂了感謝閱讀謝謝閱讀精品文檔放心下載資源管理與交換的基礎(chǔ)。是指導(dǎo)各類政務(wù)信息采集、加工、整合和有感謝閱讀謝謝閱讀感謝閱讀庫(kù)資源的加工規(guī)X感謝閱讀感謝閱讀謝謝閱讀時(shí)間相當(dāng)漫長(zhǎng)。另外,人工標(biāo)引的公文主題詞又會(huì)產(chǎn)生因人而異、因精品文檔放心下載X性、標(biāo)準(zhǔn)性和科學(xué)性難以得謝謝閱讀精品文檔放心下載關(guān)檔案整理、輔助決策、知識(shí)管理等工作中的效果和效率。謝謝閱讀、公文中主題詞所處位置不同造成其信息價(jià)值不同。一是該詞的詞謝謝閱讀謝謝閱讀X感謝閱讀謝謝閱讀或者章節(jié)名、文獻(xiàn)摘要。最后為文獻(xiàn)中的詞?!倍¤热穗S機(jī)抽取了感謝閱讀300篇經(jīng)濟(jì)類網(wǎng)頁(yè),對(duì)這些網(wǎng)頁(yè)進(jìn)行人工自由標(biāo)引、人工打分、詞頻感謝閱讀統(tǒng)計(jì),并進(jìn)行統(tǒng)計(jì)數(shù)據(jù)的分析、研究,得出了網(wǎng)頁(yè)內(nèi)容主題與網(wǎng)頁(yè)題謝謝閱讀謝謝閱讀標(biāo)記等個(gè)標(biāo)引源的精品文檔放心下載主題表達(dá)能力的先后順序。得出的結(jié)論是首段文章標(biāo)題HTML標(biāo)記第感謝閱讀一段首句網(wǎng)頁(yè)標(biāo)題第一段尾句第二段首句第二段尾句尾段第三段首精品文檔放心下載句其它第三段尾句。并建議它們的加權(quán)值為精品文檔放心下載5:5:5:4:4:4:2:2:2:2:2:2。、公文具有行業(yè)性比較明顯。由于黨政機(jī)關(guān)的職能分工不同,其公精品文檔放心下載謝謝閱讀側(cè)重。比如,組織部門中,使用“黨的建設(shè)、“人才隊(duì)伍、“執(zhí)感謝閱讀配謝謝閱讀額”、“谷物”等詞相對(duì)較高。因此,部門的主要職能給主題詞帶來(lái)精品文檔放心下載了相對(duì)集中的特點(diǎn)。、主題詞的標(biāo)引具有失真性。在公文制作過(guò)程中,主題詞的一些標(biāo)精品文檔放心下載感謝閱讀感謝閱讀交、概念限定關(guān)系的詞組配;二是若詞表中無(wú)合適詞進(jìn)行組配時(shí),應(yīng)謝謝閱讀謝謝閱讀自由詞進(jìn)行標(biāo)引。謝謝閱讀能反映出公文的大致內(nèi)容和意思的表達(dá),但對(duì)具體內(nèi)容很難表達(dá)準(zhǔn)精品文檔放心下載確,因而,為彌補(bǔ)和克服以上情況所帶來(lái)的不足,在考慮分類時(shí),不謝謝閱讀精品文檔放心下載的位置權(quán)重等一些因素。(二)中文文本分類技術(shù)文本自動(dòng)分類是指計(jì)算機(jī)將一篇文章自動(dòng)地分派到一個(gè)或多個(gè)預(yù)定謝謝閱讀IR和機(jī)器學(xué)習(xí)ML謝謝閱讀外大致經(jīng)歷了三個(gè)發(fā)展階段:第一階段(1958~1964)主要進(jìn)行自動(dòng)分感謝閱讀類的可行性研究,第二階段(1965~1974)進(jìn)行自動(dòng)分類的實(shí)驗(yàn)研究,謝謝閱讀第三階段(1975至今進(jìn)人實(shí)用化階段。我國(guó)文本自動(dòng)分類的研究工作始于20世紀(jì)80精品文檔放心下載從可行性探討——輔助分類系統(tǒng)——自動(dòng)分類系統(tǒng)三個(gè)發(fā)展階段。精品文檔放心下載1981年,侯漢清先生首先對(duì)中文文本自動(dòng)分類進(jìn)行了探討,經(jīng)過(guò)二感謝閱讀感謝閱讀分類技術(shù)絕大多數(shù)都用到了經(jīng)典的向量空間模型(VSM),其中使用較感謝閱讀多并且技術(shù)比較成熟的主要有基于統(tǒng)計(jì)學(xué)的分類技術(shù)和基于人工智精品文檔放心下載能的自動(dòng)分類技術(shù)。感謝閱讀上,通過(guò)比較本特征向量與預(yù)定義類別特征向量的相似度來(lái)進(jìn)行歸感謝閱讀精品文檔放心下載向量權(quán)重算法。常用的向量空間模型(VSM)、NaiveBayes方法、線謝謝閱讀性最小二乘法以及K鄰近算法都屬于這類技術(shù)。精品文檔放心下載精品文檔放心下載感謝閱讀感謝閱讀精品文檔放心下載反向推理和混合推理三種??傮w上來(lái)說(shuō),中文文本分類還處于實(shí)驗(yàn)研究階段,分類正確率約為精品文檔放心下載60%~90%,離形成商業(yè)化的軟件投入實(shí)際應(yīng)用尚有一定的距離。精品文檔放心下載(三)電子政務(wù)中中文文本自動(dòng)分類研究存在的主要問(wèn)題、分詞算法精品文檔放心下載謝謝閱讀切分標(biāo)記,中文詞與詞之間沒(méi)有界定符,需要人為切分。此外漢語(yǔ)中謝謝閱讀謝謝閱讀目前為止,現(xiàn)有的各種分詞算法都未能很好的解決歧義切分問(wèn)題。感謝閱讀、文本的表示方法如何準(zhǔn)確地表示中文文本是自動(dòng)分類研究的另一個(gè)重點(diǎn)與難點(diǎn),研究者們普遍采用帶有權(quán)值的文本特征向量空間來(lái)表示文本,感謝閱讀如何確定各特征向量的權(quán)值以及如何消除各特征項(xiàng)之間的“斜交”感謝閱讀(IDF)、二進(jìn)制加權(quán)法等是目精品文檔放心下載前使用較多的權(quán)值計(jì)算法,但這些方法都存在一定的缺點(diǎn),難以克感謝閱讀感謝閱讀文本結(jié)構(gòu),難以表達(dá)段落、句子之間語(yǔ)義關(guān)系,這正是計(jì)算機(jī)無(wú)法謝謝閱讀像人類一樣正確類分文本的一個(gè)重要原因。、電子字(詞)典不夠完善目前許多自動(dòng)分類系統(tǒng)只有一個(gè)分詞詞典和輔以一個(gè)同義詞對(duì)照詞謝謝閱讀典,詞典中沒(méi)有詞性信息、語(yǔ)義信息,這大大影響了分類的正確性。感謝閱讀另外,由于社會(huì)、科學(xué)發(fā)展異常迅猛,分支學(xué)科、邊緣學(xué)科、大量新感謝閱讀感謝閱讀典的分詞算法總會(huì)有一些詞無(wú)法切分,從而影響了分類的準(zhǔn)確率。感謝閱讀、知識(shí)庫(kù)規(guī)模小,知識(shí)庫(kù)整體結(jié)構(gòu)和增量化管理不夠完善精品文檔放心下載感謝閱讀謝謝閱讀知識(shí)學(xué)習(xí)的問(wèn)題,這就導(dǎo)致了知識(shí)庫(kù)更新慢,不能謝謝閱讀這正是基于人工智能的專家分類系統(tǒng)難以得到廣泛應(yīng)用的重要原因。感謝閱讀、文本自動(dòng)分類算法本身的局限性謝謝閱讀是比較兩者之間共有關(guān)鍵詞的數(shù)目,雖然也使用了各種權(quán)值計(jì)算方精品文檔放心下載法,但這些權(quán)值在很大程度上依賴于關(guān)鍵詞的頻度或是否出現(xiàn)的信感謝閱讀息,這必然會(huì)影響分類結(jié)果的準(zhǔn)確性。另外,有些分詞算法難以具體謝謝閱讀實(shí)現(xiàn),如NaiveBayes概率模型,人們很難確定先驗(yàn)概率,因此求得感謝閱讀的后驗(yàn)概率肯定存在一定偏差。(四)電子政務(wù)中中文文本自動(dòng)分類研究的建議、加強(qiáng)電子政務(wù)專用電子詞典的建設(shè)電子政務(wù)專用詞典的建設(shè)是文本自動(dòng)分類技術(shù)在這一領(lǐng)域應(yīng)用的基謝謝閱讀礎(chǔ)。目前由于中文文本分類技術(shù)的限制,并沒(méi)有完善、實(shí)用的處理自感謝閱讀然語(yǔ)言的分類系統(tǒng)。但是建立規(guī)模較小的專用詞典卻是切實(shí)可行的。精品文檔放心下載如美國(guó)國(guó)立醫(yī)學(xué)圖書館研制的一體化的醫(yī)學(xué)語(yǔ)言(UMLS就是一個(gè)很感謝閱讀精品文檔放心下載精品文檔放心下載率。精品文檔放心下載精品文檔放心下載典、反義詞、近義詞和衍生詞詞典來(lái)進(jìn)一步提高自動(dòng)分類的準(zhǔn)確率。謝謝閱讀、引入人工智能的研究成果,采用語(yǔ)料庫(kù)技術(shù)獲得詞典信息與分詞精品文檔放心下載信息在進(jìn)入20世紀(jì)90感謝閱讀感謝閱讀精品文檔放心下載動(dòng)處理領(lǐng)域的應(yīng)用研究。另外,可以加強(qiáng)語(yǔ)料庫(kù)技術(shù)的研究,語(yǔ)料庫(kù)謝謝閱讀謝謝閱讀謝謝閱讀精品文檔放心下載通過(guò)這些信息解決自動(dòng)切詞中的歧義問(wèn)題。、加強(qiáng)現(xiàn)有中文文本自動(dòng)分類技術(shù)的應(yīng)用研究經(jīng)過(guò)20多年的研究,中文文本自動(dòng)分類技術(shù)在有些方面已經(jīng)比較成精品文檔放心下載謝謝閱讀感謝閱讀謝謝閱讀徑PrbMed就為用戶提供了自動(dòng)查找相關(guān)文獻(xiàn)的功能精品文檔放心下載內(nèi),中國(guó)醫(yī)學(xué)科學(xué)院信息研究所胡鐵軍等于2000年就開(kāi)始了該方面感謝閱讀的研究,現(xiàn)已取得了重大的突破。因而,加強(qiáng)現(xiàn)有中文文本自動(dòng)分類感謝閱讀技術(shù)在電子政務(wù)中的應(yīng)用研究以及對(duì)各種分類系統(tǒng)(包括基于分類技感謝閱讀術(shù)的其他應(yīng)用系統(tǒng))進(jìn)行測(cè)試和評(píng)價(jià),在電子政務(wù)信息分類方面進(jìn)行感謝閱讀試驗(yàn)性應(yīng)用,應(yīng)該是我們研究初期的重點(diǎn)。ApplicationChinesetextautomaticclassificationto謝謝閱讀E-GovernmentABSTRACT:InbinationwiththeactualconditionsofChinain精品文檔放心下載buildingE-Governmentsystems,articlestudiesthe感謝閱讀Chinesetextautomaticclassificationmethodusedin謝謝閱讀E-Government,showsthemainproblemandgivesadvice.Thenit感謝閱讀pointsthatbuildingtheelectronicdictionaryisvery謝謝閱讀important
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Unit 2 Shopping Lesson2(說(shuō)課稿)-2024-2025學(xué)年北師大版(三起)英語(yǔ)四年級(jí)上冊(cè)
- 2024年三年級(jí)品社下冊(cè)《馬路不是游戲場(chǎng)》說(shuō)課稿 山東版
- 2024-2025學(xué)年高中地理 第4章 旅游與區(qū)域的發(fā)展 第1節(jié) 旅游業(yè)的發(fā)展及其對(duì)區(qū)域的影響說(shuō)課稿 中圖版選修3
- Unit 1 Growing up 單元說(shuō)課稿-2024-2025學(xué)年高中英語(yǔ)外研版(2019)選擇性必修第二冊(cè)
- 下城區(qū)汽車租賃合同范本
- 保安獎(jiǎng)罰合同范例
- 醫(yī)用耗材寄售合同范例
- 加貿(mào)合同范本
- 專利注冊(cè)合同范本
- 人工智能購(gòu)銷合同范例
- 豐順縣縣級(jí)集中式飲用水水源地基礎(chǔ)狀況調(diào)查和風(fēng)險(xiǎn)評(píng)估報(bào)告
- 重慶市2023-2024學(xué)年七年級(jí)上學(xué)期期末考試數(shù)學(xué)試題(含答案)
- 《七律二首 送瘟神》教案- 2023-2024學(xué)年高教版(2023)中職語(yǔ)文職業(yè)模塊
- 八年級(jí)語(yǔ)文上冊(cè)《作文》專項(xiàng)測(cè)試卷及答案
- 2024年中考語(yǔ)文滿分作文6篇(含題目)
- 2024年安全員之江蘇省C2證(土建安全員)題庫(kù)與答案
- 第一節(jié)-貨幣資金資料講解
- 2024年華僑、港澳、臺(tái)聯(lián)考高考數(shù)學(xué)試卷含答案
- 工程造價(jià)咨詢服務(wù)投標(biāo)方案(技術(shù)方案)
- 駕駛員安全行車考核獎(jiǎng)懲制度(3篇)
- 籃球俱樂(lè)部合伙協(xié)議
評(píng)論
0/150
提交評(píng)論