基于格式模板與內容模板的web應用程序整合研究_第1頁
基于格式模板與內容模板的web應用程序整合研究_第2頁
基于格式模板與內容模板的web應用程序整合研究_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于格式模板與內容模板的web應用程序整合研究

0計算機技術在教學中的應用隨著計算機在辦公室自動化工作中的廣泛應用,應用作文進入了一個新階段。用計算機寫作已經(jīng)成為一種新的寫作方法。由于應用作文格式的標準化和內容標準化,幾種應用模型也是結合在一起的。應用文本文件模型不僅可以極大地節(jié)省寫作時間,還可以最大限度地減少錯誤,提高規(guī)范水平,有效提高辦公室效率。因此,越來越多的作家希望擁有實用的文本文件模型。在國外,計算機輔助寫作的研究大概始于20世紀60年代,美國伊利諾斯大學的研究人員為教學研制了計算機輔助寫作系統(tǒng)PLATO1,其方式是讓學生回答計算機提出的問題.在我國,計算機輔助寫作的研究大約始于20世紀80年代,雖然起步較晚,但發(fā)展迅速.應用文輔助寫作是計算機輔助寫作的重要部分,香港大學教育學院母語教學教師支援中心岑紹基等學者對于應用文計算機輔助寫作進行了研究2,他們主要研究了9類實用的應用文類型結構、寫作技巧,給出范文示例,提供互動練習平臺,以幫助學校師生提高應用文寫作水平;2002年大連理工大學金博等提出從樣本及例文庫中檢索出模板所需的寫作材料的方法3,根據(jù)Halliday的語篇理論,從計算機角度給出了與語篇相對應的語塊概念、語塊的特征標識,主要根據(jù)語塊特征和受控語言檢索方法,從樣本庫中檢索出語塊,構成模板所需的寫作材料.近十年來,計算機輔助寫作研究在理論上取得一定的進展.從應用角度看,出現(xiàn)了應用文機輔寫作的商業(yè)化軟件,即利用模板、導航等技術來實現(xiàn)應用文機輔寫作.盡管社會對應用文模板具有強烈的需求,計算機輔助寫作及其相關領域的研究也有所發(fā)展,但圍繞應用文格式與內容模板展開的整合研究還沒有突破性進展,主要原因是關鍵技術不成熟以及計算機輔助寫作的智能程度不高.而應用文格式與內容模板整合研究可以較好地減少應用文寫作中格式排版的重復勞動,節(jié)約人力,提高寫作效率;也可以解決應用文寫作中各種較為明顯的內容缺陷,提高應用文質量;從而提高各類組織應用文制作的總體水平.1文分類管理子系統(tǒng)通過對用戶進行問卷調查及對調查結果進行分析及參考面向高校師生的應用文CAW系統(tǒng)4的軟件結構,系統(tǒng)的總體結構圖1所示.從圖1可知,系統(tǒng)由5個子系統(tǒng)組成.應用文分類管理子系統(tǒng)在整個系統(tǒng)起調度、導航的作用.通過應用文分類管理子系統(tǒng),用戶可以對應用文的分類以及各類應用文的格式、內容進行有效地管理,并提供對應用文寫作方法簡介、格式文件設置等;格式模板設置子系統(tǒng)收集了大量的應用文文體的寫作模板,并按系統(tǒng)的要求制作成格式模板庫和格式模板文件,同時也允許用戶自定義應用文文體的格式模板及格式模板文件;內容模板維護子系統(tǒng)允許用戶把收集到的素材添加到內容模板庫中;用戶通過檢索子系統(tǒng)可按照不同的檢索途徑來搜索內容模板庫,檢索出符合要求的范例,目前該子系統(tǒng)主要提供了文種、標題、關鍵詞、行業(yè)性質等檢索途徑,同時考慮到基于關鍵詞的檢索可能會檢索出大量無關的案例,因此也提供一種基于案例內容的文本模糊檢索方法;文檔生成子系統(tǒng)主要實現(xiàn)一篇應用文的生成過程.2系統(tǒng)格式模板實現(xiàn)途徑應用文寫作過程要求具有格式規(guī)范、用語恰當以及多方面的專門知識,既是具有一定創(chuàng)造性的活動,同時又包含許多重復而繁瑣的工作,這類工作對于人是不勝其煩的,而對計算機卻可以通過模板技術輕易實現(xiàn).應用文格式模板是對每一種應用文文體的各組成部分及其格式進行定義的一種填充框架.系統(tǒng)對格式模板的實現(xiàn)有兩種途徑:(1)自動生成格式模板文件.通過如表1所示結構的數(shù)據(jù)表來存儲應用文文體的各組成部分及格式定義,然后根據(jù)這些定義自動生成格式模板文件.這主要是開發(fā)工具可以通過OLE對象直接對文檔(如Word文檔等)進行格式設置和添加內容.(2)預先設置格式模板文件.用戶預先把應用文文體的格式設置好,并把其每一組成部分存儲在數(shù)據(jù)表中.系統(tǒng)運行時,可以利用OLE對象中的替換功能把格式模板文件中的各組成部分用內容替換掉.采用兩種途徑主要是因為有些格式很難通過VBA來實現(xiàn),這時通過預設的格式模板文件可以減輕系統(tǒng)的開發(fā)難度,同時又能滿足用戶的需要.格式模板實現(xiàn)途徑(1)的關鍵代碼如下:3文本處理及安全學習應用文正文內容撰寫是應用文寫作的核心,有針對性地選擇范例、充實素材是提高應用文質量,保證其內容準確規(guī)范的重要途徑5.在應用文計算機機輔作寫作系統(tǒng)中,需要從內容模板庫中檢索出所需的寫作材料,并以此為參照完成應用文寫作.對內容模板庫分類的傳統(tǒng)方式是按照名稱定義的,這樣定義是不完整的,有時使用者并不知道所需的應用文在內容模板庫中屬于哪種類型,只知道何種用戶所用,或者用于何種用途,并且有時用戶檢索的用途與內容模板庫中定義的用途不一致,造成檢索失敗.而出現(xiàn)在文摘中的詞要比未出現(xiàn)在文摘中的詞更能表達文章的主題,因而對檢索貢獻更大,因此,本系統(tǒng)在內容模板庫的基礎上又定義了包括用戶、用途、自動文摘3種類型的檢索形式,便于用戶對內容模板庫進行檢索.其中,應用文范例的用戶及用途是比較明確的,而如何有效生成自動文摘,以便提高用戶檢索的速度和準確性是本系統(tǒng)研究的一個重要內容.傳統(tǒng)的自動文摘的方法主要有基于統(tǒng)計的機械式摘要和基于語法語義分析的理解式摘要.機械式摘要在技術上易于實現(xiàn),應用領域廣泛,但生成的文摘不連貫、不簡潔、內容不全面.基于理解方法生成的文摘可讀性好,但由于自然語言處理技術至今不成熟,若想獲取高質量的摘要,必須將待處理的語料限制在某個領域內.而考慮到應用文的特殊性,即大多數(shù)應用文都有幾個主題詞,因此可以直接把這些主題詞作為特征信息.應用文內容模板庫中的自動文摘是為檢索服務的,因此文摘的抽取方法是面向檢索的,本系統(tǒng)采用的是直接抽取句子或詞組組成文摘.筆者認為,用戶在檢索文檔時,如果一個句子包含用戶提交的查詢詞,那么用戶很可能認為這個文檔是與自己的查詢相關,因此經(jīng)過分析多種比較適合應用文內容的自動文摘生成方法68,本系統(tǒng)先用文獻SQL模型方法生成粗略的自動文摘,然后用文獻的方法減小文摘冗余度.SQL模型的的基本思想是對集合中的每個文檔建立一個語言模型S,然后基于產(chǎn)生查詢概率對文檔進行排序.在內容核模板的構建中,假定查詢句是由一系列相互獨立的詞構成(甚至可以進一步簡化為應用文的關鍵詞),于是查詢概率PQS可以用每個查詢詞概率的乘積估算出來其中qi是查詢句中第i個關鍵詞,PqiS是指文摘語言模型.P(wS)=λPMLwS+(1-λ)PML(wColl),是平滑系數(shù),可以簡單取0~1之間的任意數(shù);PMLwS是w出現(xiàn)在文檔S中的極大似然估計,可以通過w出現(xiàn)在文摘中的次數(shù)來計算.各句的查詢概率計算出來后,依據(jù)其值將各句降序排列.摘要構造方法是依次將概率最大的句子抽取出來,直到摘要達到指定的長度,摘要的長度是通常是原文的5%~25%(可由用戶設置),接著將這些從原來抽取的文摘句重新組織,按其在原文中的順序排列,這樣文檔的粗文摘就生成了.生成的粗文摘中往往會出現(xiàn)文摘冗余的問題,因為抽取的文摘句子都是很重要的句子,但文檔中經(jīng)常會有關于某一方面重復描述的一些句子,所以要通過句子的相似度計算減少文摘中這樣的句子,但是出現(xiàn)查詢關鍵詞的語句不予考慮,對于相似度大于指定閾值的文摘句,只保留重要度高的一句,丟棄另一句.4web內容模板整合算法格式模板與內容模板的整合主要體現(xiàn)在兩個方面:(1)在設置應用文內容模板時,可以根據(jù)對應的應用文文體的格式表中的各組成部分輸入相應的內容.(2)當通過檢索子系統(tǒng)找到對應的內容模板時,按照格式模板的定義先設置格式后輸出內容.其算法流程圖如圖2所示.應用文格式與內容模板的結合主要體現(xiàn)在文檔生成子系統(tǒng),文檔生成子系統(tǒng)主要有兩種方式:一種是通過檢索子系統(tǒng)找到內容模板,然后按照格式模板的定義先設置格式后輸出內容;另一種是用戶按照格式模板中定義的組成部分的內容,然后利用OLE對象和VBA技術生成應用文,在這個過程中,用戶可以隨時參考內容模板和寫作幫助,從而寫出格式規(guī)范及用語準確的應用文.5文本處理及應用還處于開發(fā)階段,使用者一般在文本文介紹了筆者自主開發(fā)的應用文計算機輔助寫作系統(tǒng)的總體結構及實現(xiàn)方法,經(jīng)用戶試用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論