自然語言的發(fā)展與研究_第1頁
自然語言的發(fā)展與研究_第2頁
自然語言的發(fā)展與研究_第3頁
自然語言的發(fā)展與研究_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、    自然語言的發(fā)展與研究    賀召華摘 要 自然語言理解是人工智能研究重要的領域之一,同時也是目前前沿的難題之一。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法,是未來人工智能的核動力。因此理解自然語言理解以及自然語言理解技術的含義,闡述自然語言理解的研究及其相關應用,綜述自然語言理解技術研究方向變化并對自然語言理解的發(fā)展前景進行分析和展望,是十分有意義的。關鍵詞 自然語言 發(fā)展 研究方向:tp391.1 :a自然語言俗稱人機對話,是人工智能的分支學科。研究用電子計算機模擬人的語言交際過程,使計算機能理解和運用人類社會的自然語言如

2、漢語、英語等,實現人機之間的自然語言通信,以代替人的部分腦力勞動,包括查詢資料、解答問題、摘錄文獻、匯編資料以及一切有關自然語言信息的加工處理。自然語言理解是一門新興的邊緣學科,內容涉及語言學、心理學、邏輯學、聲學、數學和計算機科學,而以語言學為基礎。自然語言理解的研究,綜合應用了現代語音學、音系學語法學、語義學、語用學的知識,同時也向現代語言學提出了一系列的問題和要求。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現自然語言通信的計算機系統(tǒng),特別是其中的軟件系統(tǒng)。因而它是計算機科學的一部分。1自然語言的特征用自然語言與計算機進行通信,這是人們長期以來所追求的。因為它既有明顯的實際

3、意義,同時也有重要的理論意義:人們可以用自己最習慣的語言來使用計算機,而無需再花大量的時間和精力去學習不很自然和習慣的各種計算機語言;人們也可通過它進一步了解人類的語言能力和智能的機制。實現人機間自然語言通信意味著要使計算機既能理解自然語言文本的意義,也能以自然語言文本來表達給定的意圖、思想等。前者稱為自然語言理解,后者稱為自然語言生成。因此,自然語言處理大體包括了自然語言理解和自然語言生成兩個部分。歷史上對自然語言理解研究得較多,而對自然語言生成研究得較少。但這種狀況近年來已有所改變。自然語言處理,即實現人機間自然語言通信,或實現自然語言理解和自然語言生成是十分困難的。造成困難的根本原因是自

4、然語言文本和對話的各個層次上廣泛存在的各種各樣的歧義性或多義性。但從計算機處理的角度看,我們必須消除歧義,而且有人認為它正是自然語言理解中的中心問題,即要把帶有潛在歧義的自然語言輸入轉換成某種無歧義的計算機內部表示。歧義現象的廣泛存在使得消除它們需要大量的知識和推理,這就給基于語言學的方法、基于知識的方法帶來了巨大的困難。2自然語言的發(fā)展60年代至70年代初期,研究工作一直停留在單詞的語音識別上,進展不大。直到70年代中期才有所突破,建立了一些實驗系統(tǒng),能夠理解連續(xù)語音的內容,但是還限于少數簡單的語句。用文字輸入,使計算機“看懂”文字符號,也用文字輸出應答。這方面的進展較快,70年代初期取得突

5、破,中期以后又有所發(fā)展。目前已能在一定的詞匯、句型和主題范圍內查詢資料,解答問題,閱讀故事,解釋語句等,有的系統(tǒng)已付諸應用。由于絕大多數語種使用的是拼音文字,計算機識別拼音字母已無問題,而輸入又是按單詞分別拼寫,因此書面理解一般沒有切分音節(jié)和單詞的問題,只需直接分析詞匯、句法和語義。但是漢語用的是漢字,無論是用漢字編碼輸入還是將來計算機能直接認識漢字,都要首先解決切分單詞的問題,因為輸入就是一連串漢字,詞和詞之間沒有空隔。書面理解的基本方法是:在計算機里貯存一定的詞匯、句法規(guī)則、語義規(guī)則、推理規(guī)則和主題知識。語句輸入后,計算機自左至右逐詞掃描,根據詞典辨認每個單詞的詞義和用法;根據句法規(guī)則確定

6、短語和句子的組合;根據語義規(guī)則和推理規(guī)則獲取輸入句的含義;查詢知識庫,根據主題知識和語句生成規(guī)則組織應答輸出。目前已建成的書面理解系統(tǒng)應用了各種不同的語法理論和分析方法,如生成語法、系統(tǒng)語法、格語法、語義語法等等,都取得了一定的成效。3自然語言的研究方向大約90年代開始,自然語言處理領域發(fā)生了巨大的變化。這種變化的兩個明顯的特征是:(1)系統(tǒng)輸入:要求研制的自然語言處理系統(tǒng)能處理大規(guī)模的真實文本,而不是如以前的研究性系統(tǒng)那樣,只能處理很少的詞條和典型句子。只有這樣,研制的系統(tǒng)才有真正的實用價值;(2)系統(tǒng)輸出:鑒于真實地理解自然語言是十分困難的,對系統(tǒng)并不要求能對自然語言文本進行深層的理解,但要能從中抽取有用的信息。關于自然語言真正理解的研究目前已取得進展。語言是人類區(qū)別其他動物的本質特性。在所有生物中,只有人類才具有語言能力。人類的多種智能都與語言有著密切的關系。人類的邏輯思維以語言為形式,人類的絕大部分知識也是以語言文字的形式記載和流傳下來的。因而,自然語言理解也是人工智能的一個重要核心部分。參考文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論