話語信息的“質(zhì)”與“量”

上傳人：灰*** IP屬地：寧夏上傳時間：2021-09-30 格式：DOC 頁數(shù)：15 大?。?71KB 積分：10.8 舉報 版權(quán)申訴

已閱讀5頁，還剩10頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、話語信息的“質(zhì)”與“量”摘要：本文首先簡要回顧了與話語信息的認(rèn)知處理研究有關(guān)的幾大理論，明確了這些理論對本研究的指導(dǎo)意義，也指出了它們在量化研究方面各自的不足之處。然后分析了話語信息“質(zhì)”的基本特征，并在此基礎(chǔ)上提出了話語信息“量”的計算方法。本研究是話語信息認(rèn)知處理研究的基礎(chǔ)階段，可為進(jìn)一步研究處理過程、處理能力及能力的培養(yǎng)與測試奠定基礎(chǔ)。關(guān)鍵詞：話語信息；質(zhì)；量abstract: this paper first briefly reviews some basic theories concerning the cognitive processing of discourse info

2、rmation, making clear their contributions to the present research and their demerits in information quantification as well. it goes on to probe into the quality characteristics of discourse information, on the basis of which information computing methods are then put forward. the present research is

3、 intended to be a fundamental study that is essential to further studies on processing procedures, processing abilities, and ability cultivation and testing.key words: discourse information; quality; quantity一、問題的提出語言信息處理研究對“語言信息”一詞并沒有一個理論上的統(tǒng)一界定，對語言信息質(zhì)和量的特征也缺乏足夠的認(rèn)識。這不僅導(dǎo)致了對這個詞在理解上的模糊和用法上的混亂，也無法對語言信息

4、的處理提供一個量上的解釋。那么，話語作為信息究竟具有哪些區(qū)別于其他事物的“質(zhì)”的特征，又該如何計算話語信息的“量”？我們認(rèn)為兩個問題是話語信息認(rèn)知處理研究的根本性問題，充分認(rèn)識話語信息的質(zhì)與量的特征，不僅是話語信息量化處理的前提，更是信息的認(rèn)知處理過程研究和處理能力及其培養(yǎng)與測試研究的基礎(chǔ)。二、語言信息研究回顧1. 信息論信息是什么？迄今為止還沒有一個公認(rèn)的定義。信息論(information theory)的奠基人申農(nóng)(shannon)1把信息界定為認(rèn)識主體接收到的、可以減少或消除不確定性的新內(nèi)容和新知識，并提出了信息傳遞的基本模式(參見圖 1)。在這個模式中，信源和信宿可以是人、機(jī)器、自

5、然界的物體等；信源發(fā)出文字、圖象、語言、電磁波等消息；消息被編碼成信號后經(jīng)信道傳送；信宿接收到信號后將其解碼并還原為消息。消息是信息的載體，具有隨機(jī)性和不確定性。如果消息是事先知道的、確定的，對信宿來說就無甚信息可言。桂詩春2: 197進(jìn)一步解釋說，“消息是否就是信息，主要是看有沒有起到減少不確定性的作用”，新內(nèi)容和新知識之所以是信息，就是因為其有助于不確定性的減少(reduction of uncertainty)。信息論把信息量定義為不確定性的減少或消除程度。這種程度表示一種可能性或概率，跟概率成反比，概率越大，不確定性程度越低，信息量就越小；反之，信息量就越大。概率經(jīng)轉(zhuǎn)換計算后可表示為一

6、個以比特(bit)為單位的數(shù)量，如概率為10的信息，其信息量為3.32比特，而90的概率只等于0.15比特的信息量(計算方式參見2:202-203)。消息信號信號噪音消息信源編碼信道譯碼信宿噪音圖 1通信系統(tǒng)的基本模式（轉(zhuǎn)引自2:197）根據(jù)信息論的上述觀點，話語信息可被定義為能減少或消除受話人的不確定性的話語內(nèi)容。話語作為信息，其信息價值取決于能否減少或消除受話人的不確定性；其信息含量則取決于不確定性的減少或消除程度。對話語信息和信息量的這種認(rèn)識對話語信息的認(rèn)知處理研究具有重要的指導(dǎo)意義：首先，語言在未經(jīng)表達(dá)成話語之前，不可能起到不確定性的消除作用，所以，嚴(yán)格地說，語言并不是信息，所謂的語言

7、信息實際上應(yīng)該是指話語信息。其次，如果內(nèi)容是受話方已知的，則不存在不確定性的消除，所以，話語信息應(yīng)該是話語中的未知內(nèi)容。不過，信息論為了實現(xiàn)用數(shù)學(xué)方式來精確地計算信息的量，不得不舍棄信息的內(nèi)容而把解決問題的焦點放在信息的形式即信息編碼上。這種純粹考慮形式的量化方式，并不能用來計算內(nèi)容的量，所以，話語信息內(nèi)容的量化必須另辟新徑。2. 信息結(jié)構(gòu)理論二十世紀(jì)初，索緒爾(saussure)在語言學(xué)中首先發(fā)動了一場革命，把語言學(xué)從十九世紀(jì)的歷史比較語言學(xué)的窄范圍內(nèi)解放出來，開創(chuàng)了一個結(jié)構(gòu)主義的新時期3。結(jié)構(gòu)主義語言學(xué)研究4; 5從信息傳遞功能的角度提出了句法功能觀(functional sentence

8、 perspective)，認(rèn)為每個句子都是一個基本單位，并可切分為主位(theme)和述位(rheme)兩個組成部分。主位是位于句首的成分，在交際過程中起著引出話題的作用，傳遞交際雙方已經(jīng)熟悉或有所聞的內(nèi)容已知信息(given information)。其他成分是述位，是對主位的敘述、描寫和說明，傳遞對方未知的內(nèi)容新信息(new information)。句子的功能即是利用已知信息導(dǎo)出新信息，信息在句子和語篇中的推進(jìn)體現(xiàn)出信息的流動和分布狀況。韓禮德(halliday)6基于句法功能觀的基本思想，提出了信息結(jié)構(gòu)(information structure)的概念，并將句子中新、舊信息之和表示

9、為一個信息單位(information unit)，后來這一思想被稱為“信息結(jié)構(gòu)理論”(information structure theory)。信息結(jié)構(gòu)理論把已知內(nèi)容也稱為信息，而不論其是否具有不確定性的消除作用，這是我們不敢茍同的地方；雖然提出了信息的量化單位，但卻沒有進(jìn)一步研究信息的量化標(biāo)準(zhǔn)和計算方法，這是我們認(rèn)為該理論的不足之處。但其“已知導(dǎo)出未知”的信息推進(jìn)模式能很好解釋話語信息的傳遞方式和過程，并對語言的銜接與連貫研究具有重要的指導(dǎo)意義，也是我們提出“已知假設(shè)原則”(見后文)的基礎(chǔ)。許多語言學(xué)家(參見7;8)都曾致力于發(fā)現(xiàn)和描述各種信息推進(jìn)模式，并用來指導(dǎo)口語、寫作、翻譯等方面的

10、理論研究和教學(xué)實踐。3. 信息認(rèn)知處理觀神經(jīng)認(rèn)知語言學(xué)的創(chuàng)始人蘭姆(s. lamb)提出“語言是大腦神經(jīng)網(wǎng)絡(luò)中的語言信息系統(tǒng)，它必須不悖于大腦事實”(參見9:17)的觀點，把語言信息系統(tǒng)和大腦神經(jīng)網(wǎng)絡(luò)系統(tǒng)結(jié)合在一起，奠定了語言信息認(rèn)知處理的基礎(chǔ)。神經(jīng)認(rèn)知語言學(xué)9;10認(rèn)為神經(jīng)網(wǎng)絡(luò)具有巨并行性、聯(lián)想性、自調(diào)節(jié)適應(yīng)性、自學(xué)習(xí)性和容錯性等特征，并且能通過神經(jīng)元的時空加權(quán)學(xué)習(xí)來快速激活神經(jīng)連通或產(chǎn)生聯(lián)想。人腦在處理信息時以空間復(fù)雜性代替了時間復(fù)雜性，而不像機(jī)器處理僅具有分時處理能力，所以，雖然自然神經(jīng)細(xì)胞之間傳遞信息以毫秒計算，比計算機(jī)慢得多，但人們通常能在不到一秒的時間內(nèi)對外界事物作出判斷和決策，這

11、種速度是機(jī)器處理絕對達(dá)不到的。語音層語法層概念層聚組合在地上在黑板上在桌子上丟掛放廢紙公式書學(xué)生老師他合ab體現(xiàn)關(guān)系表達(dá)子系統(tǒng)概念子系統(tǒng)體現(xiàn)圖 2 語義的體現(xiàn)關(guān)系神經(jīng)認(rèn)知語言學(xué)還認(rèn)為，語義的生成和理解是概念信息與表達(dá)信息(語音、語法)之間的體現(xiàn)關(guān)系，人們是通過聲音、文字對語義的體現(xiàn)來表達(dá)或獲取意思的。圖 2a9: 26描述了體現(xiàn)關(guān)系的層級性：語言信息系統(tǒng)分為概念子系統(tǒng)和表達(dá)子系統(tǒng)，表達(dá)子系統(tǒng)又下分語法子系統(tǒng)和語音子系統(tǒng)，兩個子系統(tǒng)之間是表達(dá)對概念的體現(xiàn)關(guān)系；圖 2b9: 104-105描述了體現(xiàn)關(guān)系的多維性：縱深維度的聚合關(guān)系表示詞的選擇、水平維度的組合關(guān)系表示詞的排列、垂直維度的體現(xiàn)關(guān)系表示

12、語義的表達(dá)和理解。神經(jīng)認(rèn)知語言學(xué)把信息量定義為“輸入信息和內(nèi)部系統(tǒng)所含信息之間的關(guān)系”9:30，并認(rèn)為：外部環(huán)境輸入所含的新信息越多，信息量就越大，信息量太大時處理就會中斷；知識越豐富，語言技能越高，外部環(huán)境輸入所含的新信息就會越少，信息也就會越容易加工。神經(jīng)網(wǎng)絡(luò)的巨并行信息處理能力和神經(jīng)元的時空加權(quán)學(xué)習(xí)機(jī)制，能很好地解釋為什么人能夠快速處理各種復(fù)雜的語義。語義體現(xiàn)關(guān)系的層級性和多維性觀點，為話語信息的語義體現(xiàn)邏輯和語義范疇劃分提供了很好的借鑒作用(見圖 3中的語義體現(xiàn)部分)。但是，在信息量的研究方面，該理論僅是用新信息的量來表示信息量。而至于新信息究竟有多少？又該如何計算？仍然無從得知。三、

13、話語信息的“質(zhì)”1. 主觀性話語信息的主觀性主要體現(xiàn)在兩個方面：正確性和不確定性。根據(jù)馬克思主義哲學(xué)的認(rèn)識論思想11，認(rèn)識是事物在人腦中的反映，是人通過社會實踐獲得的，并要經(jīng)歷從感性到理性、由表面到本質(zhì)、從局部到全局的發(fā)展過程。這說明：首先，作為認(rèn)知主體的發(fā)話方，由于受經(jīng)驗、知識、能力等自身條件的約束和特定歷史條件下整體認(rèn)知水平的限制，對事物的認(rèn)識存在著正確和錯誤之分，或者正確性程度差異，并會在話語中通過語義的表達(dá)而體現(xiàn)出來。其次，同樣作為認(rèn)知主體的受話方，由于受到相同的約束和限制，對說話人所表達(dá)的語義有已知和未知之分，或不確定性程度差異。受話方通過話語理解，把未知轉(zhuǎn)變?yōu)橐阎?，即實現(xiàn)了信

14、息的價值不確定性的消除。第三，隨著認(rèn)識的不斷深入，正確性程度會從完全錯誤不斷趨向完全正確，不確定性程度也會從完全不知逐步過渡到全面了解。正確性和不確定性總是處于連續(xù)體(continuum)某個點上，當(dāng)達(dá)到或超過了某一個可以被接受的值時，即被認(rèn)為是正確的或已知的，否則就是錯誤的或未知的。主觀性對話語信息的認(rèn)知處理能力研究具有重要意義。不同的人由于個人經(jīng)驗、知識、能力的不同，信息處理能力也不一樣。由于經(jīng)驗可轉(zhuǎn)化為常識或?qū)I(yè)知識，感性和理性認(rèn)識都涉及認(rèn)知能力，同時人作為一個高度自動化的生命系統(tǒng)能對自己的狀態(tài)和行為進(jìn)行自我調(diào)節(jié)和控制12，所以，我們可以把影響處理能力的因素概括為兩個大類已知知識和實踐能

15、力，并把已知知識分為常識知識和專業(yè)知識，把實踐能力分為認(rèn)知能力和調(diào)控能力(見圖 3認(rèn)知主體部分)。認(rèn)知對象認(rèn)知主體靜態(tài)屬性已知知識動態(tài)事件認(rèn)知能力排列時間選擇體現(xiàn)語義范疇正確性程度語義體現(xiàn)調(diào)控能力不確定性程度語法語音文字詞匯句子表層體現(xiàn)層深層存在形式普遍聯(lián)系策略能力常識知識專業(yè)知識時空運動質(zhì)量變化語言形式語篇語義圖 3 話語信息的層級性、多維性和關(guān)聯(lián)性2. 層級性層級性指同時具有層次性和等級性。話語信息的層級性包括語義體現(xiàn)關(guān)系和語義范疇分類兩個方面(見圖 3)。從體現(xiàn)關(guān)系來看，語音和文字是話語信息的物質(zhì)載體，位于最表層；語音和文字分別以聲波和光電信號被受話人感知、加工并切分為心理詞匯。詞匯按時

16、間順序先后輸入，激發(fā)詞義的提取和語法分析，產(chǎn)生句子意義。句子的有序組合生成段落、篇章等語篇信息，并產(chǎn)生語境意義。詞匯、語法、句子、語篇相互作用，共同構(gòu)成體現(xiàn)層；語義位于最深層，是語言形式的最終體現(xiàn)。從語義范疇的分類來看，語義可反映事物的各個方面，每個方面都可以表示為一個范疇或語義類。借鑒計算機(jī)科學(xué)的面向?qū)ο笾R表示理論(object-oriented knowledge presentation theory)，我們可以對語義進(jìn)行層級分類。該理論認(rèn)為13;14，類(class)是對同類事物所有共同特征的抽象概括，上可以有父類，下可以有子類，子類繼承其所有上層父類的全部特征，構(gòu)成層級繼承關(guān)系。對

17、象(object)是所屬類的實體(entity)，是類的具體表現(xiàn)形式，既具有所屬類的全部屬性(attribute)，同時又擁有自身的區(qū)別性特征，具有個性差異。如圖 3所示，我們把所有事物抽象為認(rèn)知對象，認(rèn)知對象由靜態(tài)屬性和動態(tài)事件(event)兩個不可分割的組成部分構(gòu)成，屬性描述事物的存在形式和普遍聯(lián)系，事件描述事物的時空運動和質(zhì)量變化。這種層級關(guān)系表示：無論存在形式是客觀物質(zhì)還是主觀意識，都是普遍聯(lián)系并永恒運動和變化的事物，是在特定時間點上的所有靜態(tài)屬性的集合，語言信息處理技術(shù)稱之為復(fù)雜特征集15。認(rèn)知主體也可以被自身和其他主體認(rèn)識，因而是認(rèn)知對象的子類，也具有自己的屬性和事件。但同時，認(rèn)知

18、主體又擁有區(qū)別于其他認(rèn)知對象的個性特征：擁有已知知識和策略能力這兩個不可分割的組成部分，既具有常識和專業(yè)知識等已知知識，又具備策略能力。存在形式、普遍聯(lián)系、運動過程、變化過程、常識知識、專業(yè)知識、認(rèn)知能力、調(diào)控能力等語義類還可不斷向下分割，產(chǎn)生范疇更小、更具體的語義范疇。體現(xiàn)關(guān)系和語義范疇的層級性對話語信息認(rèn)知處理過程的認(rèn)識具有重要意義。這兩個方面的層級性意味著認(rèn)知處理的正常進(jìn)行必須同時滿足兩個條件：共同的語言形式和語義范疇。語言交際雙方的語音、文字、詞匯、語法知識必須大致相同，或者說，個性特征上有差異，但本質(zhì)特征必須完全一致。語言不同或方言差別太大，話語信息的處理就無法正常完成。同樣，說話人

19、和受話人雙方必須共享本質(zhì)特征完全一致的語義范疇，對事物的本質(zhì)特征及其運動變化有共同的認(rèn)識。如果說話方把手機(jī)當(dāng)作通信工具來描述，而受話方把手機(jī)當(dāng)作服裝來理解，語言交際也同樣無法進(jìn)行。3. 多維性話語信息的多維性指的是語義建構(gòu)過程中影響語義體現(xiàn)關(guān)系的多個方面。每個方面表示一種關(guān)系，如圖 3所示的時間關(guān)系、選擇關(guān)系、排列關(guān)系和體現(xiàn)關(guān)系。這些關(guān)系共同作用，反映了語義的建構(gòu)過程某個時間點上先選擇、再排列、到最后體現(xiàn)的過程。這個過程在信息生成時是發(fā)話的語義新建過程，在信息理解時是受話的語義重構(gòu)過程。語義建構(gòu)是個實時的邏輯運算過程。首先，建構(gòu)過程具有實時性。無論是發(fā)話的語義新建還是受話的語義重構(gòu)，語義建構(gòu)都

20、是在某個時間點或時間序列上的操作，具有時間屬性。雖然有時并不需要處理這個時間屬性的值，但時間值總是客觀存在的。其次，建構(gòu)過程是語言要素參與邏輯運算的過程。邏輯運算有三種方式：邏輯或(or)，邏輯與(and)和邏輯非(not)。選擇關(guān)系是邏輯或的運算，這主要體現(xiàn)在兩個方面：語音和文字之間的選擇，即語義建構(gòu)時語音和文字這兩種語言形式只能二者選一，要么是語音，要么是文字；用詞的選擇，即一個句法位上，備選詞可以無窮多，但一次能且只能使用一個詞。排列關(guān)系是邏輯與的運算，即詞的組合必須按語法規(guī)則有序排列，詞匯和語法必須共同作用，才能最終確定語義；體現(xiàn)關(guān)系類似于邏輯非的運算，即所體現(xiàn)的語義具有真值(true

21、)和假值(false)之分，真值是認(rèn)知對事物的正確反映，假值是錯誤的反映。4. 關(guān)聯(lián)性世界上的所有事物，無論是物質(zhì)的還是心理的，都是以某種方式直接或間接地普遍聯(lián)系在一起的。事物之間的普遍聯(lián)系錯綜復(fù)雜，形式繁多，并且在很多情況下是隱含的，有時甚至是任意的、不可預(yù)測的，必須經(jīng)過深入思考并運用一定的知識或憑借相關(guān)經(jīng)驗才能認(rèn)識到。關(guān)聯(lián)的這種普遍性、多樣性、隱蔽性、隨意性、偶然性等，是導(dǎo)致語義復(fù)雜性的根本原因。如果缺乏相關(guān)知識、不具備相應(yīng)的認(rèn)知能力，那么，在信息生成過程中關(guān)聯(lián)很難被發(fā)覺，在信息獲取過程中也難以被理解。作為認(rèn)知主體的人，能利用已知的常識知識和專業(yè)知識，發(fā)揮認(rèn)知能力和自我調(diào)節(jié)與控制能力，較好

22、地處理各種復(fù)雜的關(guān)聯(lián)；而對機(jī)器來說，關(guān)聯(lián)的復(fù)雜性則是信息處理所面臨的最大困難，也是技術(shù)突破的“瓶頸”之所在。計算機(jī)科學(xué)中的統(tǒng)一建模語言(unified modeling language)為描述事物的關(guān)聯(lián)提供了科學(xué)的方法。統(tǒng)一建模語言(參見16)把對象之間的關(guān)聯(lián)分為三種：類與子類，整體與部分，對象與對象。類與子類的關(guān)聯(lián)用三角形表示，可參見語義范疇的層級分類；整體與部分關(guān)聯(lián)指多個對象可以組成一個整體，形成部分與整體的團(tuán)聚(aggregation)關(guān)系，用空心菱形表示。如果部分與整體具有不可分割性，則這種團(tuán)聚的強(qiáng)勢模式構(gòu)成復(fù)合(composition)關(guān)系，用實心菱形表示；對象之間也可以各種方式相

23、互關(guān)聯(lián)在一起，用實線連接。這種關(guān)聯(lián)按關(guān)聯(lián)元素的多少可分為二元(binary)、三元(ternary)和多元(n-ary)關(guān)聯(lián)。關(guān)聯(lián)本身也是獨立的類，稱為關(guān)聯(lián)類(association class)，用虛線連接，表示關(guān)聯(lián)類不屬于關(guān)聯(lián)元素的任何一方，而是體現(xiàn)元素之間的相互關(guān)系，所有的多元關(guān)聯(lián)都可分解為多個三元或二元關(guān)聯(lián)。圖 3即是用統(tǒng)一建模語言繪制的。話語信息的關(guān)聯(lián)性指的是語境中各要素之間的關(guān)聯(lián)。圖 3中大菱形體現(xiàn)了話語信息在語境中生成和理解時的多元關(guān)聯(lián)。語境由作為認(rèn)知主體的發(fā)話和受話以及認(rèn)知對象三大要素組成；語言形式是三大環(huán)境要素相互作用的結(jié)果，體現(xiàn)了三者之間的關(guān)聯(lián)，是一個關(guān)聯(lián)類。正確性程度、確

24、定性程度、語義范疇和體現(xiàn)關(guān)系分別表示各要素在關(guān)聯(lián)中的角色：發(fā)話能夠在一定程度上正確認(rèn)識事物；受話能利用信息在一定程度上消除對事物認(rèn)識的不確定性；認(rèn)知對象的存在形式、普遍聯(lián)系和運動變化表示語義范疇的分類；語言形式描述了語義的體現(xiàn)關(guān)系。另外，信息傳遞過程中也存在著關(guān)聯(lián)(見圖 1)：信源發(fā)出消息，消息被編碼成信號，信號通過信道傳遞并在接收后被解碼還原為消息。信息傳遞過程會受到各種噪音的干擾，噪音使得接收到的消息中存在著誤差。四、話語信息的“量”1. 信息單位和信息結(jié)構(gòu)根據(jù)圖 3可知：認(rèn)知對象包括靜態(tài)特征和動態(tài)過程兩個不可分割的組成部分，是靜態(tài)屬性和動態(tài)事件的對立統(tǒng)一。這表示：在單個時間點上，對象是

25、相對靜止的，靜止對象是對象所有屬性的集合；在時間的延伸線上，對象是永恒運動和不斷變化的，動態(tài)事件的過程可分解為時間連續(xù)體上靜態(tài)對象的集合。面向?qū)ο罄碚?3;14用的形式來描述事物的屬性，并認(rèn)為事物的運動和變化就是對屬性值(attribute value)的改變，可用函數(shù)(function)的執(zhí)行步驟來表示運動和變化的過程。對靜態(tài)對象的描述即是給屬性直接賦值，對運動和變化的描述即是調(diào)用函數(shù)來修改屬性值。函數(shù)以對象或?qū)ο髮傩院蜁r間為參數(shù)(parameter)，既可在運行過程中修改屬性的值，也可在運行結(jié)束后返回屬性的新值。借鑒這種理論，我們可以把事物的存在形式、普遍聯(lián)系、運動變化都抽象為屬性，并用屬

26、性值的改變來描述事物運動和變化。每一個屬性都表示一個語義項(semantic item)，話語中涉及了事物的多少個屬性，就包含了多少個語義項，因此可以說，語義項是話語的信息單位。屬性用的形式來表示，屬性名是對特征、關(guān)聯(lián)、運動和變化的抽象概括，屬性值則是對屬性的具體描述，所以，這種的形式也就是話語的信息結(jié)構(gòu)。下面以句子意義為例，說明如何用對來表示語義項，進(jìn)而體現(xiàn)受話人對句子意義的一種理解。(1)我支持他去國外留學(xué)。語義范疇為本質(zhì)存在主觀意識。語義項有，。(2)李華昨天坐飛機(jī)去北京了。語義范疇為運動過程位置移動。語義項包括，。(3)外面結(jié)冰了。語義范疇為變化過程形態(tài)變化。語義項有，。(4)這本書是

27、我從張三那里借來的。語義范疇為普遍聯(lián)系人物關(guān)系。語義項有，。(5)產(chǎn)品全部合格/產(chǎn)品全不合格。語義范疇為本質(zhì)存在客觀物質(zhì)。語義項有，。(6)開刀的是他父親。語義范疇為本質(zhì)存在客觀事實。語義項有：a.，或b.，。2. 話語信息的構(gòu)成要素信息具有不確定性的減少或消除作用，否則，就不是信息。那么，語義項若為已知內(nèi)容則不是信息，不能或沒有被理解同樣也不是信息。若把話語信息的構(gòu)成要素稱為信息點，那么信息點必須同時具備兩個條件：已理解且未知?？梢?，話語信息是由已理解且未知的語義項構(gòu)成的，信息量也是由已理解且未知的語義項數(shù)量決定的。未知和已知都是相對于受話人而言的。未知是發(fā)話人認(rèn)為受話人在說話時刻還不知道的

28、內(nèi)容。未知是語言交際的意義所在，是信息價值的集中體現(xiàn)?！拔覀冋f話總是想告訴人某些信息，至少在他認(rèn)為有些新的內(nèi)容，如果說的都是大家知道的情況就失去交際的意義”17: 165。firbas5的交際動力說(communicative dynamism)也認(rèn)為沒有傳遞新信息的句子是沒有交際價值的。我們認(rèn)為，人們進(jìn)行語言交流，就是為了把對方未知的內(nèi)容傳遞過去，使之成為對方的已知內(nèi)容，從而達(dá)到消除不確定性目的。已知是發(fā)話人認(rèn)為受話人在說話時刻已經(jīng)熟悉、可以聯(lián)想到或能推測出來的內(nèi)容。未知必須與已知相關(guān)，是作為已知內(nèi)容的補充而存在的，缺乏已知，交際同樣也沒有意義。如例2中，“昨天”、“坐飛機(jī)”、“去北京了”是

29、未知內(nèi)容，是說話人想要傳遞給受話人的信息，即告訴對方李華去了北京這事件，以及事件發(fā)生的時間和方式?！袄钊A”則必須是已知內(nèi)容，即受話方所熟悉或知道的人，否則，把李華去北京的事告訴對方是沒有意義的。所以，我們認(rèn)為，說話人在傳遞信息時會遵循一個潛規(guī)則，即假定對方已知一定的內(nèi)容，并以此已知為基礎(chǔ)來傳遞未知，展開對已知的敘述、描寫、說明和補充。我們稱這個規(guī)則為已知假設(shè)原則。3. 話語信息的量化計算要實現(xiàn)話語信息量的計算，首先必須以高度抽象的數(shù)學(xué)形式對話語信息進(jìn)行形式化表示，然后再確定信息量的計算方式。為此，我們特作出如下假設(shè)和定義：設(shè)attr為屬性名，val為屬性值，a為一項屬性，o為靜態(tài)對象，為動態(tài)事

30、件，t為時間。定義1：一個語義項或靜態(tài)屬性可用一個對表示。(1)attr為屬性名，val為屬性值。val也可以是對象，從而構(gòu)成屬性的層級關(guān)系。定義2：靜態(tài)對象是事物所有靜態(tài)屬性的集合。(2)其中：n為屬性的數(shù)量，ai:為attri=vali。定義：動態(tài)事件是按時序排列的靜態(tài)對象的集合。(4)其中：oi為一個靜態(tài)對象，n為對象的數(shù)量。定義：運動和變化可表示為函數(shù)，函數(shù)的返回值是運動或變化的結(jié)果，表示靜態(tài)屬性值在時間點上的改變。函數(shù)也可不返回值而在執(zhí)行過程直接修改屬性的值。(3)其中：o為函數(shù)返回的新對象或新的屬性值，funname為函數(shù)名，參數(shù)o表示對象(也可用一至多個屬性代替)，參數(shù)t表示時間

31、。參數(shù)可省略，函數(shù)也可不返回新對象。定義5：把第一次出現(xiàn)的特征稱為新特征，把已理解且未知的新特征稱為信息點(記為i)，那么，對象中所有非重復(fù)信息點的集合i為：(5)其中，ir為一個非重復(fù)信息點，n為信息點的數(shù)量。定義6：信息總量是各相關(guān)對象的信息點的數(shù)量的和，記為t。(6)其中，ik為一個靜態(tài)對象信息點集合，n為對象的數(shù)量，count()為信息點的計數(shù)函數(shù)。下面以例3為例，簡要分析話語信息的形式化表示和量化計算。該例語境中可能涉及到的對象及其屬性有：表示運動和變化的函數(shù)有：對象冰固態(tài)結(jié)冰(室外，0以下，過去時間)；發(fā)話方室內(nèi)進(jìn)入(房門，現(xiàn)在時間)、認(rèn)知1感覺(視覺，冰，過去時間)、認(rèn)知2感覺(

32、觸覺，氣溫，現(xiàn)在時間)、認(rèn)知3感覺(視覺，受話方，坐著，現(xiàn)在時間)；受話方狀態(tài)坐(沙發(fā)，現(xiàn)在時間)、認(rèn)知4感覺(視覺，說話人，進(jìn)入，現(xiàn)在時間)、認(rèn)知5知覺(結(jié)冰否定，現(xiàn)在時間)、認(rèn)知6思維(說話人，氣溫，空調(diào)狀態(tài))。溫度、形態(tài)、事件、意圖、認(rèn)知1、認(rèn)知2、認(rèn)知5和認(rèn)知6應(yīng)是未知的，可作為信息點處理；而類屬、名稱、位置、動作、狀態(tài)和其他認(rèn)知事件則是已知內(nèi)容，不能作為信息點處理。因此，這句話的信息總量可按如下方式求得：count(冰)=類屬，名稱，溫度，形態(tài)，事件類屬，名稱=3。count(發(fā)話方)=類屬，位置，意圖，動作，認(rèn)知1，認(rèn)知2，認(rèn)知3類屬，位置，動作，認(rèn)知3=3。count(受話方)=

33、類屬，位置，狀態(tài)，認(rèn)知4，認(rèn)知5，認(rèn)知6類屬，位置，狀態(tài)，認(rèn)知4=2。tcount(冰)count(發(fā)話方)count(受話方)3328。4. 量化計算的認(rèn)知特征當(dāng)然，在日常語言交際過程中，人們并不需要刻意地去計算信息的量，更不會按上面形式逐一列舉屬性和過程，這是因為人們在理解話語的過程中往往會遵循另外一個原則任務(wù)相關(guān)原則。人們總能根據(jù)任務(wù)的需要對屬性進(jìn)行快速取舍，僅選擇與交際任務(wù)密切相關(guān)的屬性，而自動舍棄其他無關(guān)屬性，從而確定語義的范疇和數(shù)量。但這并不意味著信息的形式化和量化不重要，相反，高度抽象的形式化表示意味著對語言理解的深刻認(rèn)識，量化則為信息的計算提供了科學(xué)的手段。任務(wù)相關(guān)原則充分體現(xiàn)

34、了話語信息的認(rèn)知處理特色：主觀性和簡約性。受主觀性的影響，同樣的話語，對于不同的受話人、不同的處理時間，未知的內(nèi)容也有可能不同，信息量的大小也就有可能不一樣；同樣的話語，不同的人在不同的語用環(huán)境中可能會有不同的理解，語義范疇的劃分、屬性的概括、語義項的選擇也就會不同。這都說明，信息的量化處理具有相對性，是相對于受話人、處理時間和語用環(huán)境而言的。另外，日常語言交際過程中，人們會盡可能地簡化信息內(nèi)容和處理方式。在內(nèi)容方面，人們往往只會根據(jù)需要有選擇地處理某些信息而不是全部信息；在方法上，只會關(guān)注結(jié)構(gòu)中值的部分，而不會去概括出屬性的具體名稱。不管名稱是什么，只要能感覺到有某個屬性的存在，猶如有個空槽

35、(slot)，用到時只需往里面填值(表達(dá)時)或取值(理解時)就行。例3中，一般情況下，發(fā)話只對受話講述了一個事實看到了冰(認(rèn)知1)，受話方通過話語理解僅移除了一項不確定性不知道已結(jié)冰(認(rèn)知5)，交際雙方只需2個信息點即可完成交際任務(wù)。如果話語出現(xiàn)在聽力對話中，語義項的取值有可能是氣溫在0以下，也有可能是對話在室內(nèi)進(jìn)行，或者是受話考慮開空調(diào)等等。如果是視頻中的話語，聽者則有可能已經(jīng)在畫面中看到說話人見到過冰，看到了雙方對話的交際過程，此時的未知和已知內(nèi)容又不一樣。五、結(jié)語話語信息的主觀性、層級性、多維性和關(guān)聯(lián)性等特征，使得話語信息的處理具有極其復(fù)雜性的一面。這種復(fù)雜性是話語信息機(jī)器處理的“瓶頸

36、”之所在，不具備認(rèn)知能力的機(jī)器因而無法從信息的內(nèi)容即語義上來精確地計算信息的量。但人在處理復(fù)雜的話語信息時，能積極調(diào)用相關(guān)的知識和經(jīng)驗、充分發(fā)揮生來與俱的認(rèn)知和調(diào)控能力，從而迅速地將語義限定在一個相對有限的范圍之內(nèi)，因此，在話語信息的認(rèn)知處理過程中，基于語義計算的信息量化是完全可行的。當(dāng)然，研究話語信息的量化處理不僅僅是為了對話語信息提供一個量上的解釋，更重要的是為進(jìn)一步研究話語信息的處理過程、處理能力，并最終為處理能力的培養(yǎng)和測試研究奠定基礎(chǔ)。參考文獻(xiàn)：1 shannon, c.e. a mathematical theory of communicationj. the bell system technical journal, 1948, (27).2 桂詩春.實驗心理語言學(xué)綱要語言的感知、理解與產(chǎn)生m. 長沙: 湖南教育出版社, 1991.3

人人文庫> 全部分類> 生活休閑 > 科普知識

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

話語信息的“質(zhì)”與“量”

文檔簡介

溫馨提示

最新文檔

評論

話語信息的“質(zhì)”與“量”

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔