數(shù)據(jù)結(jié)構(gòu)間的縱橫聯(lián)系_第1頁(yè)
數(shù)據(jù)結(jié)構(gòu)間的縱橫聯(lián)系_第2頁(yè)
數(shù)據(jù)結(jié)構(gòu)間的縱橫聯(lián)系_第3頁(yè)
數(shù)據(jù)結(jié)構(gòu)間的縱橫聯(lián)系_第4頁(yè)
數(shù)據(jù)結(jié)構(gòu)間的縱橫聯(lián)系_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)結(jié)構(gòu)間的縱橫聯(lián)系     摘  要 本文詳細(xì)闡述了數(shù)據(jù)結(jié)構(gòu)間的縱橫聯(lián)系,所謂“橫向聯(lián)系”是對(duì)各種數(shù)據(jù)結(jié)構(gòu)研究都從邏輯結(jié)構(gòu)、存儲(chǔ)結(jié)構(gòu)、操作運(yùn)算三方面出發(fā)的模式思想,所謂“縱向聯(lián)系”是以簡(jiǎn)單數(shù)據(jù)結(jié)構(gòu)類(lèi)型為基礎(chǔ)來(lái)實(shí)現(xiàn)對(duì)較復(fù)雜數(shù)據(jù)結(jié)構(gòu)類(lèi)型的研究。     關(guān)鍵詞 邏輯結(jié)構(gòu)  存儲(chǔ)結(jié)構(gòu) 操作運(yùn)算  橫向聯(lián)系 縱向聯(lián)系   1 引言     數(shù)據(jù)結(jié)構(gòu)作為計(jì)算機(jī)核心學(xué)科,其主要研究?jī)?nèi)容:邏輯結(jié)構(gòu),物理存儲(chǔ)結(jié)構(gòu),操作(或算法)1。通常,算法的設(shè)計(jì)取決于數(shù)據(jù)的

2、邏輯結(jié)構(gòu),算法的實(shí)現(xiàn)取決于數(shù)據(jù)的物理存儲(chǔ)結(jié)構(gòu)。     根據(jù)數(shù)據(jù)元素之間不同特性,把數(shù)據(jù)結(jié)構(gòu)劃分四種基本結(jié)構(gòu):(1)集合,(2)線型結(jié)構(gòu),(3)樹(shù)型結(jié)構(gòu),(4)圖狀結(jié)構(gòu)或網(wǎng)狀結(jié)構(gòu)。針對(duì)每種數(shù)據(jù)結(jié)構(gòu)均從邏輯結(jié)構(gòu)、存儲(chǔ)結(jié)構(gòu)和操作運(yùn)算等方面進(jìn)行研究,是貫穿數(shù)據(jù)結(jié)構(gòu)研究始終的 “紅線”,也是數(shù)據(jù)結(jié)構(gòu)研究的共同切入點(diǎn),稱之為數(shù)據(jù)結(jié)構(gòu)的“橫向聯(lián)系”。從集合、線型結(jié)構(gòu)等基本數(shù)據(jù)結(jié)構(gòu)入手,以實(shí)現(xiàn)樹(shù)形結(jié)構(gòu)、圖或網(wǎng)狀結(jié)構(gòu)等較復(fù)雜結(jié)構(gòu)研究,實(shí)現(xiàn)數(shù)據(jù)元素間的關(guān)系從簡(jiǎn)單到復(fù)雜探討,稱之為“縱向聯(lián)系”。 2  邏輯結(jié)構(gòu)、存儲(chǔ)結(jié)構(gòu)、操作運(yùn)算的思想模式數(shù)據(jù)結(jié)構(gòu)間的橫向聯(lián)系  

3、   邏輯結(jié)構(gòu)的定義、存儲(chǔ)結(jié)構(gòu)的實(shí)現(xiàn)、操作運(yùn)算的實(shí)現(xiàn)是對(duì)數(shù)據(jù)結(jié)構(gòu)研究的基本思想,一種數(shù)據(jù)結(jié)構(gòu)的研究首先對(duì)這三方面內(nèi)容有一個(gè)清晰的探討。     集合數(shù)據(jù)結(jié)構(gòu)與數(shù)學(xué)中集合概念是一致的,其邏輯結(jié)構(gòu)元素間只是同屬關(guān)系。存儲(chǔ)結(jié)構(gòu)實(shí)現(xiàn)只是在計(jì)算機(jī)內(nèi)存儲(chǔ),它的操作就是一些交、差、并、補(bǔ)等。     線型結(jié)構(gòu)是N個(gè)數(shù)據(jù)元素的有限序列,至于每一個(gè)數(shù)據(jù)元素的具體的含義在不同的情況下各不相同,其長(zhǎng)度可根據(jù)需要增長(zhǎng)或縮短,其邏輯結(jié)構(gòu)就是它的數(shù)據(jù)元素間的線形關(guān)系,即一個(gè)對(duì)一個(gè),一個(gè)元素最多有一個(gè)前驅(qū),最多有一個(gè)后繼。它的存儲(chǔ)結(jié)構(gòu)的實(shí)現(xiàn)一般

4、有順序存儲(chǔ)和鏈?zhǔn)酱鎯?chǔ)兩種方法。順序表是指用一組地址連續(xù)的存儲(chǔ)單元依次存儲(chǔ)線性結(jié)構(gòu)中的數(shù)據(jù)元素,這是一種隨機(jī)存取的存儲(chǔ)結(jié)構(gòu);鏈?zhǔn)酱鎯?chǔ)是數(shù)據(jù)元素之間的邏輯關(guān)系由結(jié)點(diǎn)中的指針來(lái)表示并且每一個(gè)結(jié)點(diǎn)有且只有一個(gè)指針域。線性結(jié)構(gòu)的操作中,最基本的操作是在線性結(jié)構(gòu)中插入、刪除數(shù)據(jù)元素。存儲(chǔ)結(jié)構(gòu)為順序存儲(chǔ)有線性順序表、數(shù)組、串等。存儲(chǔ)結(jié)構(gòu)為鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)時(shí)有鏈表等。根據(jù)線性表的操作的不同便產(chǎn)生了兩種重要的數(shù)據(jù)結(jié)構(gòu)即棧和隊(duì)列,這兩種數(shù)據(jù)結(jié)構(gòu)是線性結(jié)構(gòu)的典型例子2。     樹(shù)型結(jié)構(gòu)是一種重要的非線性結(jié)構(gòu),其中的樹(shù)和二叉樹(shù)最為常用。直觀看來(lái),樹(shù)是以分支關(guān)系定義的層次結(jié)構(gòu),其邏輯結(jié)構(gòu)是一

5、對(duì)多的關(guān)系,而在二叉樹(shù)中是一個(gè)根結(jié)點(diǎn)對(duì)應(yīng)左右兩個(gè)孩子的層次關(guān)系。存儲(chǔ)結(jié)構(gòu)的實(shí)現(xiàn)當(dāng)采取順序存儲(chǔ)時(shí)用一組地址連續(xù)的存儲(chǔ)單元依上而下、自左向右存儲(chǔ)樹(shù)中的結(jié)點(diǎn)元素。在鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)中可采用二叉鏈表表示法即鏈表中結(jié)點(diǎn)的兩個(gè)鏈域分別指向該結(jié)點(diǎn)的第一個(gè)孩子和下一個(gè)兄弟結(jié)點(diǎn),樹(shù)形結(jié)構(gòu)的最基本的操作是遍歷,其它復(fù)雜的操作大部分就是遍歷操作的衍生與擴(kuò)展。在樹(shù)型結(jié)構(gòu)中最有特色的一種數(shù)據(jù)結(jié)構(gòu)就是二叉樹(shù),其獨(dú)特的邏輯結(jié)構(gòu)是每個(gè)結(jié)點(diǎn)至多有二棵子樹(shù)并且還有左右之分,這就決定著它獨(dú)特的鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu),每個(gè)數(shù)據(jù)元素有且只有兩個(gè)指針?lè)謩e指向該結(jié)點(diǎn)的左右孩子。二叉樹(shù)的最基本的操作是遍歷二叉樹(shù),對(duì)每個(gè)結(jié)點(diǎn)的訪問(wèn)是對(duì)其它復(fù)雜操作的基礎(chǔ),例

6、如統(tǒng)計(jì)結(jié)點(diǎn)個(gè)數(shù)、統(tǒng)計(jì)葉子結(jié)點(diǎn)數(shù)、交換二叉樹(shù)的左右孩子等一些復(fù)雜的操作運(yùn)算均是遍歷二叉樹(shù)操作的擴(kuò)展和衍生?;诙鏄?shù)的遞歸定義可得到遍歷二叉樹(shù)遞歸算法,前序遍歷、中序遍歷、后序遍歷二叉樹(shù)。     圖狀結(jié)構(gòu)是一種較線型結(jié)構(gòu)和樹(shù)更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),圖的邏輯結(jié)構(gòu)是多對(duì)多的關(guān)系即在圖形結(jié)構(gòu)中結(jié)點(diǎn)之間的關(guān)系是任意的。因此在存儲(chǔ)結(jié)構(gòu)中無(wú)法以數(shù)據(jù)元素在存儲(chǔ)區(qū)中的物理位置來(lái)表示數(shù)據(jù)元素間的關(guān)系。即圖沒(méi)有順序映象但可以借助數(shù)組的數(shù)據(jù)類(lèi)型表示元素之間的關(guān)系,用兩個(gè)數(shù)組分別存儲(chǔ)數(shù)據(jù)元素(頂點(diǎn))的信息和數(shù)據(jù)元素之間的關(guān)系信息3。另一方面圖的存儲(chǔ)結(jié)構(gòu)也可由多重鏈表實(shí)現(xiàn),即一個(gè)由一個(gè)數(shù)據(jù)域和多

7、個(gè)指針域組成的結(jié)點(diǎn)來(lái)表示圖中的一個(gè)頂點(diǎn),            F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1                  ENDIF 5  實(shí)驗(yàn)結(jié)果分析     我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句

8、子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為:     消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3)     消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消

9、歧的準(zhǔn)確率。     雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。     (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。     (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。     (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出

10、的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6  結(jié)論     本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)

11、研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文            F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1                  ENDIF 5  實(shí)驗(yàn)結(jié)果分析

12、    我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為:     消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3)     消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度

13、,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。     雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。     (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。     (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。 &#

14、160;   (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6  結(jié)論     本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)

15、的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文            F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1             

16、;     ENDIF 5  實(shí)驗(yàn)結(jié)果分析     我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為:     消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3)     消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧

17、正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。     雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。     (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。     (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例

18、,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。     (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6  結(jié)論     本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知

19、識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文            F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1   &#

20、160;              ENDIF 5  實(shí)驗(yàn)結(jié)果分析     我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為:     消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3)     消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)

21、驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。     雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。     (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)

22、題。     (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。     (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6  結(jié)論     本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例

23、是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文            F Kij 與Kj

24、有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1                  ENDIF 5  實(shí)驗(yàn)結(jié)果分析     我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為:     消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義

25、的詞語(yǔ)總數(shù).(3)     消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。     雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。     (1)

26、義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。     (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。     (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6  結(jié)論     本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約

27、束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文   &#

28、160;        F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1                  ENDIF 5  實(shí)驗(yàn)結(jié)果分析     我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確

29、率計(jì)算公式為:     消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3)     消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。     雖然該方法與基于統(tǒng)計(jì)的方法在

30、計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。     (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。     (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。     (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6  結(jié)論  &#

31、160;  本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎.

32、 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文            F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1                  ENDIF 5  實(shí)驗(yàn)結(jié)果分析     我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中

33、共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為:     消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3)     消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的

34、分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。     雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。     (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。     (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。     (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系

35、統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6  結(jié)論     本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)

36、全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文            F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1                  ENDIF 5&#

37、160; 實(shí)驗(yàn)結(jié)果分析     我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為:     消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3)     消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng)

38、,理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。     雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。     (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。     (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)

39、料的數(shù)目比較有限。     (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6  結(jié)論     本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適

40、用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文     sp;                      

41、0;            Visitedw=true;                                                         Push(s,w);      因?yàn)槎鏄?shù)、圖的其它的操作大部分是對(duì)遍歷基本操作的拓展或綜合應(yīng)用,靈活運(yùn)用棧和隊(duì)列可實(shí)現(xiàn),并且算法描述比較直觀。線性結(jié)構(gòu)是數(shù)據(jù)結(jié)構(gòu)學(xué)科的基礎(chǔ),樹(shù)、圖的發(fā)展在線性結(jié)構(gòu)的基礎(chǔ)上而發(fā)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論