版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)結(jié)構(gòu)間的縱橫聯(lián)系 摘 要 本文詳細(xì)闡述了數(shù)據(jù)結(jié)構(gòu)間的縱橫聯(lián)系,所謂“橫向聯(lián)系”是對(duì)各種數(shù)據(jù)結(jié)構(gòu)研究都從邏輯結(jié)構(gòu)、存儲(chǔ)結(jié)構(gòu)、操作運(yùn)算三方面出發(fā)的模式思想,所謂“縱向聯(lián)系”是以簡(jiǎn)單數(shù)據(jù)結(jié)構(gòu)類(lèi)型為基礎(chǔ)來(lái)實(shí)現(xiàn)對(duì)較復(fù)雜數(shù)據(jù)結(jié)構(gòu)類(lèi)型的研究。 關(guān)鍵詞 邏輯結(jié)構(gòu) 存儲(chǔ)結(jié)構(gòu) 操作運(yùn)算 橫向聯(lián)系 縱向聯(lián)系 1 引言 數(shù)據(jù)結(jié)構(gòu)作為計(jì)算機(jī)核心學(xué)科,其主要研究?jī)?nèi)容:邏輯結(jié)構(gòu),物理存儲(chǔ)結(jié)構(gòu),操作(或算法)1。通常,算法的設(shè)計(jì)取決于數(shù)據(jù)的
2、邏輯結(jié)構(gòu),算法的實(shí)現(xiàn)取決于數(shù)據(jù)的物理存儲(chǔ)結(jié)構(gòu)。 根據(jù)數(shù)據(jù)元素之間不同特性,把數(shù)據(jù)結(jié)構(gòu)劃分四種基本結(jié)構(gòu):(1)集合,(2)線型結(jié)構(gòu),(3)樹(shù)型結(jié)構(gòu),(4)圖狀結(jié)構(gòu)或網(wǎng)狀結(jié)構(gòu)。針對(duì)每種數(shù)據(jù)結(jié)構(gòu)均從邏輯結(jié)構(gòu)、存儲(chǔ)結(jié)構(gòu)和操作運(yùn)算等方面進(jìn)行研究,是貫穿數(shù)據(jù)結(jié)構(gòu)研究始終的 “紅線”,也是數(shù)據(jù)結(jié)構(gòu)研究的共同切入點(diǎn),稱之為數(shù)據(jù)結(jié)構(gòu)的“橫向聯(lián)系”。從集合、線型結(jié)構(gòu)等基本數(shù)據(jù)結(jié)構(gòu)入手,以實(shí)現(xiàn)樹(shù)形結(jié)構(gòu)、圖或網(wǎng)狀結(jié)構(gòu)等較復(fù)雜結(jié)構(gòu)研究,實(shí)現(xiàn)數(shù)據(jù)元素間的關(guān)系從簡(jiǎn)單到復(fù)雜探討,稱之為“縱向聯(lián)系”。 2 邏輯結(jié)構(gòu)、存儲(chǔ)結(jié)構(gòu)、操作運(yùn)算的思想模式數(shù)據(jù)結(jié)構(gòu)間的橫向聯(lián)系
3、 邏輯結(jié)構(gòu)的定義、存儲(chǔ)結(jié)構(gòu)的實(shí)現(xiàn)、操作運(yùn)算的實(shí)現(xiàn)是對(duì)數(shù)據(jù)結(jié)構(gòu)研究的基本思想,一種數(shù)據(jù)結(jié)構(gòu)的研究首先對(duì)這三方面內(nèi)容有一個(gè)清晰的探討。 集合數(shù)據(jù)結(jié)構(gòu)與數(shù)學(xué)中集合概念是一致的,其邏輯結(jié)構(gòu)元素間只是同屬關(guān)系。存儲(chǔ)結(jié)構(gòu)實(shí)現(xiàn)只是在計(jì)算機(jī)內(nèi)存儲(chǔ),它的操作就是一些交、差、并、補(bǔ)等。 線型結(jié)構(gòu)是N個(gè)數(shù)據(jù)元素的有限序列,至于每一個(gè)數(shù)據(jù)元素的具體的含義在不同的情況下各不相同,其長(zhǎng)度可根據(jù)需要增長(zhǎng)或縮短,其邏輯結(jié)構(gòu)就是它的數(shù)據(jù)元素間的線形關(guān)系,即一個(gè)對(duì)一個(gè),一個(gè)元素最多有一個(gè)前驅(qū),最多有一個(gè)后繼。它的存儲(chǔ)結(jié)構(gòu)的實(shí)現(xiàn)一般
4、有順序存儲(chǔ)和鏈?zhǔn)酱鎯?chǔ)兩種方法。順序表是指用一組地址連續(xù)的存儲(chǔ)單元依次存儲(chǔ)線性結(jié)構(gòu)中的數(shù)據(jù)元素,這是一種隨機(jī)存取的存儲(chǔ)結(jié)構(gòu);鏈?zhǔn)酱鎯?chǔ)是數(shù)據(jù)元素之間的邏輯關(guān)系由結(jié)點(diǎn)中的指針來(lái)表示并且每一個(gè)結(jié)點(diǎn)有且只有一個(gè)指針域。線性結(jié)構(gòu)的操作中,最基本的操作是在線性結(jié)構(gòu)中插入、刪除數(shù)據(jù)元素。存儲(chǔ)結(jié)構(gòu)為順序存儲(chǔ)有線性順序表、數(shù)組、串等。存儲(chǔ)結(jié)構(gòu)為鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)時(shí)有鏈表等。根據(jù)線性表的操作的不同便產(chǎn)生了兩種重要的數(shù)據(jù)結(jié)構(gòu)即棧和隊(duì)列,這兩種數(shù)據(jù)結(jié)構(gòu)是線性結(jié)構(gòu)的典型例子2。 樹(shù)型結(jié)構(gòu)是一種重要的非線性結(jié)構(gòu),其中的樹(shù)和二叉樹(shù)最為常用。直觀看來(lái),樹(shù)是以分支關(guān)系定義的層次結(jié)構(gòu),其邏輯結(jié)構(gòu)是一
5、對(duì)多的關(guān)系,而在二叉樹(shù)中是一個(gè)根結(jié)點(diǎn)對(duì)應(yīng)左右兩個(gè)孩子的層次關(guān)系。存儲(chǔ)結(jié)構(gòu)的實(shí)現(xiàn)當(dāng)采取順序存儲(chǔ)時(shí)用一組地址連續(xù)的存儲(chǔ)單元依上而下、自左向右存儲(chǔ)樹(shù)中的結(jié)點(diǎn)元素。在鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)中可采用二叉鏈表表示法即鏈表中結(jié)點(diǎn)的兩個(gè)鏈域分別指向該結(jié)點(diǎn)的第一個(gè)孩子和下一個(gè)兄弟結(jié)點(diǎn),樹(shù)形結(jié)構(gòu)的最基本的操作是遍歷,其它復(fù)雜的操作大部分就是遍歷操作的衍生與擴(kuò)展。在樹(shù)型結(jié)構(gòu)中最有特色的一種數(shù)據(jù)結(jié)構(gòu)就是二叉樹(shù),其獨(dú)特的邏輯結(jié)構(gòu)是每個(gè)結(jié)點(diǎn)至多有二棵子樹(shù)并且還有左右之分,這就決定著它獨(dú)特的鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu),每個(gè)數(shù)據(jù)元素有且只有兩個(gè)指針?lè)謩e指向該結(jié)點(diǎn)的左右孩子。二叉樹(shù)的最基本的操作是遍歷二叉樹(shù),對(duì)每個(gè)結(jié)點(diǎn)的訪問(wèn)是對(duì)其它復(fù)雜操作的基礎(chǔ),例
6、如統(tǒng)計(jì)結(jié)點(diǎn)個(gè)數(shù)、統(tǒng)計(jì)葉子結(jié)點(diǎn)數(shù)、交換二叉樹(shù)的左右孩子等一些復(fù)雜的操作運(yùn)算均是遍歷二叉樹(shù)操作的擴(kuò)展和衍生?;诙鏄?shù)的遞歸定義可得到遍歷二叉樹(shù)遞歸算法,前序遍歷、中序遍歷、后序遍歷二叉樹(shù)。 圖狀結(jié)構(gòu)是一種較線型結(jié)構(gòu)和樹(shù)更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),圖的邏輯結(jié)構(gòu)是多對(duì)多的關(guān)系即在圖形結(jié)構(gòu)中結(jié)點(diǎn)之間的關(guān)系是任意的。因此在存儲(chǔ)結(jié)構(gòu)中無(wú)法以數(shù)據(jù)元素在存儲(chǔ)區(qū)中的物理位置來(lái)表示數(shù)據(jù)元素間的關(guān)系。即圖沒(méi)有順序映象但可以借助數(shù)組的數(shù)據(jù)類(lèi)型表示元素之間的關(guān)系,用兩個(gè)數(shù)組分別存儲(chǔ)數(shù)據(jù)元素(頂點(diǎn))的信息和數(shù)據(jù)元素之間的關(guān)系信息3。另一方面圖的存儲(chǔ)結(jié)構(gòu)也可由多重鏈表實(shí)現(xiàn),即一個(gè)由一個(gè)數(shù)據(jù)域和多
7、個(gè)指針域組成的結(jié)點(diǎn)來(lái)表示圖中的一個(gè)頂點(diǎn), F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1 ENDIF 5 實(shí)驗(yàn)結(jié)果分析 我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句
8、子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為: 消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3) 消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消
9、歧的準(zhǔn)確率。 雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。 (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。 (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。 (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出
10、的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6 結(jié)論 本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)
11、研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文 F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1 ENDIF 5 實(shí)驗(yàn)結(jié)果分析
12、 我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為: 消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3) 消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度
13、,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。 雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。 (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。 (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。
14、160; (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6 結(jié)論 本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)
15、的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文 F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1
16、; ENDIF 5 實(shí)驗(yàn)結(jié)果分析 我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為: 消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3) 消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧
17、正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。 雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。 (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。 (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例
18、,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。 (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6 結(jié)論 本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知
19、識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文 F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1
20、160; ENDIF 5 實(shí)驗(yàn)結(jié)果分析 我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為: 消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3) 消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)
21、驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。 雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。 (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)
22、題。 (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。 (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6 結(jié)論 本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例
23、是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文 F Kij 與Kj
24、有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1 ENDIF 5 實(shí)驗(yàn)結(jié)果分析 我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為: 消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義
25、的詞語(yǔ)總數(shù).(3) 消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。 雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。 (1)
26、義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。 (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。 (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6 結(jié)論 本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約
27、束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文
28、160; F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1 ENDIF 5 實(shí)驗(yàn)結(jié)果分析 我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確
29、率計(jì)算公式為: 消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3) 消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。 雖然該方法與基于統(tǒng)計(jì)的方法在
30、計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。 (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。 (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。 (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6 結(jié)論
31、160; 本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎.
32、 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文 F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1 ENDIF 5 實(shí)驗(yàn)結(jié)果分析 我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中
33、共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為: 消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3) 消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng),理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的
34、分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。 雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。 (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。 (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)料的數(shù)目比較有限。 (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系
35、統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6 結(jié)論 本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)
36、全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文 F Kij 與Kj 有上述關(guān)系 THEN Weight(Kij)= Weight(Kij)+1 ENDIF 5
37、160; 實(shí)驗(yàn)結(jié)果分析 我們選擇人民日?qǐng)?bào)語(yǔ)料庫(kù)作為實(shí)驗(yàn)語(yǔ)料,語(yǔ)料中共有800個(gè)句子,每個(gè)句子的長(zhǎng)度為20-30字符。把以上的消歧過(guò)程在VC6.0中實(shí)現(xiàn)做以測(cè)試。消歧的正確率計(jì)算公式為: 消歧的正確率=得到正確消歧結(jié)果的詞語(yǔ)總數(shù)/存在歧義的詞語(yǔ)總數(shù).(3) 消歧結(jié)果的正確與否是通過(guò)手工進(jìn)行判定的。目前實(shí)驗(yàn)的正確率為90.6%。這表明我們提出的基于依存句法對(duì)歧義進(jìn)行消解是有效的。實(shí)驗(yàn)中我們還對(duì)句子長(zhǎng)度對(duì)消歧正確率的影響做了測(cè)試,如果句子的長(zhǎng)度過(guò)短,那么消歧的效果將會(huì)下降,句子的長(zhǎng)度過(guò)長(zhǎng)
38、,理論上會(huì)提高消歧的精度,但是依存句法分析主要是針對(duì)句子分析的程序,對(duì)于文本段落的分析,會(huì)降低依存關(guān)系的分析精度,從而降低詞語(yǔ)消歧的準(zhǔn)確率。 雖然該方法與基于統(tǒng)計(jì)的方法在計(jì)算復(fù)雜度和時(shí)間上具有明顯的效率,但是也存在著一些問(wèn)題。 (1) 義原的敏感性問(wèn)題。由于該方法是基于多義詞語(yǔ)義原與關(guān)聯(lián)詞語(yǔ)的義原關(guān)系進(jìn)行的,故義原詞語(yǔ)如何確定是一個(gè)關(guān)鍵問(wèn)題。 (2) 知網(wǎng)本身的缺陷。目前知網(wǎng)尚未完全開(kāi)放所有詞條義項(xiàng)實(shí)例,在試驗(yàn)中我們手工地為部分詞語(yǔ)添加義項(xiàng)實(shí)例,這不免會(huì)有一些主觀傾向性,并且試驗(yàn)語(yǔ)
39、料的數(shù)目比較有限。 (3) 擴(kuò)大測(cè)試對(duì)象的范圍。多義詞消歧方法的系統(tǒng)評(píng)價(jià)是困難的,本文提出的方法需要進(jìn)一步在大規(guī)模測(cè)試集進(jìn)行檢驗(yàn)。 6 結(jié)論 本文提出了一種基于依存句法分析句子結(jié)構(gòu)進(jìn)行歧義消解的方法,這種方法不需要制定規(guī)則約束,而是通過(guò)關(guān)聯(lián)詞語(yǔ)的義原在知網(wǎng)中的關(guān)聯(lián)關(guān)系來(lái)調(diào)整概念的趨向權(quán)重從而從多個(gè)概念中得到一個(gè)最優(yōu)的結(jié)果。實(shí)例是用自然語(yǔ)言來(lái)表示的,可以很方便通過(guò)調(diào)整詞語(yǔ)實(shí)例集的例子來(lái)達(dá)到一個(gè)比較好的排歧效果。同時(shí)我們采用的語(yǔ)義知識(shí)資源知網(wǎng)是專為自然語(yǔ)言處理而設(shè)計(jì)的,無(wú)論是詞條數(shù)還是語(yǔ)義定義及分類(lèi)體系都十分適
40、用于自然語(yǔ)言處理。從實(shí)驗(yàn)的分析來(lái)看,基于實(shí)例的方法具有良好的歧義消解效果。 參考文獻(xiàn) 1 劉開(kāi)瑛. 漢語(yǔ)全文檢索中的義項(xiàng)標(biāo)注技術(shù)研究. 計(jì)算語(yǔ)言學(xué)進(jìn)展與應(yīng)用. 北京: 清華大學(xué)出版社, 1995 2 劉小虎. 英漢機(jī)器翻譯中詞義消歧方法的研究. 哈爾濱工業(yè)大學(xué)博士學(xué)位論文 sp;
41、0; Visitedw=true; Push(s,w); 因?yàn)槎鏄?shù)、圖的其它的操作大部分是對(duì)遍歷基本操作的拓展或綜合應(yīng)用,靈活運(yùn)用棧和隊(duì)列可實(shí)現(xiàn),并且算法描述比較直觀。線性結(jié)構(gòu)是數(shù)據(jù)結(jié)構(gòu)學(xué)科的基礎(chǔ),樹(shù)、圖的發(fā)展在線性結(jié)構(gòu)的基礎(chǔ)上而發(fā)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 船舶泵機(jī)租賃合同
- 醫(yī)療創(chuàng)新項(xiàng)目管理流程
- 智能機(jī)場(chǎng)智能化施工合同
- 住院期間患者離院管理
- 建筑綠化安全合同協(xié)議書(shū)
- 醫(yī)保業(yè)務(wù)數(shù)據(jù)
- 植物園水電設(shè)施施工協(xié)議
- 電力工程皮卡租賃協(xié)議
- 醫(yī)療器械招標(biāo)評(píng)分索引表模板
- 神經(jīng)外科護(hù)理觀察典型案例
- 湖北省公安廳機(jī)場(chǎng)公安局警務(wù)輔助人員招聘考試試題及答案
- 2024年通信電子計(jì)算機(jī)技能考試-中國(guó)聯(lián)通筆試參考題庫(kù)含答案
- 新修訂公司法專題講座課件
- 中國(guó)加速康復(fù)外科臨床實(shí)踐指南(2021)解讀
- 會(huì)計(jì)技能大賽實(shí)訓(xùn)總結(jié)與反思
- MOOC 大學(xué)英語(yǔ)視聽(tīng)導(dǎo)學(xué)-湖南大學(xué) 中國(guó)大學(xué)慕課答案
- 無(wú)人機(jī)駕駛航空器飛行管理暫行條例(草案)知識(shí)考試題庫(kù)(85題)
- 政務(wù)信息宣傳培訓(xùn)課件
- 銀行營(yíng)銷(xiāo)策略市場(chǎng)調(diào)研分析
- 2024年房地產(chǎn)公司設(shè)計(jì)類(lèi)技術(shù)筆試歷年真題薈萃含答案
- 霧化吸入依從性品管圈課件
評(píng)論
0/150
提交評(píng)論