




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
蒙古語詞法分析的有向圖模型摘要:我們?yōu)槊晒耪Z詞法分析建立了一種生成式的概率統(tǒng)計模型。該模型將蒙古語語句的詞法分析結果描述為有向圖結構,圖中節(jié)點表示分析結果中的詞干、詞綴及其相應標注,而邊則表示節(jié)點之間的轉移或生成關系。特別地,在本工作中我們刻畫了詞干到詞干轉移概率、詞綴到詞綴轉移概率、詞干到詞綴生成概率、相應的標注之間的三種轉移或生成概率,以及詞干或詞綴到相應標注相互生成概率。以內蒙古大學開發(fā)的20萬詞規(guī)模的三級標注人工語料庫為訓練數(shù)據(jù),該模型取得了詞級切分正確率95.1%,詞級聯(lián)合切分與標注正確率93%的成績。關鍵詞:蒙古語詞法分析詞語切分詞性標注詞干提取有向圖
DirectedGraphModelforMongolianLexicalAnalysisAbstract:WeproposeagenerativestatisticalmodelforMongolianlexicalanalysis.Thismodeldescribesthelexicalanalysisresultasadirectedgraph,wherethenodesrepresentthestems,affixesandtheirtags,whiletheedgesrepresentthetransitionorgenerationrelationshipsbetweennodes.Especiallyinthiswork,weadoptthreekindsoftransitionorgenerationprobabilities:a)probabilitiesofstem-stemtransition,affix-affixtransitionandstem-affixgeneration;b)thetransitionorgenerationprobabilitiesbetweenthecorrespondingtags;andc)thegenerationprobabilitiesbetweenstemsoraffixesandtheirtags.Usingthe3rd-levelannotatedcorpuswithabout200,000wordsasthetrainingdata,thismodelachievesaword-levelsegmentationaccuracyof95.1%,andaword-leveljointsegmentationandtaggingaccuracyof93%.Keywords:Mongolian;LexicalAnalysis;Segmentation;POSTagging;Stemming;DirectedGraph
1引言詞法分析對漢語和許多民族語言來說,是大多數(shù)自然語言處理任務的基礎。漢語的詞形較為簡單,當前的詞法分析已經(jīng)做到實際可用的水平[1,2,3,4],而對于形態(tài)復雜的民族語言如蒙古語和維吾爾語,詞法分析的準確率仍有較大的提升空間[5,6,7,8,9,10,11]。在民族交流與融合需求日益迫切的現(xiàn)階段,機器翻譯技術的重要作用越發(fā)凸顯。民族語言詞法分析作為機器翻譯的必備前提,需要得到研究者更多的關注。與漢語的字符順次拼接的構詞方式相比,蒙古語和維吾爾語等形態(tài)豐富的語言構詞規(guī)律更加復雜。這類語言的詞語通常由詞干和若干起修飾作用詞綴組成樹狀結構,詞法分析的任務就是解析出詞語的詞干和詞綴構成,并且標定好它們的類別標注。這樣一來,在漢語上效果良好的序列標注模型[12,13,14]在這里變得不太適用,而研究者往往直接借用這些現(xiàn)成的線性序列模型,同時將任務限定為粗切分或標注[7,8,9,10],這使得系統(tǒng)的理論價值和實用性大打折扣。另一方面,傳統(tǒng)的基于規(guī)則的詞法分析模式需要專門的語言學人才,往往耗費大量的精力調試搭建后,而準確率和穩(wěn)定性又不盡人意。因此,我們有必要構造更為恰當?shù)慕y(tǒng)計模型,以盡可能準確地描述形態(tài)豐富語言的構詞規(guī)律,從而快速搭建高性能的詞法分析系統(tǒng)。我們?yōu)槊晒耪Z詞法分析建立了一種生成式的概率統(tǒng)計模型。該模型將蒙古語語句的詞法分析結果描述為有向圖結構,圖中節(jié)點表示分析結果中的詞干、詞綴及其相應標注,而邊則表示節(jié)點之間的轉移或生成關系,它們刻畫了詞干、詞綴及其相應標注連接成詞的規(guī)律。生成式概率統(tǒng)計模型為這些轉移或生成關系賦以合適的概率形式,詞法分析的過程就是尋找其所有概率乘積最大的有向圖。在本工作中我們刻畫了詞干到詞干轉移概率、詞綴到詞綴轉移概率、詞干到詞綴生成概率、相應的標注之間的三種轉移或生成概率,以及詞干或詞綴到相應標注相互生成概率。這些轉移或生成概率以極大似然估計的方式從訓練語料中統(tǒng)計得到。鑒于本工作的意圖在于統(tǒng)計建模,在為句中的每個詞枚舉可能的詞語結構候選時,我們并沒有利用人工標注詞法分析語料庫之外的任何語言資源,也沒有設計專門的詞法和語法知識進行指導,而是依據(jù)從人工語料庫中抽取出的詞干表和詞綴表,通過遞歸搜索窮舉所有可能的構詞方式。我們在內蒙古大學開發(fā)的20萬詞規(guī)模的三級標注人工語料庫(內大拉丁語料)上進行實驗。我們隨機分割出5%和5%的句子分別作為開發(fā)集和測試集,剩余的90%的句子全部作為訓練集。在測試集上,該模型取得了詞級切分正確率95.1%,詞級聯(lián)合切分與標注正確率93%的好成績。另外,整個系統(tǒng)的訓練過程只需要幾十秒即可完成,解碼過程在PC機上也可達到幾百詞每秒的速度。而且,由于系統(tǒng)幾乎沒有借助任何語言學知識,我們相信只需很少的改動就可以應用其他形態(tài)豐富的語言上。在剩余的章節(jié),我們首先介紹蒙古語詞法分析的任務定義,然后描述我們的生成式概率統(tǒng)計模型,在展示該系統(tǒng)實驗結果并進行相應的分析說明后,我們與前人工作進行對比,最后給出總結和展望。2蒙古語詞法分析同其他形態(tài)豐富的語言類似,蒙古語的詞由詞干和可能的詞綴組成。不同的是,蒙古語詞干與詞綴的組合需要服從特有的約束:a)詞干只能有一個且只能出現(xiàn)在最前面b)分寫詞綴只能跟在連寫詞綴之后c)同類詞綴中不同詞綴須以特定的順序出現(xiàn)約束a)規(guī)定一個蒙古語詞只能有一個義項中心,這一點與維吾爾語不同;而約束b)和c)規(guī)定了不同詞綴的特定出現(xiàn)順序,這一點與朝鮮語又不相同。以內大拉丁語料中的蒙古語詞HUURNILDU/HU-DU為例,其在特定語境下的一種詞法分析結果為:HUURNI/Ve2+LDU/Fe3+HU/Ft12-DU/Fc21其中,+號和-號分別表示后面緊接著的是連寫后綴和分寫后綴。給定一個蒙古語詞,我們可以借助詞干表和詞綴表,以遞歸枚舉的方式把可能的詞法結構羅列出來。在該語料庫中,分寫后綴和一部分連寫后綴在原始詞中已經(jīng)被標識出來。所有的分寫后綴都放在詞的尾部,且以-號分隔,例如詞尾的-DU;一部分連寫詞綴位于分寫詞綴之前,且以/號與前面部分分隔開來。這部分連寫詞綴前面的/號是內大拉丁語料在初步標注過程中人工加進去的詞干與變形附加成分之間的分隔符號,因此我們在系統(tǒng)測試之前將刪除輸入數(shù)據(jù)中的/號,以模擬真實環(huán)境下的蒙古語語句,反映詞法分析系統(tǒng)的真實性能。許多蒙古語詞擁有不止一種詞法分析候選結構,在同時做詞干標注和詞綴標注的時候,候選結構數(shù)量變得更為龐大。如果根據(jù)特定的上下文環(huán)境為蒙古語詞選擇正確的詞法分析結構,是歧義排解的問題,也是蒙古語詞法分析的難點所在?;谡Z言學規(guī)則的詞法分析系統(tǒng)能夠為每個單獨的詞高效地枚舉出盡可能精簡的候選分析集合,卻不擅長于根據(jù)上下文環(huán)境為每個詞選擇最恰當?shù)暮蜻x。語言的統(tǒng)計建模恰好可以與規(guī)則方法實現(xiàn)優(yōu)勢互補。統(tǒng)計方法難以為每個詞確定一個精簡的合法候選分析集,卻擅長于高效地為整個句子選擇最可能的整體分析結果。本工作的重點即在蒙古語詞法分析的統(tǒng)計建模上。3有向圖概率模型基于統(tǒng)計的有監(jiān)督建模總體上可分為兩類:生成式統(tǒng)計建模和判別式統(tǒng)計建模。兩種模型體現(xiàn)了截然不同的建模思路。生成模型同時考察輸入和分析結果,旨在找出產生概率最高的輸入與分析結果的組合。因此,它有一部分概率知識用于描述輸入語句的生成規(guī)律。判別模型則立足于輸入考察分析結果,其目的在于找出已知輸入的情況下最優(yōu)的分析結果候選。與生成模型的理念相比,判別模型更符合人們分析解決問題的方式。事實也證明了判別模型的優(yōu)勢,在序列標注的經(jīng)典問題詞性標注上,判別模型在漢語和英語上都比生成模型有明顯進步。然而,判別模型用于蒙古語詞法分析還存在不少有待解決的關鍵問題。一方面,與生成模型不同的是,判別模型的訓練要設計大量的判別特征,并通常需要漫長的多輪迭代過程。與形態(tài)簡單的漢語和英語相比,蒙古語詞復雜的形態(tài)結構使得模型的搜索空間要大的多,從而需要大的存儲占用和更久的訓練時間。另一方面,判別模型通常僅適用于為搜索空間結構固定的任務建模,如詞性標注和依存分析,它們都有一個固定不變的詞語序列。而對于形態(tài)豐富語言的詞法分析來說則不具備確定的搜索空間結構,因為我們需要枚舉各種可能的候選詞語結構,并在選擇最佳候選結構的同時確定該結構內詞干和詞綴的標注。目前,我們對于形態(tài)豐富語言詞法分析的判別式建模也構想了幾套初步可行的方案,相關的研究已經(jīng)在有序的進行。在本文中,我們僅專注于闡述已經(jīng)成型的生成式概率統(tǒng)計模型。3.1單純切分的模型結構同詞語形態(tài)簡單的漢語或者英語相比,詞語形態(tài)豐富的蒙古語的詞法分析更像是一個對樹結構進行選擇并對樹中節(jié)點進行標注的過程,而不是一個簡單的線性序列標注問題。這里,我們并不馬上介紹能夠同時進行切分和標注的最終詞法分析模型,而是先從較為簡單的任務說起,即單純切分的模型構建。我們把語句中各詞的分析結果定義為鏈狀結構:這里,S(stem)表示詞干,A(adjoin)表示連寫詞綴,D(disjoint)表示分寫詞綴。我們用虛線連接的兩個A(或D)表示0或多個連寫詞綴(或分寫詞綴)。在詞干到詞綴之間以及詞綴到后續(xù)詞綴之間,箭頭表示生成或者轉移關系。對于整個語句,分析結果則可描述為樹狀結構:與單個詞的分析結果結構相比,整句分析結構中增加了相鄰詞的詞干之間的生成或轉移關系,從而在所有詞干和詞綴之間形成一個拓撲有序的樹結構。樹中節(jié)點即表示詞干或者詞綴,而節(jié)點之間的邊則表示詞干到詞干、詞干到詞綴以及詞綴到詞綴的生成或轉移關系。 概而言之,無論對于規(guī)則模型還是統(tǒng)計模型,建模的本質都是在刻畫詞干、詞綴及其相應標注(如果同時也做標注的話)之間的生成、轉移等約束規(guī)律。如果我們能為樹中的各種不同的邊設計相應的權重,這些權重的度量反映了節(jié)點之間生成或轉移規(guī)律的強弱,那么,求解整句詞法切分結果的過程,即為在所有可能的候選樹中尋找權重之和最高的樹的過程。本模型中,我們用類似于隱馬模型使用中的轉移概率來描述樹中邊的權重。根據(jù)邊指向對象的不同,我們設計如下兩種轉移概率:a) P(S|Sngram)詞干到詞干的轉移概率,類似于ngram語言模型b) P(X|S/Xngram)其他詞綴的生成概率,X代表詞綴,即A或者D。S/Xngram指當前詞綴之前的詞干或詞綴組成的ngram歷史給定一個候選樹T,我們用這些概率的乘積表示該候選的整體生成概率:為簡潔起見,公式中隱藏了兩個條件概率的歷史條件。容易看出,這可以理解為傳統(tǒng)的ngram語法模型向樹結構的拓展。3.2聯(lián)合切分標注的模型結構上面的模型僅考慮詞語的形態(tài)分析而不涉及詞干和詞綴的標注。當我們也需要詞干和詞綴的標注信息時,就必須同時對這些標注成分進行概率建模了。事實上,即使我們只需要進行詞語形態(tài)分析,考慮到人工詞法分析語料庫規(guī)模不會很大,構詞元素特別是詞干對現(xiàn)實世界中蒙古語語言的覆蓋面相當有限,在語料庫提供標注信息的情況下,盡可能的對標注建模以利用這些標注信息,也是緩解數(shù)據(jù)稀疏的重要手段。對聯(lián)合切分和標注進行建模的關鍵,在于如何讓標注信息有效地參與描述句中各詞的形態(tài)結構生成過程。本工作中,對應于單純切分的模型結構,我們?yōu)闃俗⑿畔⒃O計了一個同步樹狀結構以描述詞干和詞綴標注之間的生成和轉換關系。所謂同步是指樹的結構和單純切分模型的樹結構完全一致,只不過樹中對應節(jié)點,對后者而言是詞干或詞綴,對前者而言是相應的標注。另外,我們設計兩項概率描述兩個平行的樹結構中節(jié)點之間的映射關系:a) P(X|t(X))X代表詞干或詞綴,t(X)代表其標注。此項概率可類比于隱馬模型中狀態(tài)到觀察的生成概率b) P(t(X)|X)此項概率代表詞干或詞綴X被賦予標注t(X)的概率。此項概率參與建模使得模型傾向于為選擇常見的標注這兩項條件概率在平行樹結構的節(jié)點之間可表示為不同方向的有邊,從而建立起平行樹結構之間的映射關系,構建描述能力更強的有向圖模型:求解切分和標注結果的過程,即為在候選有向圖中尋找概率最大的有向圖。有向圖G的概率定義為:其中,P(t(T))表示標注樹t(T)的概率,它和P(T)的定義一樣,只需把詞干和詞綴換成相應的標注。P(T,t(T))表示平行樹結構T和t(T)的映射概率,它定義為平行樹中所有節(jié)點對的條件概率的乘積:理論上,P(G)的三項乘子概率對于候選有向圖的優(yōu)選可能具有不同的決策力,故為它們賦以合適的相對加權有望提升模型性能。但在本工作中我們暫不考慮乘子加權問題,這相當于所有加權均為1。3.3訓練與解碼出現(xiàn)在單純切分模型和聯(lián)合切分與標注模型的各項概率,均可以用極大似然估計的方式從人工標注詞法分析語料庫中統(tǒng)計得來。其中對于詞干到詞干轉移概率、詞綴到詞綴轉移概率、詞干到詞綴生成概率、相應的標注之間的三種轉移或生成概率,可以借助成熟的工具包如SRI語言模型工具來實現(xiàn)[15],這將使我們不必理會概率的回退與平滑,而將精力集中在模型結構的設計上。模型訓練完畢之后,解碼任務就是一個遞歸枚舉各詞的可能分析結果候選,并緊接著進行動態(tài)規(guī)劃搜索確定各詞最優(yōu)候選的過程。枚舉過程依據(jù)一個詞干表和一個詞綴表,遞歸的列舉出詞語所有可能的詞形。需要注意的,蒙古語詞的某些字符在特定情境下會發(fā)生變形,主要總結為如下兩種:a) 詞干詞綴劃分過程中,若AYI、EYI、0YI、VYI、OYI或UYI由非詞尾變?yōu)樵~尾,則刪掉字符Yb) 詞干詞綴劃分過程中,若GA、HA、YA、YE和RE由非詞尾變?yōu)樵~尾時,需在中間添加下劃線_動態(tài)規(guī)劃的搜索過程就是自左到右的viterbi解碼過程??紤]文章篇幅限制,我們這里對這兩個過程不再展開詳述。4實驗 我們在內蒙古大學蒙古學學院開發(fā)的20萬詞規(guī)模詞法分析語料庫上進行實驗。該語料庫共包括14115個完整的句子,我們從中隨機扣取出各5%的語句分別用做開發(fā)集和測試集,各含705句,剩余90%的語句用做訓練集,含12705句。模型各項概率均從訓練集中以極大似然估計法統(tǒng)計得來。其中,詞干到詞干轉移概率、詞綴到詞綴轉移概率、詞干到詞綴生成概率、相應的標注之間的三種轉移或生成概率,我們直接借助成熟的語言模型工具包SRILM,以WB平滑方式訓練3元模型。 蒙古語的詞法分析結果結構遠比漢語復雜,傳統(tǒng)的正確率、召回率和F值不能直接適用。本工作中我們定義和采納了多種指標,從不同角度和層面考量詞法分析器的性能。這些指標包括:a) 詞級正確率Pw
以詞為單位計量,僅當詞內詞干、詞綴及其標注均正確時,該詞才是分析正確的b) 詞干詞綴級正確率Psa,召回率Rsa和Fsa值以詞干和詞綴為單位計量,僅當詞干或詞綴及相應標注正確時,該詞干或詞綴才是分析正確的。因此,詞干和詞綴可類比為漢語詞法分析中的詞。此評價標準引自[7]c) 相應的不考慮標注信息的評測指標:Pw-t,Psa-t,Rsa-t和Fsa-t+t-t詞級Pw93.095.1詞干詞綴級Psa92.794.3Rsa93.495.1Fsa93.094.7表1:系統(tǒng)在測試集上的性能(%)PwPsaRsaFsaP(T)75.480.280.680.4P(t(T))83.084.685.885.2P(T,t(T))75.770.981.675.9P(T)+P(t(T))86.688.789.188.9P(T)+P(T,t(T))88.689.490.489.9P(t(T))+P(T,t(T))92.892.893.393.1ALL93.193.293.693.4表2:不同子模型組合在開發(fā)集上的性能(%)表格1展示了系統(tǒng)在測試集上以上述幾個評測指標考量的最終性能。詞級正確率93%意味著系統(tǒng)對測試集中93%的詞都能夠分析出完全正確的詞形結構和標注信息。我們發(fā)現(xiàn),不論對于哪種評測指標,不考慮詞性標注都要比考慮詞性標注高1個百分點以上。這說明聯(lián)合詞形分析與標注的難度明顯高于單純的詞形分析,如何有效地聯(lián)合利用詞干、詞綴及其標注信息進行建模值得更加深入的探索。由于聯(lián)合切分和標注的意義遠高于單純切分,我們在后續(xù)的試驗中僅報告考慮標注的相關指標分值。下一步我們驗證有向圖概率P(G)定義的有效性。如第2章中描述,P(G)由三個子模型概率累乘起來,包括詞干詞綴樹概率P(T)、相應標注樹概率P(t(T))以及詞干詞綴樹與標注樹之間的映射概率P(T,t(T))。此次試驗在開發(fā)集上進行,我們分別嘗試不同的子模型組合的性能,以驗證各個子模型發(fā)揮的作用。通過表格2我們發(fā)現(xiàn),標注樹概率P(t(T))發(fā)揮的作用最大,并且它和詞干詞綴樹到標注樹的映射概率P(T,t(T))聯(lián)合使用時,系統(tǒng)性能已經(jīng)趨近于完整系統(tǒng)了。相比英語、漢語和其他資源豐富的語言來說,當前蒙古語詞法分析人工標注語料規(guī)模要小得多。通過模型改進帶來的性能提升畢竟有限,要想大幅度提高蒙古語詞法分析的準確率,必須有更大規(guī)模的人工標注語料支持。在語料庫擴建之前,我們可以先探索一下性能提升和語料規(guī)模擴大的關系。為此,我們固定開發(fā)集和測試集不變,而從訓練集中每次提取不同規(guī)模的子集以訓練系統(tǒng),并考察該系統(tǒng)在測試集上的表現(xiàn)。整個訓練集含12705句標注語句,我們從中隨機選取一系列不同規(guī)模的子集,分別含有6000,3000,1500,800,400,200和100個語句,并按照由小到大的次序畫出系統(tǒng)性能隨訓練數(shù)據(jù)增加的變化曲線。圖1:訓練集規(guī)模-系統(tǒng)性能曲線圖通過圖1所示的訓練集規(guī)模-系統(tǒng)性能曲線我們發(fā)現(xiàn),隨著訓練集語句數(shù)量的增加,系統(tǒng)性能持續(xù)變化。這在訓練語料規(guī)模較小的時候尤其明顯,例如,訓練集從100句擴大到200句時,系統(tǒng)的詞級正確率從67.5%上升到75%。隨著語料規(guī)模的繼續(xù)擴大,系統(tǒng)性能的提升幅度趨于緩和,例如,訓練集從6000句擴大到12021句時,詞級正確率從92.2%提升到93.1%。這帶給我們兩方面的啟示:其一,鑒于現(xiàn)在蒙古語詞法分析語料規(guī)模仍然較小,通過進一步擴建語料庫以提升性能仍然是有意義的和必要的,畢竟接近1個百分點的絕對增長量也是一個相當可觀的性能提升;其二,語料規(guī)模繼續(xù)增加到一定程度后,統(tǒng)計模型通過語料擴建提升性能的方案的性價比會越來越低,此時,引入語言學知識來增強統(tǒng)計模型可能是最有希望的研究思路。
5相關工作蒙古語詞法分析的主要工作都是基于語言學規(guī)則的。統(tǒng)計知識的引入,是從侯宏旭等人借助語言模型對規(guī)則系統(tǒng)的提供的候選結果進行擇優(yōu)排歧的工作[7]開始的,該工作取得了94%的詞切分準確率。而后又有一些工作也取得了較好的結果,例如:趙偉等人[8]取得了99.2%的詞切分準確率,叢偉[9]取得了97.1%的詞切分準確率,艷紅和王斯日古楞[10]取得了96.8%的詞性標注準確率。但上述工作都將任務限定為粗切分或標注,且采用和數(shù)據(jù)集與我們不同,因此和我們目前工作缺乏可比性。這些工作一般直接借用現(xiàn)成的線性序列標注模型,既沒有考慮黏著語的構詞特性,也沒有采用嚴整精細的切分標注標準,從而使得系統(tǒng)的理論價值和實用性有所限制。與之相比我們工作的優(yōu)越性如下:第一,我們的工作同步地實現(xiàn)了詞形分析和詞干詞綴的標注,所采用的詞干、詞綴拆分標準也更加細致復雜;之前工作多專注于切分而很少給出標注信息,并且詞語切分的粒度也很粗略。相比而言,我們解決的任務更為嚴整復雜,系統(tǒng)也相應的更具實用價值。第二,我們的工作針對詞干詞綴間的聯(lián)接特性,建立更貼合黏著語構詞規(guī)律的樹狀生成模型;而之前工作則通常借用現(xiàn)成的序列標注模型,將句中所有詞干和詞綴視為單一線性的序列結構。因此,我們對蒙古語詞法分析的建模更加科學有效。第三,我們?yōu)槊晒耪Z的聯(lián)合切分和標注任務建立了高度形式化的,基于由同步樹結構組成的有向圖的概率生成模型。這是針對黏著語構詞特性的嶄新的建模方式。因此,與以前工作相比我們的工作具有更好的擴充性和提升空間,相應地也更具理論價值。
6總結與展望本工作為蒙古語詞法分析建立了一種生成式的概率統(tǒng)計模型,將蒙古語語句的詞法分析結構描述為有向圖結構,圖中節(jié)點表示分析結果中的詞干、詞綴及其相應標注,而邊則表示節(jié)點之間的轉移或生成關系。整體上,有向圖由同步的詞干詞綴樹和標注樹以及樹間的映射關系組成,分別描述詞干詞綴的生成轉移關系、相應標注的生成轉移關系以及詞干詞綴與標注間的生成關系。最終系統(tǒng)在內蒙古大學開發(fā)的20萬詞規(guī)模的人工語料庫做到了較好的水平,詞級切分正確率為95.1%,詞級聯(lián)合切分與標注正確率為93%。然而,當前模型還很初步,許多重要的方面有待改進。首先,關于模型構建,鑒于判別式模型普遍優(yōu)于生成式模型,如何為形態(tài)豐富語言建立有效的判別式詞法分析模型并設計相應的特征表示,將是我們接下來的重要探索方向之一。再者,我們目前只是根據(jù)從訓練集中自動抽取出的詞干表和詞綴表,為每個待分析詞遞歸地窮舉可能的候選結構,這導致過多的非法候選,以致引入無謂的歧義。如何利用語言學規(guī)則約束候選生成甚至解碼過程,也是我們未來要進行的重要研究內容。
參考文獻:[1]HweeTouNgandJinKiatLow.Chinesepart-of-speechtagging:One-at-a-timeorall-at-once?Wordbasedorcharacter-based?[C].InProceedingsofEMNLP,2021.[2]WenbinJiang,LiangHuang,YajuanLv,andQunLiu.AcascadedlinearmodelforjointChinesewordsegmentationandpart-of-speechtagging[C].InProceedingsofthe46thACL,2021.[3]HuapingZhang,QunLiu,XueqiCheng,HaoZhangandHongkuiYu.ChineseLexicalAnalysisUsingHierarchicalHiddenMarkovModel[C].InpreceedingsofSecondSIGHANworkshopaffiliatedwith41thACL,2021.[4]米海濤,熊德意,劉群.中文詞法分析與句法分析融合策略研究[J].中文信息學報,2021.[5]那順烏日圖,雪艷,葉嘉明.現(xiàn)代蒙古語語料庫加工技術的新進展—新一代蒙古語詞語自動切分與標注系統(tǒng)[C].第十屆全國少數(shù)民族語言文字信息處理學術研討會,2021.[6]那順烏日圖,淑琴.面向信息處理的蒙古語規(guī)范化探究[J].中央民族大學學報(哲學社會科學版),2021.[7]侯宏旭,劉群,那順烏日圖,牧仁高娃,李錦濤.基于統(tǒng)計語言模型的蒙古文詞切分[J].模式識別與人工智能,2021.[8]趙偉,侯宏旭,從偉,宋美娜.基于條件隨機場的蒙古語詞切分研究[J].中文信息學報,2021.[9]叢偉.基于層疊隱馬爾科夫模型的蒙古語詞切分系統(tǒng)的研究[D].內蒙古大學碩士畢業(yè)論文,2021.[10]艷紅,王斯日古楞.基于HMM的蒙古文自動詞性標注研究[J].內蒙古師范大學學報(自然科學漢文版),2021.[11]古麗拉·阿東別克,米吉提·阿布力米提.維吾爾語詞切分方法初探[J].中文信息學報,2021.[12]Lawrence.R.Rabiner.ATutorialonHiddenMarkovModelsandSelectedApplicationsinSpeechRecognition[C].InproceedingsofIEEE,1989:257--286.[13]JohnLaffertyandAndrewMcCallumandFernandoPereira.Conditionalrandomfields:Probabilisticmodelsforsegmentingandlabelingsequencedata[C].Inproceedingsofthe18thICML,2021:282—289.[14]McCallum,A.,Freitag,D.andPereira,F.MaximumentropyMarkovmodelsforinformationextractionandsegmentation[C].Inproc.ICML,2021:591–598.[15]StolckeandAndreas.Srilm-anextensiblelanguagemodelingtoolkit[C].InProceedingsoftheInternationalConferenceonSpokenLanguageProcessing,2021:311–318.
中國企業(yè)物流運作現(xiàn)狀及發(fā)展戰(zhàn)略探討摘要:自從2001年中國加入WTO之后,市場競爭就更加激烈。每個企業(yè)為了提高自身的競爭力,努力提高物流水平,降低物流成本。本文將中國物流現(xiàn)狀與發(fā)達的國家和地區(qū)的企業(yè)物流運作模式進行對比,提出了中國的企業(yè)物流發(fā)展戰(zhàn)略關鍵詞:企業(yè)物流現(xiàn)狀;運行模式;發(fā)展戰(zhàn)略一、中國企業(yè)物流的運作現(xiàn)狀及弊端
物流戰(zhàn)略是很多企業(yè)總體戰(zhàn)略中必須考慮到的一個重要因素。為了在市場中提升自我競爭了,企業(yè)不斷在降低物流成本和提高物流水平上下功夫。無論是在國內還是國際市場上,都能夠最大程度上的降低成本,同時又不減低服務水平,獲得競爭優(yōu)勢。企業(yè)物流的管理整體上來說還是處于不完善的階段,大多停留在紙幣時代。比較先進的企業(yè)已經(jīng)配備了電腦,但是依舊沒有形成系統(tǒng)的體系和網(wǎng)絡。EDL、個人電腦、人工智能、專家系統(tǒng)、通信和掃描等先進的信息技術還未在物流運作中廣泛地運用。但是物流是一種新型的管理技術,涉及領域寬廣。因此物流管理人員要熟悉掌握企業(yè)內物流和因此延伸的整條供應鏈的管理知識,掌握整個工藝流程,精通物流管理技術。而我國現(xiàn)在十分缺乏具備綜合物流知識的管理和技術人才,難以滿足企業(yè)物流現(xiàn)代化的需求。二、中國企業(yè)物流的發(fā)展戰(zhàn)略1990年以來,在國外,物流已經(jīng)成為了該國一個重要的經(jīng)濟增長點。但是在中國,物流才剛剛起步。企業(yè)之間生產經(jīng)營,市場運行的各個方面展開競爭。具體體現(xiàn)在技術、人才上包括了物流和供應鏈。在競爭如此激烈的背景之下,企業(yè)進入了一個微利時代,產品的成本和利潤變得十分透明。而這用競爭還會不斷加深,變得更加激烈,三、發(fā)展物流為當務之急
社會的經(jīng)濟環(huán)境在不斷地發(fā)展變化之中,這就要求中小企業(yè)從戰(zhàn)略發(fā)展的高度出發(fā)去思考物流的發(fā)展問題。在大企業(yè)實時物流戰(zhàn)略的同時,作為靈活的反應者,中小企業(yè)在市場中,也積極采取了行動。希望通過積極的物流戰(zhàn)略提升自身的競爭力。信息技術的發(fā)展前景大好,經(jīng)濟貿易的高速發(fā)展,物流業(yè)已經(jīng)顯示出了蓬勃的活力和蘊藏的無限商機,物流服務正逐漸成為中國企業(yè)之中最為經(jīng)濟合理的綜合服務模式。中國進入WTO的時間還不算長,我國的中小企業(yè)應該及時把握住這一機會,在物流市場競爭比較不激烈時加入物流領域,迅速地占領一定的市場份額。但是如果中小企業(yè)不作為,等時間再長久一些,將會失去發(fā)展物流的優(yōu)勢。
四、從戰(zhàn)略角度做物流
現(xiàn)下,我國的許多中小企業(yè)還未意識到物流戰(zhàn)略以及控制物流成本的重要性。中小企業(yè)應當認識到物流戰(zhàn)略是提升競爭力的重要手段,并且重視自身物流系統(tǒng)地建設,將物流系統(tǒng)的建設上升到戰(zhàn)略高度。事實上,企業(yè)物流成本是除了原材料成本之外的最大成本項目。在國外發(fā)達國家,它們的物流成本一般控制在10%左右。而我國的現(xiàn)狀就不太樂觀。我國物流成本一般占總成本30%-40%,鮮活產品占60%左右甚至更多。我們應該看到的是系統(tǒng)完善的物流管理可以節(jié)省15%-30%物流成本,很大程度上減少庫存和運輸成本,對于中小企業(yè)來說,技術上和產品質量都比不上大企業(yè)。但不得不承認的是,中小企業(yè)產品價格更加受消費者青睞,市場需求反應更加靈活迅速。一旦中小企業(yè)將物流上升到戰(zhàn)略高度,利用先進的物流管理模式,就可以大大的節(jié)省產品成本,進一步發(fā)揮自身的優(yōu)勢。想要在變幻莫測的市場中屹立不倒。謀求更加長遠的發(fā)展,中小企業(yè)就要把物流放到企業(yè)經(jīng)營管理的戰(zhàn)略高度上進行思考。除了考慮要怎樣解決倉儲運輸和商品配送這些物流的基本問題,還要思考怎樣把采購、生產和銷售過程中的物流活動的有機結合。做到以業(yè)務流程為基礎,使得物流的一體化。最終達到加強企業(yè)的在瞬息萬變的市場當中的競爭能力。
我國的中小企業(yè)只有突破地域限制、行業(yè)的局限,放眼于國內外,才能說真正意義上做好了戰(zhàn)略制定,最大限度地把握住了機遇,有效規(guī)避風險。具體來的說,就是首先著眼于當前的地域市場的開拓,在獲得了本地競爭的優(yōu)勢之后,輻射全國,放眼于全球。
五、重視物流系統(tǒng)的全面改造
發(fā)展物流并不是一蹴而就的,它需要一步步地前進。因此中小企業(yè)要注重制定詳細的物流重組的長期實施計劃和發(fā)展策略。物流重組需要從物流業(yè)務流程、組織機構、企業(yè)資源管理系統(tǒng)等方面展開,這樣一來才有可能慢慢實現(xiàn)企業(yè)物流向供應鏈管理的“橫向一體化”。達到降低生產、庫存、運輸?shù)拳h(huán)節(jié)的成本,最終給客戶帶來更大的效益,給消費者帶去更大的實惠。與此同時,企業(yè)的經(jīng)營者應該打破傳統(tǒng)的觀念,不再只是局限于投入產出管理問題,如流程再造、壓縮成本、加強培訓以及有限資源的合理配置問題。企業(yè)的經(jīng)營者應當認識到物流是企業(yè)市場營銷的基礎,從戰(zhàn)略高度去思考物流運營成本與市場拓展需要、物流顧客服務的特殊要求之間的動態(tài)平衡,做到將物流系統(tǒng)與營銷戰(zhàn)略有機結合?,F(xiàn)代化的物流在國際上又被稱為一體化物流、供應鏈管理、銷售鏈管理等等。不同于傳統(tǒng)的物流,現(xiàn)代物流包括了運輸、儲存、裝卸、搬運、包裝、流通加工、配送、信息處理、回收等功能。對我國的中小企業(yè)來說,發(fā)展物流必須重視物流系統(tǒng)的全面改造。以物流供應鏈思想作為指導,注意對物流管理的強化,積極運用有效策略,全新打造物流的運作與管理體系。
六、從服務角度做物流
在國外,廣泛認為物流業(yè)歸屬于服務業(yè)。但是現(xiàn)代物流在中國還是新興產業(yè)。它的發(fā)展也就緊密伴隨著企業(yè)經(jīng)營管理理念而在發(fā)展。當代企業(yè)政府對物流管理的認識也逐漸提高到了企業(yè)和地區(qū)的戰(zhàn)略理論的高度。當代企業(yè)經(jīng)營管理理念的核心正在從產品制造轉向產品銷售再轉向現(xiàn)代營銷和客戶服務。并且提出了“一切為客戶創(chuàng)造價值”的現(xiàn)代經(jīng)營理念。人們對于物流的認識早已經(jīng)從企業(yè)自身的“功能性活動”上升為“以滿足客戶需求為目的”、“努力為客戶創(chuàng)造價值,盡力增加顧客讓渡價值”的“從供應到消費的運動、儲存和配送的計劃、執(zhí)行和控制”的管理過程。消費者的需求不僅僅是商品。以企業(yè)的經(jīng)營和發(fā)展的角度來看,物流就等同于服務。服務也是物流的物品之一。它是企業(yè)所提供的服務,“服務的實質上也是一種商品”,但是這一點卻常常被人們所忽視。七、引進專業(yè)物流管理咨詢公司中小企業(yè)自身的專業(yè)力量不足,因此要懂得借助相關的管理顧問公司以及相關研究機構來科學規(guī)劃企業(yè)的物流戰(zhàn)略、實施戰(zhàn)略和管理體系。要去了解先進物流企業(yè)的作以及這樣運作的原因所在。在這一過程之中,它們的物流服務理念是如何變化的,怎樣做到滿足客戶需求和市場競爭,企業(yè)經(jīng)營戰(zhàn)略相銜接。這有這樣,我國的中小企業(yè)才有可能成功地進入一個新的市場領域,在現(xiàn)有的市場基礎上進一步地替身自身的服務水平,拓展市場份額。許多的企業(yè)在管理咨詢方面下了許多的功夫,用以探索新管理方式和學習物流技術的運用。中小企想要全面提升企業(yè)的物流運作以及管理的水平,更加迅速地構建起一個先進的物流系統(tǒng)以及管理平臺,就應當充分利用專業(yè)管理顧問公司的優(yōu)勢能力。結語:戰(zhàn)略性的規(guī)劃、投資以及技術開發(fā)是最近幾年促進物流現(xiàn)代化發(fā)展的重要因素。企業(yè)亟需解決的不僅僅是倉促運輸以及商品配送等最為基本的物流問題,最重要是為了解決怎么樣才能在在變化莫測的市場競爭之中謀求生存與發(fā)展這一問題。因此企業(yè)必須做到將物流放在企業(yè)經(jīng)營管理這一戰(zhàn)略高度上去考慮怎樣將采購、生產和銷售則一系列過程與物流相結合。從而形成以業(yè)務流程為基礎,形成物流一體化,達到增強企業(yè)市場競爭力的目的。物流已然是企業(yè)市場營銷的基礎。作業(yè)企業(yè)的經(jīng)理,在物流決策方面應當從戰(zhàn)略高度去考慮物流運營成本和市場拓展需要、物流顧客服務的特殊要求之間的動態(tài)平衡,仔細思考怎樣才能把物流系統(tǒng)與營銷戰(zhàn)略以及企業(yè)的總體戰(zhàn)略靈活結合。不再像傳統(tǒng)上,只注重如何解決流程再造、壓縮成本等投入產出的管理問題以及有限資源的合理配置問題。參考文獻【1】孟祥茹
-中國企業(yè)物流運作現(xiàn)狀及發(fā)展戰(zhàn)略探討\o"《山東交通學院學報》"《山東交通學院學報》
-
2013【2】劉鐵鋼
-
我國第三方物流的發(fā)展現(xiàn)狀與運作模式探討\o"《湖南經(jīng)濟管理干部學院學報》"《湖南經(jīng)濟管理干部學院學報》
-
2015【3】鄭金花,余洪明
-
我國企業(yè)物流運作現(xiàn)狀及發(fā)展戰(zhàn)略探討HYPERLINK"/s?wd=journaluri:(587952cbc57554a5)%20%E3%80%8A%E4%BA%A4%E9%80%9A%E4%BC%81%E4%B8%9A%E7%AE%A1%E7%
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 翻譯英語課件的軟件
- 美術課件-消防員
- 安全生產月活動感悟
- 起重作業(yè)安全操作規(guī)程完整版
- 環(huán)衛(wèi)工人安全生產培訓資料
- 安全生產單位的安全生產責任制
- 安全生產知識競賽方案
- 建筑企業(yè)安全生產方案
- 每半年組織一次生產安全事故應急預案演練
- 安監(jiān)局安全生產培訓課件
- 企業(yè)安全生產自查臺賬(建筑施工)
- 實驗室資質認定質量技術負責人培訓
- 綜合實踐活動評價表完整
- GB∕T 16422.3-2022 塑料 實驗室光源暴露試驗方法 第3部分:熒光紫外燈
- 菲迪克(FIDIC)簡明合同格式-中英對照版
- 浙江省基礎教育地方課程(通用內容)標準1-9年級
- 滿堂腳手架專項施工方案
- AVL燃燒分析及在標定的應用培訓
- 線束裝配作業(yè)指導書
- 跨國并購中的知識轉移——沈陽機床并購德國希斯的案例研究
- 北京大學交換學生課程成績認定及學分轉換表(一)
評論
0/150
提交評論