![《形式語(yǔ)言與自動(dòng)機(jī)》課件chap2-文法與語(yǔ)言_第1頁(yè)](http://file4.renrendoc.com/view/c6f76af23a61e949f93d08bc8917ceff/c6f76af23a61e949f93d08bc8917ceff1.gif)
![《形式語(yǔ)言與自動(dòng)機(jī)》課件chap2-文法與語(yǔ)言_第2頁(yè)](http://file4.renrendoc.com/view/c6f76af23a61e949f93d08bc8917ceff/c6f76af23a61e949f93d08bc8917ceff2.gif)
![《形式語(yǔ)言與自動(dòng)機(jī)》課件chap2-文法與語(yǔ)言_第3頁(yè)](http://file4.renrendoc.com/view/c6f76af23a61e949f93d08bc8917ceff/c6f76af23a61e949f93d08bc8917ceff3.gif)
![《形式語(yǔ)言與自動(dòng)機(jī)》課件chap2-文法與語(yǔ)言_第4頁(yè)](http://file4.renrendoc.com/view/c6f76af23a61e949f93d08bc8917ceff/c6f76af23a61e949f93d08bc8917ceff4.gif)
![《形式語(yǔ)言與自動(dòng)機(jī)》課件chap2-文法與語(yǔ)言_第5頁(yè)](http://file4.renrendoc.com/view/c6f76af23a61e949f93d08bc8917ceff/c6f76af23a61e949f93d08bc8917ceff5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
12023/5/21SchoolofComputerScience,BUPT第二章語(yǔ)言及文法主要內(nèi)容:定義形式語(yǔ)言的術(shù)語(yǔ)給出文法的定義和文法的分類要求掌握:語(yǔ)言和文法的形式定義CHOMSKY文法體系的分類。22023/5/21SchoolofComputerScience,BUPT第一節(jié)語(yǔ)言的定義與運(yùn)算一、語(yǔ)言的一些術(shù)語(yǔ):
字母表:字符的有限集合,記為T。字符串:由字母表T中的字符構(gòu)成的序列稱字母表T上的字符串(句子)。常記為u,v,w,x,y,z;
常用a,b,c,d
標(biāo)識(shí)單個(gè)字符。32023/5/21SchoolofComputerScience,BUPT字母表(Alphabet)
概念
形式符號(hào)的集合
記號(hào)常用T、表示
舉例英文字母表a,b,…,z,A,B,…,Z
英文標(biāo)點(diǎn)符號(hào)表,;:.?!’‘“”()…漢字表…,自,…,動(dòng),…,機(jī),…
化學(xué)元素表H,He,Li,…,
T=a,n,y,…42023/5/21SchoolofComputerScience,BUPT字符串(string)
概念字母表T上的一個(gè)字符串(簡(jiǎn)稱串),或稱為字(word),為T
中字符構(gòu)成的一個(gè)有限序列。
空串(emptystring),用表示,不包含任何字符。舉例設(shè)T=a,b,則
,
a,ba,bbaba等都是串
字符串w
的長(zhǎng)度,記為w,是包含在w中字符的個(gè)數(shù)。
舉例=0,bbaba=5
ai
表示含有i個(gè)a的字符串
52023/5/21SchoolofComputerScience,BUPT
連接(concatenation)
設(shè)x,y為串,且xa1a2…am,yb1b2…bn,則x與y的連接
xya1a2…amb1b2…bn
連接運(yùn)算的性質(zhì)
(xy)z
x(yz
)
xxx
xyx+y
關(guān)于字符串的運(yùn)算62023/5/21SchoolofComputerScience,BUPT
其它如取頭字符,取尾部,子串匹配
等
設(shè)ω1,ω2,ω3是字母表T上的字符串,稱ω1是字符串ω1ω2的前綴,ω2是字符串ω1ω2的后綴,且ω2是字符串ω1ω2ω3的子串??沾侨魏巫址那熬Y,后綴及子串。
例:
abc的前綴aababcε.后綴cbcabcε.子串a(chǎn)bcabbcabcε,
即一個(gè)字符串可以看作是多個(gè)字符串的連接。
關(guān)于字符串的運(yùn)算72023/5/21SchoolofComputerScience,BUPT字符串ω的逆用表示。是字符串ω的倒置。ω=b1b2……bn=bnbn-1……b2b1
空串ε的逆還是ε82023/5/21SchoolofComputerScience,BUPT字母表的冪運(yùn)算
冪運(yùn)算設(shè)T為字母表,n為任意自然數(shù),定義(1)T0=(2)設(shè)x
Tn-1,a
T,則a
x
Tn(3)
Tn中的元素只能由(1)和(2)生成
閉包
T*=
T0T1T2…
閉包
T+=
T1T2T3…
T*=T+,T+=T*
92023/5/21SchoolofComputerScience,BUPT閉包的物理意義
T的星號(hào)閉包T*:字母表T上的所有字符串和空串的集合。
T的正閉包T+:字母表T上的所有字符串構(gòu)成的集合。 T*=T+∪{ε}舉例設(shè)T=0,1,則
T0=,T1=0,1,T2=00,01,10,11,…
T*=,0,1,00,01,10,11,…
T+=
0,1,00,01,10,11,…102023/5/21SchoolofComputerScience,BUPT語(yǔ)言(Languages)
概念設(shè)T為字母表,則任何集合LT*是字母表T上的一個(gè)語(yǔ)言(language)
舉例
英文單詞集…,English,…,words,…
C
語(yǔ)言程序集…字母表?漢語(yǔ)成語(yǔ)集…,馬到成功,…
化學(xué)分子式集…,H2O,…,NaCl,…
any,…
112023/5/21SchoolofComputerScience,BUPT語(yǔ)言(Languages)舉例:設(shè)T={a,b}則L1={anbn|n≥1}L3={bk|k
是質(zhì)數(shù)}L2={ε}只有一個(gè)空句子的語(yǔ)言L4={}=Φ空語(yǔ)言均為字母表T上的語(yǔ)言。由語(yǔ)言的定義知語(yǔ)言是集合,對(duì)于集合的運(yùn)算可應(yīng)用于對(duì)于語(yǔ)言的計(jì)算。如并,交,補(bǔ),差。122023/5/21SchoolofComputerScience,BUPT語(yǔ)言的基本運(yùn)算語(yǔ)言的積:
兩個(gè)語(yǔ)言L1和L2的積L1L2是由L1和L2中的字符串連接所構(gòu)成的字符串的集合。即L1中所有字符串分別與L2中的字符串連接得到的集合。設(shè)T={a,b},L1和L2是T上的語(yǔ)言。L1={ab,ba}L2={aa,bb}則L1L2={abaa,abbb,baaa,babb}L2L1={aaab,aaba,bbab,bbba}L1L2≠L2L1
語(yǔ)言的積不可交換。132023/5/21SchoolofComputerScience,BUPT語(yǔ)言的基本運(yùn)算語(yǔ)言的冪: 語(yǔ)言的冪可歸納定義如下: L0={ε}Ln=L·Ln-1=Ln-1·Ln≥1上例中,L12={abab,abba,baab,baba}L22={aaaa,aabb,bbaa,bbbb}
142023/5/21SchoolofComputerScience,BUPT第二節(jié)文法定義:所謂文法是用來(lái)定義語(yǔ)言的一個(gè)數(shù)學(xué)模型表示語(yǔ)言的方法:若語(yǔ)言L是有限集合,可用列舉法若L是無(wú)限集合(集合中的每個(gè)元素有限長(zhǎng)度),用其他方法。方法一:文法產(chǎn)生系統(tǒng),由定義的文法規(guī)則產(chǎn)生出語(yǔ)言的每個(gè)句子方法二:機(jī)器識(shí)別系統(tǒng):當(dāng)一個(gè)字符串能被一個(gè)語(yǔ)言的識(shí)別系統(tǒng)接受,則這個(gè)字符串是該語(yǔ)言的一個(gè)句子,否則不屬于該語(yǔ)言。152023/5/21SchoolofComputerScience,BUPT元語(yǔ)言定義:描述語(yǔ)言的語(yǔ)言 例如:各種各樣的程序設(shè)計(jì)語(yǔ)言當(dāng)人們要解釋或討論程序設(shè)計(jì)語(yǔ)言本身時(shí),又需要一種語(yǔ)言,被討論的語(yǔ)言叫做對(duì)象語(yǔ)言,即某種程序設(shè)計(jì)語(yǔ)言,討論對(duì)象語(yǔ)言的語(yǔ)言稱為元語(yǔ)言。162023/5/21SchoolofComputerScience,BUPTBNF(巴科斯范式) BNF范式通常被作為討論某種程序設(shè)計(jì)語(yǔ)言語(yǔ)法的元語(yǔ)言<數(shù)字>::=0|1|2|……9::=“定義為”<字母>::=A|B|C|……Z|a|b|……z<標(biāo)識(shí)符>::=<字母>|<標(biāo)識(shí)符><字母>|<標(biāo)識(shí)符><數(shù)字>
….通過(guò)上述定義可知,所有以字母開(kāi)頭的,由字母和數(shù)字組成的字符串都是標(biāo)識(shí)符。BNF定義了一種語(yǔ)言,其中標(biāo)識(shí)符如上定義。BNF描述它所定義的語(yǔ)言,為元語(yǔ)言。172023/5/21SchoolofComputerScience,BUPT例如:漢語(yǔ)語(yǔ)法中定義了句子的結(jié)構(gòu)由主語(yǔ)、謂語(yǔ)、賓語(yǔ)組成。這里主謂賓只是描述了句子的結(jié)構(gòu),并不是句子。而按照這種結(jié)構(gòu)組成的建立在漢字上的字符串就是句子。如他是學(xué)生。文法是一種元語(yǔ)言,一種方法,根據(jù)文法產(chǎn)生出語(yǔ)言的句子。182023/5/21SchoolofComputerScience,BUPT三、Chomsky文法體系例如:BNF<標(biāo)識(shí)符>::=<字母><標(biāo)識(shí)符>::=<標(biāo)識(shí)符><字母><標(biāo)識(shí)符>::=<標(biāo)識(shí)符><數(shù)字><字母>::=a|b|……z|A|B|……|Z<數(shù)字>::=0|1|……9將::=改為→表示可被代替用I,L,D分別表示標(biāo)識(shí)符、字母、數(shù)字;192023/5/21SchoolofComputerScience,BUPT則上述表達(dá)式可以表示為
I→L
I→IL
I→ID
L→a|b|….|z
D→0|1|….9這就是一個(gè)文法的生成式集合。202023/5/21SchoolofComputerScience,BUPTChomsky文法體系中,任何一種文法必須包含有兩個(gè)不同的有限符號(hào)的集合,即非終結(jié)符集合N和終結(jié)符集合T。一個(gè)形式規(guī)則的有限集合P(生成式集合),一個(gè)起始符S。P中的生成式是用來(lái)產(chǎn)生語(yǔ)言句子的規(guī)則,而句子則是僅由終結(jié)符組成的字符串。這些字符串必須從一個(gè)起始符S開(kāi)始,不斷使用P中的生成式而導(dǎo)出來(lái)??梢?jiàn)文法的核心是生成式的集合,它決定了語(yǔ)言中句子的產(chǎn)生。212023/5/21SchoolofComputerScience,BUPT文法的形式定義文法G是一個(gè)四元組G=(N,T,P,S),其中
N
非終結(jié)符的有限集合
T
終結(jié)符的有限集合N∩T=Φ
P形式為α→β的生成式的有限集合。 且α∈(N∪T)*N+(N∪T)*,β∈(N∪T)*
S
起始符且S∈N。222023/5/21SchoolofComputerScience,BUPT將上例用文法表示 G=(N,T,P,S)N={I,L,D}T={a,b,c,…z,0,1,…9}P={I,La,…,D0,…,D9}S={I}文法是語(yǔ)言的產(chǎn)生系統(tǒng),研究怎樣構(gòu)造文法能產(chǎn)生出符合要求的句子。232023/5/21SchoolofComputerScience,BUPT四.推導(dǎo)與句型1、直接推導(dǎo) 設(shè)G=(N,T,P,S)是文法,若A→β是P中的生成式,α和γ是(N∪T)*中的字符串,則有αAγ=>αβγ稱αAγ直接推導(dǎo)出αβγ,或說(shuō)αβγ是αAγ的直接推導(dǎo)。242023/5/21SchoolofComputerScience,BUPT設(shè)G=(N,T,P,S)是文法,α、α0、α1…αn、α’都是(N∪T)*中的字符串,且α=α0、α’=αn,其中αi直接推導(dǎo)出αi+1(0≤i≤n),則稱序列α0=>α1=>α2=>…=>αn是長(zhǎng)度為n的推導(dǎo)序列,而α=α0是長(zhǎng)度為0的推導(dǎo)序列。對(duì)α推導(dǎo)出α’記為αα’,若推導(dǎo)序列長(zhǎng)度大于0,則記為αα’。推導(dǎo)序列的每一步,都產(chǎn)生一個(gè)字符串,這些字符串一般稱為句型。2、推導(dǎo)序列252023/5/21SchoolofComputerScience,BUPT3、句型和句子句型 字符串α是文法G的句型,當(dāng)且僅當(dāng)S
α,且α∈(N∪T)*。
句子ω是G的句子,當(dāng)且僅當(dāng)Sω,且ω∈T*。(ω是由終結(jié)符組成的字符串)例:I=>L=>a
I=>IL=>LL=>zL=>zb句型包含句子262023/5/21SchoolofComputerScience,BUPT4.文法產(chǎn)生的語(yǔ)言由文法G產(chǎn)生的語(yǔ)言記為L(zhǎng)(G)。
L(G)={ω|ω∈T*且S
ω}或:
L(G)中的一個(gè)字符串,必是由終結(jié)符組成的,并且是從起始符S推導(dǎo)出來(lái)的。272023/5/21SchoolofComputerScience,BUPT第三節(jié)Chomsky文法體系分類文法G=(N,T,P,S);P:α→β
其中α∈(N∪T)*N+(N∪T)*β∈(N∪T)*屬于Chomsky文法體系該體系對(duì)生成式的形式做了一些規(guī)定,分為四類,即0型、1型、2型、3型文法0型文法:無(wú)限制文法 對(duì)應(yīng)的語(yǔ)言:遞歸可枚舉語(yǔ)言,與圖靈機(jī)等價(jià)。282023/5/21SchoolofComputerScience,BUPT1型文法也稱上下文有關(guān)文法(CSG:Context-sensitiveGrammar) 生成式的形式為α→β, 其中|α|≤|β|,β∈(N∪T)+,
α∈(N∪T)*N+(N∪T)*對(duì)應(yīng)的語(yǔ)言:上下文有關(guān)語(yǔ)言(CSL:Context-sensitiveLanguage)若不考慮ε,與線性有界自動(dòng)機(jī)(LBA,LinearBoundedAutomaton)等價(jià)。292023/5/21SchoolofComputerScience,BUPT2型文法也稱上下文無(wú)關(guān)文法(CFG:Context-freeGrammar)
A→α,
A∈N,且α∈(N∪T)*對(duì)應(yīng)的語(yǔ)言:上下文無(wú)關(guān)語(yǔ)言(CFL:Context-freeLanguage)。對(duì)應(yīng)的自動(dòng)機(jī):下推自動(dòng)機(jī)(PDA:PushdownAutomaton)。302023/5/21SchoolofComputerScience,BUPT3型文法也稱正則文法右線性文法(Right-linearGrammar):A→ωB
或A→ω
A、B∈N,ω∈T*。左線性文法(Left-linearGrammar): A→Bω或A→ω
A、B∈N,ω∈T*。對(duì)應(yīng)的語(yǔ)言:正則語(yǔ)言對(duì)應(yīng)的自動(dòng)機(jī):有限自動(dòng)機(jī)(FiniteAutomaton)。312023/5/21SchoolofComputerScience,BUPT例1: G=({A,B,C},{a,b,d},P,A)
P:A→AB,AB→CAAB,A→d,B→a,C→b
是1型文法。A=>dA=>AB=>dB=>daA=>AB=>ABB=>dBB=>daB=>daaA=>AB=>CAAB=>bAAB=>bdAB=>bdCAAB=>bdbAAB=>bdbdAB=>bdbddB=>bdbdda322023/5/21SchoolofComputerScience,BUPT例2: G=({A,B,C},{a,b,c},P,A)
P:A→abc
A→aBbc
Bb→bB
Bc→Cbcc
bC→Cb
aC→aaB
aC→a
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 助產(chǎn)師復(fù)習(xí)試題含答案
- 2025年度智能電網(wǎng)規(guī)劃設(shè)計(jì)合同
- 醫(yī)保協(xié)議合同范本
- 農(nóng)村硅藻泥采購(gòu)合同范本
- 儀器 借用合同范本
- cng纏繞氣瓶合同范本
- 2024年半導(dǎo)體分立器件項(xiàng)目評(píng)估報(bào)告
- 北京辦公裝修合同范本
- 樓地面找平工程合同范本
- 會(huì)議室使用合同范本
- 杭州市淳安縣國(guó)有企業(yè)招聘筆試真題2024
- 2024政府采購(gòu)評(píng)審專家考試真題庫(kù)及答案
- 2025年道路貨運(yùn)駕駛員從業(yè)資格證模擬考試題
- 數(shù)學(xué)-安徽省皖南八校2025屆高三上學(xué)期12月第二次大聯(lián)考試題和答案
- 退市新規(guī)解讀-上海證券交易所、大同證券
- 融資報(bào)告范文模板
- 桃李面包盈利能力探析案例11000字
- GB/Z 30966.71-2024風(fēng)能發(fā)電系統(tǒng)風(fēng)力發(fā)電場(chǎng)監(jiān)控系統(tǒng)通信第71部分:配置描述語(yǔ)言
- 腦梗死的護(hù)理查房
- 2025高考數(shù)學(xué)專項(xiàng)復(fù)習(xí):概率與統(tǒng)計(jì)的綜合應(yīng)用(十八大題型)含答案
- 2024-2030年中國(guó)紫蘇市場(chǎng)深度局勢(shì)分析及未來(lái)5發(fā)展趨勢(shì)報(bào)告
評(píng)論
0/150
提交評(píng)論