第1講-基礎知識_第1頁
第1講-基礎知識_第2頁
第1講-基礎知識_第3頁
第1講-基礎知識_第4頁
第1講-基礎知識_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

編譯原理課件蘭州大學信息學院1CompilerPrinciples第一講引論課程介紹編譯程序概述2CompilerPrinciples§1.課程介紹一、課程名稱:編譯原理基本內(nèi)容是介紹編譯程序構造的基本原理、方法和技術,包括詞法分析、語法分析、語義分析與中間代碼產(chǎn)生、代碼優(yōu)化及目標代碼產(chǎn)生等。簡言之,就是介紹如何將源程序翻譯成目標代碼程序。3CompilerPrinciples二、課程性質(zhì):專業(yè)基礎課,必修編譯程序(器)出現(xiàn)于上世紀50年代后期(第一個高級語言1958年)60年代~70年代是研究高峰期60年代中期開始在高校中開設課程80年代開始作為計算機科學與技術專業(yè)的必修基礎課程4CompilerPrinciples5CompilerPrinciples三、課程特點:充分體現(xiàn)了計算學科中抽象、理論和設計三個學科形態(tài)該課程涉及多門課程的內(nèi)容綜合運用,涉及面廣,內(nèi)容龐雜,學習艱難程序設計語言、計算機體系結(jié)構、語言理論及算法等數(shù)據(jù)結(jié)構、離散數(shù)學該課程涉及的原理、方法和技術具有十分普遍的意義每一個計算機科學與技術工作者的職業(yè)生涯中反復用到,“享用一輩子”這兒接受的訓練很難在其他地方獲得,如:抽象與形式化方法、局部與全局優(yōu)化方法、構造技術、證明方法等6CompilerPrinciples四、學習該課程的意義編譯程序是計算機系統(tǒng)不可缺少的重要組成部分對程序設計語言的設計與實現(xiàn)能有更深刻的理解對程序設計語言有關理論有所了解從宏觀上把握程序設計語言—掌握了編譯原理后,就不能再說:“某語言未學過,所以不會”有助于快速理解、定位和解決程序調(diào)試與運行中出現(xiàn)的問題7CompilerPrinciples編譯方法與技術有著廣泛應用安全技術、程序理解、軟件逆向工程、應用軟件與軟件工具開發(fā)、軟件測試與驗證等編譯課程蘊含著計算學科中解決問題的思路、抽象和方法,這些與高等數(shù)學一樣,使你“享用一輩子”課程所涉及的內(nèi)容至今非?;钴S自然語言的翻譯軟件移植網(wǎng)絡安全形式化方法形式語義學等8CompilerPrinciples

鑒于以上所述,作為計算機科學與技術專業(yè)的學生必須學習和掌握編譯原理這門課程,當然由于其綜合性、處理問題的復雜性等,學習起來有一定難度,這就需要艱苦奮斗的精神和良好的學習方法9CompilerPrinciples五、學習方法編譯程序的構造是一個龐大而復雜的系統(tǒng)工程,無論是概念還是理論、方法,對初學者來說許多都是新的,學習起來會感到困難大一些,這一點必須有充分認識,為此建議學習方法上注意以下幾點:10CompilerPrinciples課前預習,課堂認真聽講,課后復習加深理解,特別要經(jīng)常有意識地將前后內(nèi)容聯(lián)系起來融會貫通。

因為編譯程序是一個龐大的程序系統(tǒng),講解過程必須“分而治之”(這也是人們處理復雜問題的基本方法),這就要求大家在學習過程中,始終以處理過程為主線,把前后聯(lián)系起來考慮。11CompilerPrinciples理論聯(lián)系實際——親自動手,構造一個演示性編譯程序,至少要完成掃描器和語法分析器,以及語法制導翻譯產(chǎn)生中間代碼(課程設計)認真完成作業(yè),進一步鞏固并加深理解所學知識特別要下功夫認真學習如何從實際問題進行抽象并形式化,最終建立實際問題的模型(上升為理性認識),并借助模型進一步設計實現(xiàn),這將對你能力的提高大有益處12CompilerPrinciples六、參考書13CompilerPrinciples§2.編譯程序概述一、翻譯程序(Translator)

能夠把一種語言程序(稱為源語言程序)轉(zhuǎn)換成邏輯上等價的另一種語言程序(稱為目標語言程序)的程序14CompilerPrinciples任何非機器語言程序都需要翻譯程序翻譯程序的工作就是進行等價變換(映射)兩個程序邏輯上等價是指對相同輸入得到相同的輸出翻譯程序解釋程序匯編程序編譯程序15CompilerPrinciples匯編程序(Assembler)

把匯編語言程序轉(zhuǎn)變?yōu)闄C器語言程序的翻譯程序解釋程序(Interpreter)

把源程序作為輸入接收,邊解釋邊執(zhí)行的翻譯程序源程序數(shù)據(jù)解釋程序結(jié)果16CompilerPrinciples編譯程序

將高級語言程序轉(zhuǎn)變?yōu)榈图壵Z言程序的翻譯程序源程序編譯程序目標程序17CompilerPrinciples這是GCC的例子18CompilerPrinciples19CompilerPrinciples編譯程序又可根據(jù)用途和側(cè)重點的不同,進一步分類為:

①診斷編譯程序(DiagnosticCompiler)

專門用于幫助程序開發(fā)和調(diào)試的編譯程序

②優(yōu)化編譯程序(OptimizingCompiler)

著重于提高目標代碼效率的編譯程序

③交叉編譯程序(CrossCompiler)

能夠產(chǎn)生不同于其宿主機機器代碼的編譯程序

④可變目標編譯程序(Retargetablecomplier)

無須重寫與機器無關部分就能改變目標機的編譯程序20CompilerPrinciples二、與編譯程序相關的程序本講義只介紹編譯程序(器)構造的基本原理、方法與技術,但在一個完整的語言開發(fā)(或稱程序設計)環(huán)境中,除了編譯器這一主要工具外,還需要其他一些工具,如編輯器、連接器、裝入程序等?,F(xiàn)代計算機系統(tǒng)常將這些相互獨立的程序設計工具集成起來,構成一個集成化的程序開發(fā)環(huán)境,以提高程序設計效率和程序的質(zhì)量。如TurboC、VisualC++等語言環(huán)境都是集成化的程序設計環(huán)境。而Ada語言的集成環(huán)境是這方面的典型代表。21CompilerPrinciples如Ada語言的集成環(huán)境是一個分層的程序開發(fā)環(huán)境編譯程序MAPSE編輯程序連接程序宿主機OSAPSE工具界面用戶界面KAPSE調(diào)試程序配置管理程序命令解釋程序其他工具22CompilerPrinciples這兒要強調(diào)的是:盡管本課程只介紹編譯的基本理論、方法和技術,但這些基本理論、方法與技術對其他工具的構造同樣起作用!23CompilerPrinciples編輯器(Editor)

完成源程序輸入、編輯并產(chǎn)生標準文件(如ASCII文件)的程序。近來已與編譯器和其他程序捆綁進一個交互開發(fā)環(huán)境——IDE中盡管這樣的編輯器仍生成標準文件,但會轉(zhuǎn)向正被討論的程序設計語言的格式或結(jié)構(稱為基于結(jié)構的),且已包含了編譯器的某些操作;因此在程序編寫時而不是編譯時就可得知錯誤,甚至也可調(diào)用編譯器24CompilerPrinciples預處理程序(Preprocessor)

在真正翻譯開始之前產(chǎn)生編譯程序的輸入的程序處理宏及注釋:宏是被經(jīng)常使用的較長結(jié)構的縮寫處理文件包含:把頭文件包含到程序正文中(如C的文件包含include<….h>)“理解”預處理器:把現(xiàn)代控制流和數(shù)據(jù)結(jié)構機制添加到比較老式的語言中語言擴充:通過大量的內(nèi)部宏定義來增強語言的能力,如Equel語言是一種嵌套在C語言中的數(shù)據(jù)庫查詢語言25CompilerPrinciples連接程序(Linker)——又稱為連接編輯器。將分別在不同的目標文件中編譯(或匯編)的代碼、所用標準庫函數(shù)的代碼以及操作系統(tǒng)提供的資源(如存儲分配程序及輸入/輸出設備)收集到一個可直接執(zhí)行的文件中的程序裝配程序(Loader)

完成程序的裝入和連接編輯兩項功能。裝入過程包括讀入可重定位機器代碼、修改可重定位地址、并將修改后的指令和數(shù)據(jù)放到內(nèi)存的適當位置。

裝入程序使得可執(zhí)行代碼更加靈活26CompilerPrinciples調(diào)試程序(Debugger)

可在被編譯了的程序中判定執(zhí)行錯誤的程序它經(jīng)常與編譯程序一起放在IDE中運行一個帶有調(diào)試程序的程序與直接執(zhí)行不同,這是因為調(diào)試程序保存著所有的或大多數(shù)源代碼信息,它可以在預先指定的位置(斷點BreakPoint)暫停執(zhí)行,并提供有關信息(已調(diào)用的函數(shù)、變量名的當前值等)27CompilerPrinciples其他有關的還有描述器(Profiler)——執(zhí)行中搜集目標程序行為統(tǒng)計的程序項目管理程序(ProjectManager)——如Unix系統(tǒng)中的SCCS(源代碼控制系統(tǒng))和RCS(修正控制系統(tǒng))和匯編程序等綜上所述可給出一個“語言處理系統(tǒng)”的圖示:28CompilerPrinciples我們這個課只介紹編譯程序這一部分29CompilerPrinciples三、編譯過程與編譯程序結(jié)構

1.編譯過程:

輸入輸出(高級語言源程序)(低級語言目標程序)

編譯程序工作過程如下:識別出一個個的單詞分析句子的語法結(jié)構分析句子的語義并進行初步翻譯對初步翻譯進行優(yōu)化整理出目標程序?qū)σ陨线^程進一步整理可得如下編譯程序結(jié)構總框:編譯程序30CompilerPrinciples2.編譯程序總框:詞法分析器語法分析器語義分析與中間代碼產(chǎn)生器優(yōu)化器目標代碼生成器單詞符號語法單位中間代碼中間代碼出錯處理表格管理源程序目標代碼31CompilerPrinciples3.五個階段簡介第一階段:詞法分析——依據(jù)語言構詞規(guī)則,識別出一個個單詞(符號)

單詞種類保留字:forifwhile算符:+-×/界符:,;(){}標識符:a1a2pi常數(shù):910244.86E6無窮性有窮性思考:識別有窮集合VS識別無窮集合32CompilerPrinciples

詞法分析工作由詞法分析器(或稱掃描器)完成。

掃描器輸出為等長度的單詞符號(二元式)流。

例:Position=initial+rate*60詞法分析(掃描器)保留字表(06,‘Position’)

(11,─)

(06,‘initial’)

(12,─)

(06,‘rate’)

(13,─)

(07,’60的二進制’)33CompilerPrinciples第二階段:語法分析——依據(jù)語言的語法規(guī)則,把掃描器提供的單詞符號串分解成各種語法單位(范疇),如“短語”、“子句”、“句子”乃至“程序”。同時進行語法檢查,以確定輸入串是否正確,該工作是由語法分析器完成的。

如:Position=initial+rate*60是一個“賦值表達式”(C語言中)Position=表達式表達式表達式+表達式標識符表達式*表達式initial標識符常數(shù)rate60標識符34CompilerPrinciples第三階段:語義分析與中間代碼產(chǎn)生——針對各類不同的語法范疇,按語言的語義規(guī)則進行語義分析和初步翻譯工作,產(chǎn)生某種中間語言形式的中間代碼(即一種結(jié)構簡單,含義明確的記號系統(tǒng))。

該階段工作通常包括兩個方面的工作:

對每種語法范疇進行靜態(tài)語義檢查,包括:變量是否定義過類型是否正確是否用了0作除數(shù)……35CompilerPrinciples將語法范疇翻譯成某種形式的中間代碼,如四元式:OpARG1ARG2Result*rate60T1+initialT1T2

=T2Position36CompilerPrinciples第四階段:優(yōu)化——對前階段產(chǎn)生的中間代碼進行加工變換,以期在最后階段能產(chǎn)生出高效(節(jié)省時、空)的目標代碼,這一任務是由優(yōu)化器來完成的根據(jù)優(yōu)化的范圍不同,可分為:

局部優(yōu)化,循環(huán)優(yōu)化和全局優(yōu)化一個循環(huán)優(yōu)化的例子:37CompilerPrinciples⑴=1K⑴=IM⑵J<100K⑼⑵=JN⑶*10KT1⑶=1K⑷+IT1M⑷J<100K⑼⑸*10KT2⑸+M10M⑹+JT2N⑹+N10N⑺+K1K⑺+K1K⑻J⑵⑻J⑷⑼…⑼…循環(huán)

For(k=1;k<=100;k++){M=I+10*k;N=J+10*k;}優(yōu)化前用了兩個臨時工作單元(T1,T2),

優(yōu)化后沒有用臨時單元優(yōu)化前循環(huán)體中要做300次加、200次乘,

優(yōu)化后循環(huán)體內(nèi)只做300次加38CompilerPrinciples第五階段:目標代碼生成——把中間代碼翻譯成目標代碼顯然這階段要依賴于硬體系統(tǒng)結(jié)構和指令系統(tǒng)涉及存貯分配、寄存器調(diào)度這一階段工作是由代碼生成器完成的說明:以上各階段(或稱工序)并不是截然分開的,尤其編譯程序結(jié)構十分復雜、體積相當龐大,所以有時人們把幾個階段的工作有機地組合在一起、穿插進行,構成遍。39CompilerPrinciples遍(Pass):對源程序或源程序的中間代碼從頭到尾掃描一次并做相應處理加工分遍的好處是結(jié)構清晰、節(jié)省內(nèi)存(每遍都從外存獲取前一遍的結(jié)果作為開始,工作結(jié)果仍記入外存,每遍幾乎可使用全部內(nèi)存)分不分遍、如何分遍要視具體情況——計算機內(nèi)存容量、源語言的繁簡、從事編譯程序設計人員的情況等40CompilerPrinciples如某PL/0編譯程序的結(jié)構詞法分析程序語法語義分析程序代碼生成程序PL/0源程序目標程序表格管理程序出錯處理程序41CompilerPrinciples

4.前端與后端:概念上講,編譯程序的五個階段可進一步劃分為前端和后端:前端:主要由與源語言有關而與目標機無關的部分組成,包括詞法分析、語法分析、語義分析和中間代碼產(chǎn)生。代碼優(yōu)化一般也包含在前端。后端:主要由與目標機有關的部分組成,包括目標代碼生成和與目標機有關的優(yōu)化等。42CompilerPrinciples源程序詞法分析語法分析語義分析和中間代碼產(chǎn)生中間語言中間代碼優(yōu)化目標代碼生成目標代碼優(yōu)化目標語言前端后端43CompilerPrinciples劃分前端和后端,就可以僅改寫后端而生成不同目標機上的目標程序,當然也可考慮對不同語言僅稍加改變前端而產(chǎn)生相同的中間代碼,經(jīng)同一后端生成相同目標機的目標代碼。就目前來說,針對相同中間代碼適應不同目標機的工作較多,如Ada語言的APSE(Ada程序設計環(huán)境)中使用的Diana中間代碼,Java語言定義的虛擬機代碼——Bytecode中間語言,都是定義良好的中間語言。44CompilerPrinciplesJava的傳統(tǒng)環(huán)境Java源程序(.java)編譯環(huán)境Java編譯器Java字節(jié)碼(.class)Java字節(jié)碼(本地或網(wǎng)絡傳輸)運行環(huán)境類加載程序字節(jié)碼驗證Java類庫Java解釋器即時編譯器Java虛擬機硬件45CompilerPrinciples5.表格與表格管理表格記錄源程序中的各類有用信息——名字、函數(shù)、標號、過程、數(shù)值等每個階段的工作都要與表格打交道:查、填、改等表格的結(jié)構與處理方法:統(tǒng)一的大表與分類的小表統(tǒng)一大表名字欄為主欄(關鍵字欄),信息欄又分成若干子欄——種屬、類型等NAMEINFORMATION46CompilerPrinciples分類小表:每類一張表,如:符號名表(SNT)

常數(shù)表(CT)

3.141592648…X啞元實型A數(shù)組整型…………47CompilerPrinciplesDO編號(03)……L1入口地址……Swap二目子程序

入口地址……入口表(ENT)

標號表(LBT)

基本字表(KWT)48CompilerPrinciples6.出錯處理:這是編譯程序的又一重要組成部分,因為編譯的各個階段都有可能發(fā)現(xiàn)源程序中的錯誤。一旦發(fā)現(xiàn)這樣或那樣的錯誤,就應把錯誤的性質(zhì)及位置報告給用戶,并且使編譯能繼續(xù)下去。

思考:如何準確地報告錯誤如何從錯誤中恢復過來49CompilerPrinciples四、編譯程序的構造過程1.需求分析,確定語言文本(1)確定語言的種類:

按語言范型分類,當今大多數(shù)程序語言可分為四類:過程式(強制式語言):命令驅(qū)動,面向語句,如FORTRAN、PASCAL、Ada及C等函數(shù)式(應用式)語言:功能驅(qū)動,面向函數(shù),如LISP、SNOBOL及ML等邏輯式(基于規(guī)則的)語言:依據(jù)條件進行邏輯推演,如Prolog等OO語言:支持封裝性、繼承性、多態(tài)性及動態(tài)聚束等,以對象為運行單位,如Smalltalk、Java、C++等50CompilerPrinciples

通過用戶提供的應用范圍,決定采用何種語言。例如:偏重于科學計算的則選用Fortran;偏重于符號處理的則選用Lisp或Snobol;偏重于事務處理的則選用Cobol或數(shù)據(jù)庫管理語言;……51CompilerPrinciples(2)深刻理解語言的結(jié)構、語法及語義這就是說不僅僅是用程序設計語言編幾個程序的問題,而是要在語法和語義方面下一些功夫。具體說來有以下幾個方面:①程序語言的定義:任何程序語言都是某個確定的字符集上的符號按照一定規(guī)則組成的有窮序列。這里所謂的規(guī)則是從兩個方面來談的:·語法規(guī)則:用于形成和產(chǎn)生一個正確的程序的一組規(guī)則?!ふZ義規(guī)則:用于定義程序意義的一組規(guī)則。52CompilerPrinciples例如:從語法的角度看,標識符和名字是一個東西,都是以字母開頭的字母數(shù)字串;但從語義的角度看,標識符是一個沒有任何意義的字符序列,而名字卻有確定的意義和屬性,而且具有一定的作用域和定義域,即有局部和全部之分。又如:程序從語法角度看,是一些語法范疇構成的如下層次結(jié)構:53CompilerPrinciples程序分程序或子程序(過程、函數(shù)等)語句表達式數(shù)據(jù)引用算符函數(shù)調(diào)用而從語義的角度來說,程序是描述一定的數(shù)據(jù)結(jié)構及其處理過程。54CompilerPrinciples②程序結(jié)構:現(xiàn)代高級語言程序通常由若干子程序段(過程、函數(shù)等)構成,許多語言還引入了類、程序包等更高級的結(jié)構。例如,F(xiàn)ortran、C程序是塊結(jié)構的;Pascal程序是過程嵌套的;Algol既有分程序嵌套,又有過程嵌套;Java與C++是面向?qū)ο蟮?,它們很重要的方面是類和繼承的概念,同時支持多態(tài)性和動態(tài)聚束等特性;而在Ada中引入了程序包,它可以把數(shù)據(jù)和操作代碼封裝在一起,支持數(shù)據(jù)抽象。(詳見教材P15-18)55CompilerPrinciples③語言的基本成分:包括數(shù)據(jù)類型、表達式、語句、過程或函數(shù)等,這些在學習語言課時都已經(jīng)學過了,但從編譯的角度出發(fā),應如何了解這些基本成分呢?·初等數(shù)據(jù)類型:牽扯到存儲空間的問題;·結(jié)構數(shù)據(jù)類型:牽扯到下標、維數(shù)、存放方式、分配時間----動態(tài)與靜態(tài)等;·表達式:牽扯到運算分量、運算符、形成規(guī)則、運算順序等;·語句:順序、控制、循環(huán)等;·過程與參數(shù)傳遞:傳地址、傳值、傳名、得結(jié)果等;·存儲管理:靜態(tài)存儲分配、動態(tài)存儲分配;56CompilerPrinciples2.由程序設計環(huán)境確定編譯程序構造的方式和方法最早是直接使用機器語言或匯編語言現(xiàn)在一般使用高級語言Pascal或C語言

好處:編譯方式還是解釋方式便于閱讀、理解和移植提高程序設計效率易于查錯和修改57CompilerPrinciples任何一個編譯程序至少要涉及三種語言:源語言(S)、目標語言(T)和編譯程序?qū)崿F(xiàn)語言(I),可用如下T型圖來表示三者之間的關系:STI58CompilerPrinciplesAda語言A

代碼Ada語言A

代碼CCA代碼A代碼A代碼用C語言編寫Ada編

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論