該命令行將顯示文本myfile中所有超過80個字符的行號_第1頁
該命令行將顯示文本myfile中所有超過80個字符的行號_第2頁
該命令行將顯示文本myfile中所有超過80個字符的行號_第3頁
該命令行將顯示文本myfile中所有超過80個字符的行號_第4頁
該命令行將顯示文本myfile中所有超過80個字符的行號_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Unix awk使用手冊作者的話:UNIX AWK使用手冊是我?guī)讉€月前的作品了,回過頭來看,這篇文章實(shí)在是很粗燥,因當(dāng)時我寫作并上傳這個作品時實(shí)在是太忙了,沒有對文章的質(zhì)量進(jìn)行很好的檢查,心里老覺得有愧于網(wǎng)友的厚愛,于是趁閑趕忙重寫一遍,雖然不一定會有很大的改觀,但質(zhì)量是肯定要好一點(diǎn)的,唯如此,我的良心上才好受一點(diǎn),呶,下面就是我的修改稿,各位老友請與第一版相比一下,看是否有所進(jìn)步! 這次改寫仍然保留了原有的風(fēng)格:正文由淺入深,文后附上了大量的相關(guān)資料,這樣做的原因是為了滿足各種用戶的需求,這在第一版中已經(jīng)說過了。這次主要的改變是在內(nèi)容上,加入了很多新內(nèi)容,并增加了示例,以幫助讀者理解其中的內(nèi)

2、容,附錄也補(bǔ)充了許多新的資料。當(dāng)然讀者要真正地掌握awk,僅僅讀了本文是不夠的,還必須有上機(jī)實(shí)習(xí)這一步。值得提醒大家的是,awk有很多版本,并且各個版本之間存在著一些差別,因此,在使用awk以前最好參考一下你使用的系統(tǒng)的聯(lián)機(jī)幫助。 什么是awk?你可能對UNIX比較熟悉,但你可能對awk很陌生,這一點(diǎn)也不奇怪,的確,與其優(yōu)秀的功能相比,awk還遠(yuǎn)沒達(dá)到它應(yīng)有的知名度。awk是什么?與其它大多數(shù)UNIX命令不同的是,從名字上看,我們不可能知道awk的功能:它既不是具有獨(dú)立意義的英文單詞,也不是幾個相關(guān)單詞的縮寫。事實(shí)上,awk是三個人名的縮寫,他們是:Aho、(Peter)Weinberg和(B

3、rain)Kernighan。正是這三個人創(chuàng)造了awk-一個優(yōu)秀的樣式掃描與處理工具。 AWK的功能是什么?與sed和grep很相似,awk是一種樣式掃描與處理工具。但其功能卻大大強(qiáng)于sed和grep。awk提供了極其強(qiáng)大的功能:它幾乎可以完成grep和sed所能完成的全部工作,同時,它還可以可以進(jìn)行樣式裝入、流控制、數(shù)學(xué)運(yùn)算符、進(jìn)程控制語句甚至于內(nèi)置的變量和函數(shù)。它具備了一個完整的語言所應(yīng)具有的幾乎所有精美特性。實(shí)際上,awk的確擁有自己的語言:awk程序設(shè)計(jì)語言,awk的三位創(chuàng)建者已將它正式定義為:樣式掃描和處理語言。 為什么使用awk?即使如此,你也許仍然會問,我為什么要使用awk?使用

4、awk的第一個理由是基于文本的樣式掃描和處理是我們經(jīng)常做的工作,awk所做的工作有些象數(shù)據(jù)庫,但與數(shù)據(jù)庫不同的是,它處理的是文本文件,這些文件沒有專門的存儲格式,普通的人們就能編輯、閱讀、理解和處理它們。而數(shù)據(jù)庫文件往往具有特殊的存儲格式,這使得它們必須用數(shù)據(jù)庫處理程序來處理它們。既然這種類似于數(shù)據(jù)庫的處理工作我們經(jīng)常會遇到,我們就應(yīng)當(dāng)找到處理它們的簡便易行的方法,UNIX有很多這方面的工具,例如sed 、grep、sort以及find等等,awk是其中十分優(yōu)秀的一種。使用awk的第二個理由是awk是一個簡單的工具,當(dāng)然這是相對于其強(qiáng)大的功能來說的。的確,UNIX有許多優(yōu)秀的工具,例如UNIX

5、天然的開發(fā)工具C語言及其延續(xù)C+就非常的優(yōu)秀。但相對于它們來說,awk完成同樣的功能要方便和簡捷得多。這首先是因?yàn)閍wk提供了適應(yīng)多種需要的解決方案:從解決簡單問題的awk命令行到復(fù)雜而精巧的awk程序設(shè)計(jì)語言,這樣做的好處是,你可以不必用復(fù)雜的方法去解決本來很簡單的問題。例如,你可以用一個命令行解決簡單的問題,而C不行,即使一個再簡單的程序,C語言也必須經(jīng)過編寫、編譯的全過程。其次,awk本身是解釋執(zhí)行的,這就使得awk程序不必經(jīng)過編譯的過程,同時,這也使得它與shell script程序能夠很好的契合。最后,awk本身較C語言簡單,雖然awk吸收了C語言很多優(yōu)秀的成分,熟悉C語言會對學(xué)習(xí)a

6、wk有很大的幫助,但awk本身不須要會使用C語言一種功能強(qiáng)大但需要大量時間學(xué)習(xí)才能掌握其技巧的開發(fā)工具。使用awk的第三個理由是awk是一個容易獲得的工具。與C和C+語言不同,awk只有一個文件(/bin/awk),而且?guī)缀趺總€版本的UNIX都提供各自版本的awk,你完全不必費(fèi)心去想如何獲得awk。但C語言卻不是這樣,雖然C語言是UNIX天然的開發(fā)工具,但這個開發(fā)工具卻是單獨(dú)發(fā)行的,換言之,你必須為你的UNIX版本的C語言開發(fā)工具單獨(dú)付費(fèi)(當(dāng)然使用D版者除外),獲得并安裝它,然后你才可以使用它。基于以上理由,再加上awk強(qiáng)大的功能,我們有理由說,如果你要處理與文本樣式掃描相關(guān)的工作,awk應(yīng)該

7、是你的第一選擇。在這里有一個可遵循的一般原則:如果你用普通的shell工具或shell script有困難的話,試試awk,如果awk仍不能解決問題,則便用C語言,如果C語言仍然失敗,則移至C+。awk的調(diào)用方式前面曾經(jīng)說過,awk提供了適應(yīng)多種需要的不同解決方案,它們是:一、awk命令行,你可以象使用普通UNIX命令一樣使用awk,在命令行中你也可以使用awk程序設(shè)計(jì)語言,雖然awk支持多行的錄入,但是錄入長長的命令行并保證其正確無誤卻是一件令人頭疼的事,因此,這種方法一般只用于解決簡單的問題。當(dāng)然,你也可以在shell script程序中引用awk命令行甚至awk程序腳本。二、使用-f選項(xiàng)

8、調(diào)用awk程序。awk允許將一段awk程序?qū)懭胍粋€文本文件,然后在awk命令行中用-f選項(xiàng)調(diào)用并執(zhí)行這段程序。具體的方法我們將在后面的awk語法中講到。三、利用命令解釋器調(diào)用awk程序:利用UNIX支持的命令解釋器功能,我們可以將一段awk程序?qū)懭胛谋疚募?,然后在它的第一行加?#!/bin/awk -f并賦予這個文本文件以執(zhí)行的權(quán)限。這樣做之后,你就可以在命令行中用類似于下面這樣的方式調(diào)用并執(zhí)行這段awk程序了。$awk腳本文本名 待處理文件awk的語法: 與其它UNIX命令一樣,awk擁有自己的語法:awk -F re parameter. 'prog' -f progfi

9、lein_file. 參數(shù)說明:-F re:允許awk更改其字段分隔符。parameter: 該參數(shù)幫助為不同的變量賦值。'prog': awk的程序語句段。這個語句段必須用單拓號:'和'括起,以防被shell解釋。這個程序語句段的標(biāo)準(zhǔn)形式為:'pattern action'其中pattern參數(shù)可以是egrep正則表達(dá)式中的任何一個,它可以使用語法/re/再加上一些樣式匹配技巧構(gòu)成。與sed類似,你也可以使用","分開兩樣式以選擇某個范圍。關(guān)于匹配的細(xì)節(jié),你可以參考附錄,如果仍不懂的話,找本UNIX書學(xué)學(xué)grep和sed(本

10、人是在學(xué)習(xí)ed時掌握匹配技術(shù)的)。action參數(shù)總是被大括號包圍,它由一系統(tǒng)awk語句組成,各語句之間用""分隔。awk解釋它們,并在pattern給定的樣式匹配的記錄上執(zhí)行其操作。與shell類似,你也可以使用“#”作為注釋符,它使“#”到行尾的內(nèi)容成為注釋,在解釋執(zhí)行時,它們將被忽略。你可以省略pattern和action之一,但不能兩者同時省略,當(dāng)省略pattern時沒有樣式匹配,表示對所有行(記錄)均執(zhí)行操作,省略action時執(zhí)行缺省的操作在標(biāo)準(zhǔn)輸出上顯示。 -f progfile:允許awk調(diào)用并執(zhí)行progfile指定有程序文件。progfile是一個文本文

11、件,他必須符合awk的語法。 in_file:awk的輸入文件,awk允許對多個輸入文件進(jìn)行處理。值得注意的是awk不修改輸入文件。如果未指定輸入文件,awk將接受標(biāo)準(zhǔn)輸入,并將結(jié)果顯示在標(biāo)準(zhǔn)輸出上。awk支持輸入輸出重定向。 awk的記錄、字段與內(nèi)置變量:前面說過,awk處理的工作與數(shù)據(jù)庫的處理方式有相同之處,其相同處之一就是awk支持對記錄和字段的處理,其中對字段的處理是grep和sed不能實(shí)現(xiàn)的,這也是awk優(yōu)于二者的原因之一。在awk中,缺省的情況下總是將文本文件中的一行視為一個記錄,而將一行中的某一部分作為記錄中的一個字段。為了操作這些不同的字段,awk借用shell的方法,用$1,

12、$2,$3.這樣的方式來順序地表示行(記錄)中的不同字段。特殊地,awk用$0表示整個行(記錄)。不同的字段之間是用稱作分隔符的字符分隔開的。系統(tǒng)默認(rèn)的分隔符是空格。awk允許在命令行中用-F re的形式來改變這個分隔符。事實(shí)上,awk用一個內(nèi)置的變量FS來記憶這個分隔符。awk中有好幾個這樣的內(nèi)置變量,例如,記錄分隔符變量RS、當(dāng)前工作的記錄數(shù)NR等等,本文后面的附表列出了全部的內(nèi)置變量。這些內(nèi)置的變量可以在awk程序中引用或修改,例如,你可以利用NR變量在模式匹配中指定工作范圍,也可以通過修改記錄分隔符RS讓一個特殊字符而不是換行符作為記錄的分隔符。例:顯示文本文件myfile中第七行到第

13、十五行中以字符%分隔的第一字段,第三字段和第七字段:awk -F % 'NR=7,NR=15 printf $1 $3 $7' awk的內(nèi)置函數(shù)awk之所以成為一種優(yōu)秀的程序設(shè)計(jì)語言的原因之一是它吸收了某些優(yōu)秀的程序設(shè)計(jì)語言(例如C)語言的許多優(yōu)點(diǎn)。這些優(yōu)點(diǎn)之一就是內(nèi)置函數(shù)的使用,awk定義并支持了一系列的內(nèi)置函數(shù),由于這些函數(shù)的使用,使得awk提供的功能更為完善和強(qiáng)大,例如,awk使用了一系列的字符串處理內(nèi)置函數(shù)(這些函數(shù)看起來與C語言的字符串處理函數(shù)相似,其使用方式與C語言中的函數(shù)也相差無幾),正是由于這些內(nèi)置函數(shù)的使用,使awk處理字符串的功能更加強(qiáng)大。本文后面的附錄中列

14、有一般的awk所提供的內(nèi)置函數(shù),這些內(nèi)置函數(shù)也許與你的awk版本有些出入,因此,在使用之前,最好參考一下你的系統(tǒng)中的聯(lián)機(jī)幫助。作為內(nèi)置函數(shù)的一個例子,我們將在這里介紹awk的printf函數(shù),這個函數(shù)使得awk與c語言的輸出相一致。實(shí)際上,awk中有許多引用形式都是從C語言借用過來的。如果你熟悉C語言,你也許會記得其中的printf函數(shù),它提供的強(qiáng)大格式輸出功能曾經(jīng)帶我們許多的方便。幸運(yùn)的是,我們在awk中又和它重逢了。awk中printf幾乎與C語言中一模一樣,如果你熟悉C語言的話,你完全可以照C語言的模式使用awk中的printf。因此在這里,我們只給出一個例子,如果你不熟悉的話,請隨便找

15、一本C語言的入門書翻翻。例:顯示文件myfile中的行號和第3字段:$awk 'printf"%03d%s ",NR,$1' myfile在命令行使用awk按照順序,我們應(yīng)當(dāng)講解awk程序設(shè)計(jì)的內(nèi)容了,但在講解之前,我們將用一些例子來對前面的知識進(jìn)行回顧,這些例子都是在命令行中使用的,由此我們可以知道在命令行中使用awk是多么的方便。這樣做的原因一方面是為下面的內(nèi)容作鋪墊,另一方面是介紹一些解決簡單問題的方法,我們完全沒有必要用復(fù)雜的方法來解決簡單的問題-既然awk提供了較為簡單的方法的話。例:顯示文本文件mydoc匹配(含有)字符串"sun&qu

16、ot;的所有行。$awk '/sun/print' mydoc 由于顯示整個記錄(全行)是awk的缺省動作,因此可以省略action項(xiàng)。$awk '/sun/' mydoc 例:下面是一個較為復(fù)雜的匹配的示例:$awk '/Ssun/,/Mmoon/ print' myfile它將顯示第一個匹配Sun或sun的行與第一個匹配Moon或moon的行之間的行,并顯示到標(biāo)準(zhǔn)輸出上。 例:下面的示例顯示了內(nèi)置變量和內(nèi)置函數(shù)length()的使用:$awk 'length($0)>80 print NR' myfile 該命令行將顯示

17、文本myfile中所有超過80個字符的行號,在這里,用$0表示整個記錄(行),同時,內(nèi)置變量NR不使用標(biāo)志符'$'。 例:作為一個較為實(shí)際的例子,我們假設(shè)要對UNIX中的用戶進(jìn)行安全性檢查,方法是考察/etc下的passwd文件,檢查其中的passwd字段(第二字段)是否為"*",如不為"*",則表示該用戶沒有設(shè)置密碼,顯示出這些用戶名(第一字段)。我們可以用如下語句實(shí)現(xiàn):#awk -F: '$2="" printf("%s no password! ",$1' /etc/passw

18、d在這個示例中,passwd文件的字段分隔符是“:”,因此,必須用-F:來更改默認(rèn)的字段分隔符,這個示例中也涉及到了內(nèi)置函數(shù)printf的使用。 awk的變量如同其它程序設(shè)計(jì)語言一樣,awk允許在程序語言中設(shè)置變量,事實(shí)上,提供變量的功能是程序設(shè)計(jì)語言的其本要求,不提供變量的程序設(shè)計(jì)語言本人還從未見過。awk提供兩種變量,一種是awk內(nèi)置的變量,這前面我們已經(jīng)講過,需要著重指出的是,與后面提到的其它變量不同的是,在awk程序中引用內(nèi)置變量不需要使用標(biāo)志符"$"(回憶一下前面講過的NR的使用)。awk提供的另一種變量是自定義變量。awk允許用戶在awk程序語句中定義并調(diào)用自已

19、的變量。當(dāng)然這種變量不能與內(nèi)置變量及其它awk保留字相同,在awk中引用自定義變量必須在它前面加上標(biāo)志符"$"。與C語言不同的是,awk中不需要對變量進(jìn)行初始化,awk根據(jù)其在awk中第一次出現(xiàn)的形式和上下文確定其具體的數(shù)據(jù)類型。當(dāng)變量類型不確定時,awk默認(rèn)其為字符串類型。這里有一個技巧:如果你要讓你的awk程序知道你所使用的變量的明確類型,你應(yīng)當(dāng)在在程序中給它賦初值。在后面的實(shí)例中,我們將用到這一技巧。 運(yùn)算與判斷:作為一種程序設(shè)計(jì)語言所應(yīng)具有的特點(diǎn)之一,awk支持多種運(yùn)算,這些運(yùn)算與C語言提供的幾本相同:如+、-、*、/、%等等,同時,awk也支持C語言中類似+、-、

20、+=、-=、=+、=-之類的功能,這給熟悉C語言的使用者編寫awk程序帶來了極大的方便。作為對運(yùn)算功能的一種擴(kuò)展,awk還提供了一系列內(nèi)置的運(yùn)算函數(shù)(如log、sqr、cos、sin等等)和一些用于對字符串進(jìn)行操作(運(yùn)算)的函數(shù)(如length、substr等等)。這些函數(shù)的引用大大的提高了awk的運(yùn)算功能。 作為對條件轉(zhuǎn)移指令的一部分,關(guān)系判斷是每種程序設(shè)計(jì)語言都具備的功能,awk也不例外。awk中允許進(jìn)行多種測試,如常用的=(等于)、!=(不等于)、>(大于)、<(小于)、>=(大于等于)、>=(小于等于)等等,同時,作為樣式匹配,還提供了(匹配于)和?。ú黄ヅ溆冢?/p>

21、判斷。作為對測試的一種擴(kuò)充,awk也支持用邏輯運(yùn)算符:!(非)、&&(與)、|(或)和括號()進(jìn)行多重判斷,這大大增強(qiáng)了awk的功能。本文的附錄中列出了awk所允許的運(yùn)算、判斷以及操作符的優(yōu)先級。awk的流程控制流程控制語句是任何程序設(shè)計(jì)語言都不能缺少的部分。任何好的語言都有一些執(zhí)行流程控制的語句。awk提供的完備的流程控制語句類似于C語言,這給我們編程帶來了極大的方便。1、BEGIN和END:在awk中兩個特別的表達(dá)式,BEGIN和END,這兩者都可用于pattern中(參考前面的awk語法),提供BEGIN和END的作用是給程序賦予初始狀態(tài)和在程序結(jié)束之后執(zhí)行一些掃尾的工作

22、。任何在BEGIN之后列出的操作(在內(nèi))將在awk開始掃描輸入之前執(zhí)行,而END之后列出的操作將在掃描完全部的輸入之后執(zhí)行。因此,通常使用BEGIN來顯示變量和預(yù)置(初始化)變量,使用END來輸出最終結(jié)果。例:累計(jì)銷售文件xs中的銷售金額(假設(shè)銷售金額在記錄的第三字段):$awk>'BEGIN FS=":"print "統(tǒng)計(jì)銷售金額"total=0>print $3;total=total+$3;>END printf "銷售金額總計(jì):%.2f",total' sx(注:>是shell提供的第二

23、提示符,如要在shell程序awk語句和awk語言中換行,則需在行尾加反斜杠)在這里,BEGIN預(yù)置了內(nèi)部變量FS(字段分隔符)和自定義變量total,同時在掃描之前顯示出輸出行頭。而END則在掃描完成后打印出總合計(jì)。2、流程控制語句awk提供了完備的流程控制語句,其用法與C語言類似。下面我們一一加以說明:2.1、if.else語句:格式:if(表達(dá)式)語句1else語句2格式中"語句1"可以是多個語句,如果你為了方便awk判斷也方便你自已閱讀,你最好將多個語句用括起來。awk分枝結(jié)構(gòu)允許嵌套,其格式為:if(表達(dá)式1)if(表達(dá)式2)語句1else語句2語句3else i

24、f(表達(dá)式3)語句4else語句5語句6當(dāng)然實(shí)際操作過程中你可能不會用到如此復(fù)雜的分枝結(jié)構(gòu),這里只是為了給出其樣式罷了。2.2、while語句格式為:while(表達(dá)式)語句2.3、do-while語句格式為:do語句while(條件判斷語句)2.4、for語句格式為:for(初始表達(dá)式;終止條件;步長表達(dá)式)語句在awk的 while、do-while和for語句中允許使用break,continue語句來控制流程走向,也允許使用exit這樣的語句來退出。break中斷當(dāng)前正在執(zhí)行的循環(huán)并跳到循環(huán)外執(zhí)行下一條語句。continue從當(dāng)前位置跳到循環(huán)開始處執(zhí)行。對于exit的執(zhí)行有兩種情況:當(dāng)

25、exit語句不在END中時,任何操作中的exit命令表現(xiàn)得如同到了文件尾,所有模式或操作執(zhí)行將停止,END模式中的操作被執(zhí)行。而出現(xiàn)在END中的exit將導(dǎo)致程序終止。例:為了 awk中的自定義函數(shù)定義和調(diào)用用戶自己的函數(shù)是幾乎每個高級語言都具有的功能,awk也不例外,但原始的awk并不提供函數(shù)功能,只有在nawk或較新的awk版本中才可以增加函數(shù)。函數(shù)的使用包含兩部分:函數(shù)的定義與函數(shù)調(diào)用。其中函數(shù)定義又包括要執(zhí)行的代碼(函數(shù)本身)和從主程序代碼傳遞到該函數(shù)的臨時調(diào)用。 awk函數(shù)的定義方法如下: function 函數(shù)名(參數(shù)表)函數(shù)體在gawk中允許將function省略為func,但其

26、它版本的awk不允許。函數(shù)名必須是一個合法的標(biāo)志符,參數(shù)表中可以不提供參數(shù)(但在調(diào)用函數(shù)時函數(shù)名后的一對括號仍然是不可缺少的),也可以提供一個或多個參數(shù)。與C語言相似,awk的參數(shù)也是通過值來傳遞的。在awk中調(diào)用函數(shù)比較簡單,其方法與C語言相似,但awk比C語言更為靈活,它不執(zhí)行參數(shù)有效性檢查。換句話說,在你調(diào)用函數(shù)時,可以列出比函數(shù)預(yù)計(jì)(函數(shù)定義中規(guī)定)的多或少的參數(shù),多余的參數(shù)會被awk所忽略,而不足的參數(shù),awk將它們置為缺省值0或空字符串,具體置為何值,將取決于參數(shù)的使用方式。awk函數(shù)有兩種返回方式:隱式返回和顯式返回。當(dāng)awk執(zhí)行到函數(shù)的結(jié)尾時,它自動地返回到調(diào)用程序,這是函數(shù)是

27、隱式返回的。如果需要在結(jié)束之前退出函數(shù),可以明確地使用返回語句提前退出。方法是在函數(shù)中使用形如:return 返回值 格式的語句。 例:下面的例子演示了函數(shù)的使用。在這個示例中,定義了一個名為print_header的函數(shù),該函數(shù)調(diào)用了兩個參數(shù)FileName和PageNum,F(xiàn)ileName參數(shù)傳給函數(shù)當(dāng)前使用的文件名,PageNum參數(shù)是當(dāng)前頁的頁號。這個函數(shù)的功能是打印(顯示)出當(dāng)前文件的文件名,和當(dāng)前頁的頁號。完成這個功能后,這個函數(shù)將返回下一頁的頁號。nawk >'BEGINpageno=1;file=FILENAME >pageno=print_header(f

28、ile,pageno);#調(diào)用函數(shù)print_header>printf("當(dāng)前頁頁號是:%d ",pageno);>>#定義函數(shù)print_header>function print_header(FileName,PageNum)>printf("%s %d ",FileName,PageNum); >PageNum+;return PageNUm; >>' myfile 執(zhí)行這個程序?qū)@示如下內(nèi)容:myfile 1當(dāng)前頁頁號是:2awk高級輸入輸出1.讀取下一條記錄:awk的next語句導(dǎo)致a

29、wk讀取下一個記錄并完成模式匹配,然后立即執(zhí)行相應(yīng)的操作。通常它用匹配的模式執(zhí)行操作中的代碼。next導(dǎo)致這個記錄的任何額外匹配模式被忽略。2.簡單地讀取一條記錄awk的 getline語句用于簡單地讀取一條記錄。如果用戶有一個數(shù)據(jù)記錄類似兩個物理記錄,那么getline將尤其有用。它完成一般字段的分離(設(shè)置字段變量$0 FNR NF NR)。如果成功則返回1,失敗則返回0(到達(dá)文件尾)。如果需簡單地讀取一個文件,則可以編寫以下代碼:例:示例getline的使用while(getline=1)#process the inputted fields也可以使getline保存輸入數(shù)據(jù)在一個字段中

30、,而不是通過使用getline variable的形式處理一般字段。當(dāng)使用這種方式時,NF被置成0,F(xiàn)NR和NR被增值。用戶也可以使用getline<"filename"方式從一個給定的文件中輸入數(shù)據(jù),而不是從命令行所列內(nèi)容輸入數(shù)據(jù)。此時,getline將完成一般字段分離(設(shè)置字段變量$0和NF)。如果文件不存在,返回-1,成功,返回1,返回0表示失敗。用戶可以從給定文件中讀取數(shù)據(jù)到一個變量中,也可以用stdin(標(biāo)準(zhǔn)輸入設(shè)備)或一個包含這個文件名的變量代替filename。值得注意的是當(dāng)使用這種方式時不修改FNR和NR。另一種使用getline語句的方法是從UNIX

31、命令接受輸入,例如下面的例子:例:示例從UNIX命令接受輸入while("who -u"|getline)#process each line from the who command當(dāng)然,也可以使用如下形式:"command" | getline variable3.關(guān)閉文件:awk中允許在程序中關(guān)閉一個輸入或輸出文件,方法是使用awk的close語句。close("filename")filename可以是getline打開的文件(也可以是stdin,包含文件名的變量或者getline使用的確切命令)?;蛞粋€輸出文件(可以是std

32、out,包含文件名的變量或使用管道的確切命令)。4.輸出到一個文件:awk中允許用如下方式將結(jié)果輸出到一個文件:printf("hello word! ")>"datafile"或printf("hello word! ")>>"datafile"5.輸出到一個命令awk中允許用如下方式將結(jié)果輸出到一個命令:printf("hello word! ")|"sort-t','" awk與shell script混合編程因?yàn)閍wk可以作為一個sh

33、ell命令使用,因此awk能與shell批處理程序很好的融合在一起,這給實(shí)現(xiàn)awk與shell程序的混合編程提供了可能。實(shí)現(xiàn)混合編程的關(guān)鍵是awk與shell script之間的對話,換言之,就是awk與shell script之間的信息交流:awk從shell script中獲取所需的信息(通常是變量的值)、在awk中執(zhí)行shell命令行、shell script將命令執(zhí)行的結(jié)果送給awk處理以及shell script讀取awk的執(zhí)行結(jié)果等等。1.awk讀取Shell script程序變量在awk中我們可以通過“'$變量名'”的方式讀取sell scrpit程序中的變量。例

34、:在下面的示例中,我們將讀取sell scrpit程序中的變量Name,該變量存放的是文本myfile的撰寫者,awk將打印出這個人名。$cat writename:# (#)#.Name="張三" nawk 'BEGIN name="'Name'" printf(" %s 撰寫者%s ",FILENAME,name");.END.' myfile.2.將shell命令的執(zhí)行結(jié)果送給awk處理作為信息傳送的一種方法,我們可以將一條shell命令的結(jié)果通過管道線(|)傳遞給awk處理:例:示例a

35、wk處理shell命令的執(zhí)行結(jié)果$who -u | awk 'printf("%s正在執(zhí)行%s ",$2,$1)'該命令將打印出注冊終端正在執(zhí)行的程序名。3.shell script程序讀awk的執(zhí)行結(jié)果為了實(shí)現(xiàn)shell script程序讀取awk執(zhí)行的結(jié)果,我們可以采取一些特殊的方法,例如我們可以用變量名=awk語句的形式將awk執(zhí)行的結(jié)果存放入一個shell script變量。當(dāng)然也可以用管道線的方法將awk執(zhí)行結(jié)果傳遞給shell script程序處理。 例:作為傳送消息的機(jī)制之一,UNIX提供了一個向其所有用戶傳送消息的命令wall(意思是writ

36、e to all寫給所有用戶),該命令允許向所有工作中的用戶(終端)發(fā)送消息。為此,我們可以通過一段shell批處理程序wall.shell來模擬這一程序(事實(shí)上比較老的版本中wall就是一段shell批處理程序:$cat wall.shell:# (#) wall.shell:發(fā)送消息給每個已注冊終端#cat >/tmp/$#用戶錄入消息文本 who -u | awk 'print $2' | while read ttydocat /tmp/$>$ttydone在這個程序里,awk接受who -u命令的執(zhí)行結(jié)果,該命令打印出所有已注冊終端的信息,其中第二個字段是

37、已注冊終端的設(shè)備名,因此用awk命令析出該設(shè)備名,然后用while read tty語句循環(huán)讀出這些文件名到變量(shell script變量)tty中,作為信息傳送的終結(jié)地址。4.在awk中執(zhí)行shell命令行-嵌入函數(shù)system()system()是一個不適合字符或數(shù)字類型的嵌入函數(shù),該函數(shù)的功能是處理作為參數(shù)傳遞給它的字符串。system對這個參數(shù)的處理就是將其作為命令處理,也就是說將其當(dāng)作命令行一樣加以執(zhí)行。這使得用戶在自己的awk程序需要時可以靈活地執(zhí)行命令或腳本。例:下面的程序?qū)⑹褂胹ystem嵌入函數(shù)打印用戶編制好的報(bào)表文件,這個文件存放在名為myreport.txt的文件中。

38、為簡約起見,我們只列出了其END部分:.END close("myreport.txt");system("lp myreport.txt"); 在這個示例中,我們首先使用close語句關(guān)閉了文件myreport.txt文件,然后使用system嵌入函數(shù)將myreport.txt送入打印機(jī)打印。寫到這里,我不得不跟朋友們說再見了,實(shí)在地說,這些內(nèi)容仍然是awk的初步知識,電腦永遠(yuǎn)是前進(jìn)的科學(xué),awk也不例外,本篇所能做的只是在你前行的漫漫長途中鋪平一段小小開端,剩下的路還得靠你自己去走。老實(shí)說,如果本文真能給你前行的路上帶來些許的方便,那本人就知足了!如

39、對本篇有任何疑問,請E-mail To:Chizlong或到主頁中留言。附錄:1.awk的常規(guī)表達(dá)式元字符換碼序列 在字符串的開頭開始匹配$ 在字符串的結(jié)尾開始匹配. 與任何單個字符串匹配ABC 與內(nèi)的任一字符匹配A-Ca-c 與A-C及a-c范圍內(nèi)的字符匹配(按字母表順序)ABC 與除內(nèi)的所有字符以外的任一字符匹配Desk|Chair 與Desk和Chair中的任一個匹配ABCDEF 關(guān)聯(lián)。與A、B、C中的任一字符匹配,且其后要跟D、E、F中的任一個字符。* 與A、B或C中任一個出現(xiàn)0次或多次的字符相匹配 + 與A、B或C中任何一個出現(xiàn)1次或多次的字符相匹配? 與一個空串或A、B或C在任何一

40、個字符相匹配(Blue|Black)berry 合并常規(guī)表達(dá)式,與Blueberry或Blackberry相匹配 2.awk算術(shù)運(yùn)算符運(yùn)算符 用途-xy x的y次冪x*y 同上x%y 計(jì)算x/y的余數(shù)(求模)x+y x加yx-y x減yx*y x乘yx/y x除y-y 負(fù)y(y的開關(guān)符號);也稱一目減+y y加1后使用y(前置加)y+ 使用y值后加1(后綴加)-y y減1后使用y(前置減)y- 使用后y減1(后綴減)x=y 將y的值賦給xx+=y 將x+y的值賦給xx-=y 將x-y的值賦給xx*=y 將x*y的值賦給xx/=y 將x/y的值賦給x x%=y 將x%y的值賦給xx=y 將xy的值賦給xx*=y 將x*y的值賦給x3.awk允許的測試:操作符 含義x=y x等于yx!=y x不等于yx>y x大于yx>=y x大于或等于yx<y x小于yx<=y x小于或等于y?xre x匹配正則表達(dá)式re?x!re x不匹配正則表達(dá)式re? 4.awk的操作符(按優(yōu)先級升序排列)= 、+=、 -=、 *= 、/= 、 %=|&&> >= < <=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論