變量 | 描述 |
---|---|
\$n | 當前記錄的第n個字段,字段間由FS分隔 |
\$0 | 完整的輸入記錄 |
ARGC | 命令行參數(shù)的數(shù)目 |
ARGIND | 命令行中當前文件的位置(從0開始算) |
ARGV | 包含命令行參數(shù)的數(shù)組 |
CONVFMT | 數(shù)字轉換格式(默認值為%.6g)ENVIRON環(huán)境變量關聯(lián)數(shù)組 |
ERRNO | 最后一個系統(tǒng)錯誤的描述 |
FIELDWIDTHS | 字段寬度列表(用空格鍵分隔) |
FILENAME | 當前文件名 |
FNR | 各文件分別計數(shù)的行號 |
FS | 字段分隔符(默認是任何空格) |
IGNORECASE | 如果為真,則進行忽略大小寫的匹配 |
NF | 一條記錄的字段的數(shù)目 |
NR | 已經讀出的記錄數(shù),就是行號,從1開始 |
OFMT | 數(shù)字的輸出格式(默認值是%.6g) |
OFS | 輸出記錄分隔符(輸出換行符),輸出時用指定的符號代替換行符 |
ORS | 輸出記錄分隔符(默認值是一個換行符) |
RLENGTH | 由match函數(shù)所匹配的字符串的長度 |
RS | 記錄分隔符(默認是一個換行符) |
RSTART | 由match函數(shù)所匹配的字符串的第一個位置 |
SUBSEP | 數(shù)組下標分隔符(默認值是/034) |
示例
[root@localhost ~]# echo -e "line1 f2 f3\nline2 f4 f5\nline3 f6 f7" | awk '{print "Line No:"NR", No of fields:"NF, "$0="$0, "$1="$1, "$2="$2, "$3="$3}' Line No:1, No of fields:3 $0=line1 f2 f3 $1=line1 $2=f2 $3=f3 Line No:2, No of fields:3 $0=line2 f4 f5 $1=line2 $2=f4 $3=f5 Line No:3, No of fields:3 $0=line3 f6 f7 $1=line3 $2=f6 $3=f7
使用print $NF可以打印出一行中的最后一個字段,使用$(NF-1)則是打印倒數(shù)第二個字段,其他以此類推:
[root@localhost ~]# echo -e "line1 f2 f3\n line2 f4 f5" | awk '{print $NF}' f3 f5 [root@localhost ~]# echo -e "line1 f2 f3\n line2 f4 f5" | awk '{print $(NF-1)}' f2 f4
統(tǒng)計/etc/passwd:文件名,每行的行號,每行的列數(shù),對應的完整行內容:
[root@localhost ~]# awk -F ':' '{print "filename:" FILENAME ",linenumber:" NR ",columns:" NF ",linecontent:"$0}' /etc/passwd filename:/etc/passwd,linenumber:1,columns:7,linecontent:root:x:0:0:root:/root:/bin/bash filename:/etc/passwd,linenumber:2,columns:7,linecontent:bin:x:1:1:bin:/bin:/sbin/nologin filename:/etc/passwd,linenumber:3,columns:7,linecontent:daemon:x:2:2:daemon:/sbin:/sbin/nologin
統(tǒng)計/etc/passwd文件中的命令行參數(shù)ARGC,文件行號FNR,字段分隔符FS,一條記錄的字段數(shù)目NF,已經讀出的記錄數(shù)(默認是行號)NR
[root@localhost ~]# awk -F: 'BEGIN{printf "%4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR}' /etc/passwd FILENAME ARGC FNR FS NF NR --------------------------------------------- /etc/passwd 2 1 : 7 1 /etc/passwd 2 2 : 7 2 /etc/passwd 2 3 : 7 3
1.awk賦值運算
賦值語句運算符:= += -= *= /= %= ^= **=
例如:a+=5;等價于a=a+5
[root@localhost ~]# awk 'BEGIN{a=5;a+=5;print a}' 10
2.awk正則運算
輸出包含有root的行,并打印用戶名和UID及原行內容
[root@localhost ~]# awk -F: '/root/ {print $1,$3,$0}' /etc/passwd root 0 root:x:0:0:root:/root:/bin/bash operator 11 operator:x:11:0:operator:/root:/sbin/nologin
我們發(fā)現(xiàn)找到了兩行,如果我們想找root開頭的行就要這樣寫:awk -F: '/^root/' /etc/passwd
3.awk三目運算
[root@localhost ~]# awk 'BEGIN{a="b";print a=="b"?"ok":"err"}' ok [root@localhost ~]# awk 'BEGIN{a="b";print a=="c"?"ok":"err"}' err
三目運算其實就是一個判斷運算,如果為真則輸出?后的內容,如果為假則輸出:后的內容
4.awk的循環(huán)運用
if語句運用
[root@localhost ~]# awk 'BEGIN{ test=100;if(test>90){ print "vear good";} else{print "no pass";}}' vear good
每條命令后用;結尾
while循環(huán)運用
計算從1累加到100的值
[root@localhost ~]# awk 'BEGIN{test=100;num=0;while(i<=test){num+=i; i++;}print num;}' 5050 for循環(huán)的運用 [root@localhost ~]# awk 'BEGIN{test=0;for(i=0;i<=100;i++){test+=i;}print test;}' 5050 do循環(huán)的運用 [root@localhost ~]# awk 'BEGIN{test=0;i=0;do{test+=i;i++}while(i<=100)print test;}' 5050
5.awk的數(shù)組運用
數(shù)組是awk的靈魂,處理文本中最不能少的就是它的數(shù)組處理。因為數(shù)組索引(下標)可以是數(shù)字和字符串在awk中數(shù)組叫做關聯(lián)數(shù)組(associative arrays)。awk 中的數(shù)組不必提前聲明,也不必聲明大小。數(shù)組元素用0或空字符串來初始化,這根據(jù)上下文而定。一般而言,awk中的數(shù)組用來從記錄中收集信息,可以用于計算總和、統(tǒng)計單詞以及跟蹤模板被匹配的次數(shù)等等。
顯示/etc/passwd的賬戶
awk -F: 'BEGIN {count=0;} {name[count] = $1;count++;}; END{for (i = 0; i < NR; i++) print i, name[i]}' /etc/passwd 0 root 1 bin 2 daemon 3 adm 4 lp 5 sync ........................................................................
6.awk字符串函數(shù)的運用
函數(shù)名 描述
sub 匹配記錄中最大、最靠左邊的子字符串的正則表達式,并用替換字符串替換這些字符串。如果沒有指定目標字符串就默認使用整個記錄。替換只發(fā)生在第一次匹配的 時候
sub (regular expression, substitution string):
sub (regular expression, substitution string, target string)
實例:
awk '{ sub(/test/, "mytest"); print }' testfile awk '{ sub(/test/, "mytest"); $1}; print }' testfile
第一個例子在整個記錄中匹配,替換只發(fā)生在第一次匹配發(fā)生的時候。如要在整個文件中進行匹配需要用到gsub
第二個例子在整個記錄的第一個域中進行匹配,替換只發(fā)生在第一次匹配發(fā)生的時候。
gsub 整個文檔中進行匹配
gsub (regular expression, substitution string)
gsub (regular expression, substitution string, target string)
實例:
awk '{ gsub(/test/, "mytest"); print }' testfile awk '{ gsub(/test/, "mytest" , $1) }; print }' testfile
第一個例子在整個文檔中匹配test,匹配的都被替換成mytest。
第二個例子在整個文檔的第一個域中匹配,所有匹配的都被替換成mytest。
index 返回子字符串第一次被匹配的位置,偏移量從位置1開始
index(string, substring)
實例:
awk '{ print index("test", "mytest") }' testfile
實例返回test在mytest的位置,結果應該是3。
substr 返回從位置1開始的子字符串,如果指定長度超過實際長度,就返回整個字符串
substr( string, starting position )
substr( string, starting position, length of string )
實例:
awk '{ print substr( "hello world", 7,11 ) }'
上例截取了world子字符串。
split 可按給定的分隔符把字符串分割為一個數(shù)組。如果分隔符沒提供,則按當前FS值進行分割
split( string, array, field separator )
split( string, array )
實例:
awk '{ split( "20:18:00", time, ":" ); print time[2] }'
上例把時間按冒號分割到time數(shù)組內,并顯示第二個數(shù)組元素18。
length 返回記錄的字符數(shù)
length( string )
length
實例:
awk '{ print length( "test" ) }' awk '{ print length }' testfile
第一個實例返回test字符串的長度。
第二個實例返回testfile文件中第條記錄的字符數(shù)。
match 返回在字符串中正則表達式位置的索引,如果找不到指定的正則表達式則返回0。match函數(shù)會設置內建變量RSTART為字符串中子字符串的開始位 置,RLENGTH為到子字符串末尾的字符個數(shù)。substr可利于這些變量來截取字符串
match( string, regular expression )
實例:
awk '{start=match("this is a test",/[a-z]+$/); print start}' awk '{start=match("this is a test",/[a-z]+$/); print start, RSTART, RLENGTH }'
第一個實例打印以連續(xù)小寫字符結尾的開始位置,這里是11。
第二個實例還打印RSTART和RLENGTH變量,這里是11(start),11(RSTART),4(RLENGTH)。
toupper和tolower 可用于字符串大小間的轉換,該功能只在gawk中有效
toupper( string )
tolower( string )
實例:
awk '{ print toupper("test"), tolower("TEST") }'