linux 文本处理工具之一grep命令详解

2016-03-31 16:10 19 1 收藏

有了下面这个linux 文本处理工具之一grep命令详解教程,不懂linux 文本处理工具之一grep命令详解的也能装懂了,赶紧get起来装逼一下吧!

【 tulaoshi.com - 服务器 】

linux 文本处理工具之一grep命令详解

grep(Globel Search Regular Expression and Printing out the line)全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,是一个对行进行操作的搜索工作,它能使用正则表达式搜索文本,并把匹配的行打印 出来。Unix的grep家族包括grep、egrep和fgrep。 egrep表示扩展的grep,相比grep支持更多的元字符,"grep -E"相当于egrep。fgrep是fast grep,不支持元字符,但是搜索速度更快。grep搜索的结果被送到屏幕,不影响原文件内容。

1、grep的语法[]  (man grep查看grep的帮助文档)

    grep    [options]    'pattern'     FILE
    命令      选项         模式        文件

grep不加引号直接过滤字符串;grep在进行模式匹配的时候必须加引号,单引和双引号都可以;grep在引用变量的时候必须加双引号

2、grep的选项[option]

  -r:递归的搜索
  -v:反向选取,只显示不符合模式的行
  -o:只显示被模式匹配到的字符串,而不是整个行
  -i:匹配时不区分大小写
  -A #:显示匹配到的行时,顺便显示后面的#行(#表示数值)
  -B #:前面的#行
  -C #:前后的#行
  -E:使用扩展的正则表达式

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/fuwuqi/)

eg:grep选项的例子

 

复制代码代码如下:
cat eg1.text EOF
This is first
how are you
How old are you
fine,thanks
what,so what
What is your name
EOF
grep "you" eg1.text
grep -o "you" eg1.text
grep -v "you" eg1.text
grep -i "what" eg1.text
grep -A 1 "fine" eg1.text
grep -B 1 "fine" eg1.text
grep -C 1 "fine" eg1.text

以上代码直接粘贴复制在linux上可直接运行,代码解释运行效果,如下

01.png

3、  正则表达式(man regex)是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串,通常被用来检索或替换那些符合某个
模式的文本内容。正则表达式分为:基本正则表达式和扩展正则表达式。
  元字符就是指那些在正则表达式中具有特殊意义的专用字符。

grep支持基本正则表达式的元字符:

     ^:锚点行首的符合条件的内容,用法格式"^pattern"
     $:锚点行首的符合条件的内容,用法格式"pattern$"
    ^$:匹配空白行
     .:匹配任意单个字符
     *:匹配紧挨在前面的字符任意次(0,1,多次)
    .*:匹配任意长度的任意字符
    ?:匹配紧挨在前面的字符0次或1次
{m,n}:匹配其前面的字符至少m次,至多n次
{m,}:匹配其前面的字符至少m次
 {m}:精确匹配前面的m次
{0,n}:0到n次
     :锚点词首----相当于b,用法格式:pattern
     :锚点词尾,用法格式:pattern
pattern:单词锚点
   ():分组,用法格式:(pattern),引用第一个小括号的分组1,第二个是2,以此类推
     []:匹配指定范围内的任意单个字符
    [^]:匹配指定范围外的任意单个字符

eg:基本正则表达的例子

(1)、显示/proc/meminfo文件中以不区分大小的s开头的行;

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/fuwuqi/)

grep "^[sS]" /proc/meminfo

(2)、显示/etc/passwd中以nologin结尾的行;

grep "nologin$" /etc/passwd

(3)、显示/etc/inittab中空格开头的行;

grep "^$" /etc/inittab

(4)、显示/etc/passwd中,以r开头的字符而后跟了任意单个字符的行;

grep --color "^r." /etc/passwd

(5)、显示/etc/passwd中,以r开头后跟了o,o出现任意次的行;

grep --color "^ro*" /etc/passwd

(6)、显示/etc/passwd文件中,r后跟了任意长度任意字符后跟了h的行;

grep --color "r.*h" /etc/passwd

(7)、显示/etc/passwd中,r后跟了o,o出现0次或者1次的行;

grep --color "ro?" /etc/passwd

(8)、显示/etc/passwd中,r后跟了o,o出现至少1次至多2次的行;

grep --color "ro{1,2}" /etc/passwd

(9)、显示/etc/passwd中,r后跟了o,o只出现2次的行;

grep --color "ro{2}" /etc/passwd

(10)、显示/etc/passwd中,匹配root这个单词的行;

grep --color "root" /etc/passwd

grep支持扩展表达式的元字符:支持所有基本正则表达式的元字符,有些和基本元字符在用法上不一样,扩展正则表达式的命令egrep或者grep -E
?:匹配紧挨在前面的字符0次或1次
{m,n}:至少m次,至多n次
():分组
+:至少匹配前面的字符一次
a|b:匹配a或者b


eg:扩展正则表达式的例子

(1)、显示/etc/passwd中,r开头后跟了o,o出现0次或者1次的行;

egrep --color "ro?" /etc/passwd

(2)、显示/etc/passwd中,r开头后跟了o,o出现至少1次至多2次的行;

 egrep --color "ro{1,2}" /etc/passwd

(3)、显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的;

 egrep --color "^([0-9]).*1$"  /etc/inittab

02.png

(4)、显示/etc/passwd中,r开头后跟了o,o出现至少1次;

 

复制代码代码如下:
egrep --color "ro+" /etc/passwd
grep -E --color "ro{1,}" /etc/passwd

(5)、显示/etc/passwd中,匹配root或者halt的行;

 egrep --color "root|halt" /etc/passwd

(6)、显示/var/log/secure文件中包含"LOGIN ON"或者"Failed passwd"的行;

egrep --color "(LOGIN ON|Failed passwd)" /var/log/secure

grep支持字符和字符集合
    d:数字字符匹配。等效于 [0-9]。
    s:匹配任何空白字符,包括空格、制表符、换页符等。与 [ fnrtv] 等效。
    S:匹配任何非空白字符。与 [^ fnrtv] 等效
    w:匹配任何字类字符,包括下划线。与[A-Za-z0-9_]等效。
    W:与任何非单词字符匹配。与[^A-Za-z0-9_]等效。
   [:digit:]:所有数字, 相当于0-9 或者d
   [:lower:]:所有的小写字母
   [:upper:]:所有的大写字母
   [:alpha:]:所有的字母
   [:alnum:]:相当于[0-9a-zA-Z]
   [:space:]:空白字符 相当于s
   [:punct:]:所有标点符号

eg:支持字符集合的例子

(1)、显示/etc/rc.d/rc.sysinit中以#开头,且后面跟一个或多个空白字符,而后又跟了任意非空白字符的行;

 

复制代码代码如下:
grep "^#[[:space:]]{1,}[^[:space:]]" /etc/rc.d/rc.sysinit
grep -E "^#s{1,}S" /etc/rc.d/rc.sysinit

(2)、显示/etc/inittab中包含了:一个数字:(即两个冒号中间一个数字)的行;

 

复制代码代码如下:
grep --color ":[[:digit:]]:" /etc/inittab
grep --color ":d:" /etc/inittab

经典的例子

(1)、分组的例子

 

复制代码代码如下:
cat test.txt EOF
He like his liker
He love his lover
She love her lover
She like her lover
EOF
grep "l..e.*l..er" test.txt
grep "(l..e).*1r" test.txt

03.png

04.png

(2)、匹配1-255的数字

 

复制代码代码如下:
cat num.txt EOF
12
234
255
256
EOF
grep --color -E "([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])" num.txt



05.png

(3)、匹配ABC类IP地址即 1.0.0.1---223.255.255.254

 

复制代码代码如下:
cat ip.txt EOF
1.0.0.254
1.0.0.255
1.2.3.4
223.255.255.254
224.255.255.252
2.255.255.255
EOF
grep -E --color "([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-1][0-9]|22[0-3]).([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]).([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]).([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])" ip.txt



06.png


(4)、匹配Email地址:任意长度数字字母@任意长度数字字母.(com|org|net等等)

 

复制代码代码如下:
cat email.txt EOF
5678967@qq.com
jie231@sina.cn
ken_tom@netcom.org
jerry#li@baidu.net
li@souhu.net
EOF
grep -E --color "^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$" email.txt



07.png

(5)、匹配手机号码:手机号码是1[3|4|5|8]后面接9位数字的

 

复制代码代码如下:
cat tel.txt EOF
13690876890
12589098379
15608764083
15820974619
138074082711
18618203761
19209783900
1329873909
EOF
grep --color -E "1[3|4|5|8][0-9]{9}" tel.txt



08.png

本文出自 技术之路---桀 博客

来源:http://www.tulaoshi.com/n/20160331/2051949.html

延伸阅读
Waterlogue水彩风格照片处理工具   Waterlogue是由Tinrocket开发的一款能够将照片转换成水彩风格图画的应用程序。如果你想要将自己所拍摄的照片转换成其它特别的风格,那么这款Waterlogue将是你不错的选择。 在遇到Waterlogue之前,我一直使用由过滤器演变的能够把照片变成像素风格的应用程序Tinrocket。紧接着我发现了Popsic...
标签: 电脑入门
SVN是一款源代码版本控制工具,在服务器上用命令行进行操作,下面图老师小编将针对Linux中SVN常用命令和不常用命令做个汇总,以便你对SVN命令有个详细的了解。 Subversion将文件存放在中心版本库里,这个版本库很像一个普通的文件服务器。不同的是,它可以记录每一次文件和目录的修改情况,这样就可以在需要的回滚时,将数据恢复到以前的版...
标签: 服务器
linux中which命令使用详解   我们经常在linux要查找某个文件,但不知道放在哪里了,可以使用下面的一些命令来搜索: which 查看可执行文件的位置。 whereis 查看文件的位置。 locate 配合数据库查看文件位置。 find 实际搜寻硬盘查询文件名称。 which命令的作用是,在PATH变量指定的路径中,搜索某个系统命...
Linux系统命令分类详解 Linux系统命令分类详解 (2)四.2.Linux 中文件查找技术大全 每一种操作系统都是由成千上万个不同种类的文件所组成的。其中有系统本身自带的 文件,用户自己的文件,还有共享文件等等。我们有时候经常忘记某份文件放在硬盘 中的哪个地方。在微软的WINDOWS操作系统中要查找一份文件是相当简单的事情,只 要在桌面上点击...
照片处理工具 简单几招强似专业PS 大懒人必备,既想照片风格独特,又不希望操作太复杂?满足你,小编今天推荐的这款照片处理软件一定能够满足你。照片处理工具是一款很强大的图像处理工具,有了它,只需简单的三招就可以让你的照片风格独特,而且出来的效果就像专业的PS制作出来的图片一样。下面小编就为大家详细介绍,怎么通过简单的三个...

经验教程

518

收藏

89
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部