一. grep命令介绍

Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来。

grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。


linux支持三种形式的grep命令: grep , egrep ,grep -E

二. 语法格式及常用选项

依据惯例,我们还是先查看帮助,使用grep –help

  1. [root@mufeng test]# grep –help
  2. 用法: grep [选项]… PATTERN [FILE]…
  3. 在每个 FILE 或是标准输入中查找 PATTERN。
  4. 默认的 PATTERN 是一个基本正则表达式(缩写为 BRE)。
  5. 例如: grep -i ‘hello world’ menu.h main.c
  6. 正则表达式选择与解释:
  7.   -E, –extended-regexp     PATTERN 是一个可扩展的正则表达式(缩写为 ERE)
  8.   -F, –fixed-strings       PATTERN 是一组由断行符分隔的定长字符串。
  9.   -G, –basic-regexp        PATTERN 是一个基本正则表达式(缩写为 BRE)
  10.   -P, –perl-regexp         PATTERN 是一个 Perl 正则表达式
  11.   -e, –regexp=PATTERN      用 PATTERN 来进行匹配操作
  12.   -f, –file=FILE           从 FILE 中取得 PATTERN
  13.   -i, –ignore-case         忽略大小写
  14.   -w, –word-regexp         强制 PATTERN 仅完全匹配字词
  15.   -x, –line-regexp         强制 PATTERN 仅完全匹配一行
  16.   -z, –null-data           一个 0 字节的数据行,但不是空行
  17. Miscellaneous:
  18.   -s, –no-messages         suppress error messages
  19.   -v, –invert-match        select non-matching lines
  20.   -V, –version             display version information and exit
  21.       –help                display this help text and exit
  22. 输出控制:
  23.   -m, –max-count=NUM       NUM 次匹配后停止
  24.   -b, –byte-offset         输出的同时打印字节偏移
  25.   -n, –line-number         输出的同时打印行号
  26.       –line-buffered       每行输出清空
  27.   -H, –with-filename       为每一匹配项打印文件名
  28.   -h, –no-filename         输出时不显示文件名前缀
  29.       –label=LABEL         将LABEL 作为标准输入文件名前缀
  30.   -o, –only-matching       show only the part of a line matching PATTERN
  31.   -q, –quiet, –silent     suppress all normal output
  32.       –binary-files=TYPE   assume that binary files are TYPE;
  33.                             TYPE is ‘binary’, ‘text’, or ‘without-match’
  34.   -a, –text                equivalent to –binary-files=text
  35.   -I                        equivalent to –binary-files=without-match
  36.   -d, –directories=ACTION  how to handle directories;
  37.                             ACTION is ‘read’, ‘recurse’, or ‘skip’
  38.   -D, –devices=ACTION      how to handle devices, FIFOs and sockets;
  39.                             ACTION is ‘read’ or ‘skip’
  40.   -r, –recursive           like –directories=recurse
  41.   -R, –dereference-recursive
  42.                             likewise, but follow all symlinks
  43.       –include=FILE_PATTERN
  44.                             search only files that match FILE_PATTERN
  45.       –exclude=FILE_PATTERN
  46.                             skip files and directories matching FILE_PATTERN
  47.       –exclude-from=FILE   skip files matching any file pattern from FILE
  48.       –exclude-dir=PATTERN directories that match PATTERN will be skipped.
  49.   -L, –files-without-match print only names of FILEs containing no match
  50.   -l, –files-with-matches  print only names of FILEs containing matches
  51.   -c, –count               print only a count of matching lines per FILE
  52.   -T, –initial-tab         make tabs line up (if needed)
  53.   -Z, –null                print 0 byte after FILE name
  54. 文件控制:
  55.   -B, –before-context=NUM  打印以文本起始的NUM 行
  56.   -A, –after-context=NUM   打印以文本结尾的NUM 行
  57.   -C, –context=NUM         打印输出文本NUM 行
  58.   -NUM                      same as –context=NUM
  59.       –group-separator=SEP use SEP as a group separator
  60.       –no-group-separator  use empty string as a group separator
  61.       –color[=WHEN],
  62.       –colour[=WHEN]       use markers to highlight the matching strings;
  63.                             WHEN is ‘always’, ‘never’, or ‘auto’
  64.   -U, –binary              do not strip CR characters at EOL (MSDOS/Windows)
  65.   -u, –unix-byte-offsets   report offsets as if CRs were not there
  66.                             (MSDOS/Windows)

复制代码 为了更直观一些,我们把常用的参数用表格来展示:

参数 描述
-i 忽略大小写
-E 启用POSTIX扩展正则表达式
-P 启用perl正则
-o 只输出正则表达式的匹配的内容
-w 整字匹配
-v 取反,也就是不匹配的
-n 输出行号


三. 参考案例

3.1 搜索文件中以root开头的文件

以root开头的文件,可以用 ^root 比如查看/etc/passwd 中以root开头的文件,操作如下:

  1. [root@mufenggrow ~]# grep ^root /etc/passwd
  2. root:x:0:0:root:/root:/bin/bash

3.2 搜索文件X现的root


案例一: 搜索/etc/passwd中的root用户

  1. [root@mufenggrow ~]# grep “root” /etc/passwd
  2. root:x:0:0:root:/root:/bin/bash
  3. operator:x:11:0:operator:/root:/sbin/nologin
  4. [root@mufenggrow ~]#

案例二: 从多个文件中搜索root

  1. root@mufenggrow ~]# echo root >> a.txt
  2. [root@mufenggrow ~]# echo root >> b.txt
  3. [root@mufenggrow ~]# grep “root” /etc/passwd  a.txt b.txt
  4. /etc/passwd:root:x:0:0:root:/root:/bin/bash
  5. /etc/passwd:operator:x:11:0:operator:/root:/sbin/nologin
  6. a.txt:root
  7. b.txt:root
  8. [root@mufenggrow ~]#

3.3 搜索除了匹配行之外的行

此处使用-v 参数,比如取反

案例一: 统计文件的行数且不包含空行

空行的表示方法: ^$

  1. [root@mufenggrow ~]# cp /etc/passwd ./
  2. ## 源文件一共35行
  3. [root@mufenggrow ~]# cat /etc/passwd |wc -l
  4. 35
  5. ## 追加空行进去
  6. [root@mufenggrow ~]# echo “” >> /etc/passwd
  7. [root@mufenggrow ~]# cat /etc/passwd |wc -l
  8. 36
  9. ## 去掉空行测试
  10. [root@mufenggrow ~]# grep -v ^$  /etc/passwd |wc -l
  11. 35
  12. [root@mufenggrow ~]#

复制代码 有时候我们修改了配置文件,文件中包含大量的# ,我们想去掉#查看内容,就可以使用

  1. [root@mufenggrow ~]# grep -v ^# passwd |wc -l
  2. 35

3.4 匹配的部分使用颜色显示

这里可以使用 –color=auto,我们来查看一下包含root的行,并高亮显示要查找的root。

  1. [root@mufenggrow ~]# grep root /etc/passwd  –color=auto
  2. root:x:0:0:root:/root:/bin/bash
  3. operator:x:11:0:operator:/root:/sbin/nologin
  4. [root@mufenggrow ~]#

复制代码 这样显示,效果不明显,我们看下图:


3.5 只输出文件中匹配到的地方


此时需要使用 -o 参数,代码如下

  1. [root@mufenggrow ~]# grep -o root /etc/passwd
  2. root
  3. root
  4. root
  5. root

复制代码 要注意,如果一行中有10个root,这里就显示10个,而不是只显示一个,所以3.4的案例中我们查询的时候,包含root的有两行,但有4个root,在3.5案例中,显示了所有的root。

3.6 输出包含匹配字符串的行,并显示所在的行数

此处可以使用-n 参数, -n 会在一行的前面加上 行号: 比如“4:”


  1. [root@mufenggrow ~]# grep -n “root” passwd
  2. 1:root:x:0:0:root:/root:/bin/bash
  3. 11:operator:x:11:0:operator:/root:/sbin/nologin

复制代码 我们要统计一个文件一共有多少行,也可以使用-n 参数

  1. root@mufenggrow ~]# grep -n “” passwd |awk -F : ‘{print $1}’ |tail -n 1
  2. 35

3.7 统计文件或者文本中包含匹配字符串的行数


  1. [root@mufenggrow ~]# grep -c “root” passwd
  2. 2

复制代码 包含root的有两行, 如果我们要统计文本的行数:

  1. [root@mufenggrow ~]# grep -c “$” passwd
  2. 35

复制代码 相当于查找 $的行数,可以看到一共有35个$符号,也就是35行。



