神级编辑器 Vim 使用-正则替换篇

Vim 的替换查找是其核心功能, 功能极其强大, 通过其规则匹配, 可以很快速地完成我们很多需要大量人力操作的工作, 而且可对多文件使用查找/替换功能.

himg

本系列教程共分为以下五个部分:

  1. 神级编辑器 Vim 使用-基础篇
  2. 神级编辑器 Vim 使用-操作篇
  3. 神级编辑器 Vim 使用-插件篇
  4. 神级编辑器 Vim 使用-正则操作篇
  5. 神级编辑器 Vim 使用-最后

正则匹配的模式

编程界实现了多种正则匹配引擎, vim 的正则匹配引擎是独有的, 其风格类似于 POSIX, 但是我们可通过将其匹配模式设为:

  • \v: (very magic) 来开启 Perl 模式, 此模式下( 已经被转义, 如果要搜索 (, 必须转回原义, \(
  • \V: (very nomagic) 来开启开启原义模式, 此模式下直接搜索( 即可搜索到 (
  • \m: 默认模式, 不指定任何模式时使用的就是此模式. 此模式下仅部分字符有特殊含义, ( 没有被转义, 仍然可通过 ( 搜索到 (
  • \M: (nomagic) 其功能类似于 \V 原义开关, 不同的是, 一些字符会自动具有特殊含义, 即符号 ^$

本文只讨论默认模式下(\m 模式)下的正则匹配, 其他模式下的原理类似, 读者可自行研究

查找

查找元字符

元字符是正则匹配的一个概念, 通过元字符可以快速找出目标字段.

  • .: 表示匹配任意 一个 字符. 例: c..l 表示任意以 c 开头, 中间有两个任意字符, l 结尾的字段.

  • .*: 表示匹配 任意多个 字符. 例: c.*l 表示任意以 c 开头 l 结尾的字段(不会将一个字段进行跨行处理, 因此非常智能, 很频繁使用)

  • $: 匹配行尾. 例: /d.*$ 表示匹配到以 d 开头到行尾中的所有内容, /123$ 表示以 123 结尾的所有字段

  • ^: 匹配行首. 例: ^.*d 表示匹配到行首到 d 的所有内容, /^123 表示以 123 开头的字段

  • \< : 匹配单词词首

  • \> : 匹配单词词尾. 例: /\<f\> 表示只匹配 f 单词, 如果其前有任何字符它就不是单词, 不会被匹配到.

  • *: 表示其前字符可以重复 0~无数 次. 如 /be* 会匹配到 b, be, bee …, 因为 e 重复零次就是没有, 所以会返回 b, 贪婪匹配模式, greedy

  • \+: 表示其前字符必须重复 1~无数 次, 如 /be\+ 会匹配到 be, bee, beee …, 贪婪匹配模式

  • \{-}: 非贪婪匹配模式, non-greedy, 与 * 相对, .\{-}.* 一样表示匹配任意多个字符

  • \?\=: 代表其前字符必须重复 0 或者 1 次.

  • \{n,m} : 其前字符必须重复 n 到 m 次, 贪婪匹配模式, (\{n,} 表示右边界范围为无限, {,m} 表示左边界范围为0)

  • \{-n,m} : 其前字符必须重复 n 到 m 次, 非贪婪匹配模式

  • [adz]: 匹配 a, d, z 中的任意 一个, 括号内也可是数字, 如 [2-5] 表示匹配 2, 3, 4, 5 中的任意一个数字

  • \|; 或的意思, 表示只要符合其前或其后任意一个字符即可. 例: /one\|two\|three 表示匹配 one, two, three 中的任意一个. end\(if\|while\|for\)
    表示会查找到 endif, endwhile, endfor 中的任意一个.

  • [^a]: 匹配除 a 以外的任意 字符

  • [a-c]: 匹配 a, b, c 中的任意一个, 递增的顺序

  • \d: 匹配十进制数字中的任意一个, 等同于 [0-9]. 例: /\d\d:\d\d:\d\d 表示查找如 17:31:00 格式的字符

  • \D: 匹配除十进制数字外的任意一个字符, 等同于 [^0-9]

  • \x: 匹配十六进制数字中的任意一个, 等同于 [0-9A-Fa-f]

  • \X: 匹配除十六进制数字外的任意一个字符, 等同于 [^0-9A-Fa-f]

  • \w: 匹配一个单词(对中文来说非常鸡肋, 因为只有 Vim 判定是单词的才会进行匹配, 与normal 模式下的 w, b, e 匹配规则相同)

  • \W: 匹配除单词外的所有字符. 因为在 vim 中中文全部不被认为是单词, 因此, 此匹配会选中所有中文字段.

  • \t: 代表 tab , 可使用此方法将所有 tab 替换为空格

  • \s: 配空白字段, 包含 tab 与空格, 在 pattern 中使用此查找空白, 在 string 中就可以直接使用空格或者 tab 来输入以替换了

  • \S: 匹配非空白字段, 等同于 [^\s]

  • \n: 匹配换行符

  • \_s: 匹配换行或空白

  • \_a: 匹配换行或单词(因为是单词, vim 不会匹配中文)

  • \C: 区分大小写地查找或替换, 例: /\CText 表示只会查找Text, 不会查找 texttExt

  • \c: 不区分大小写地查找替换(已经在 vim 中设置了默认不区分了)

  • \zs: set the beginning of the match

  • \ze: set the end of the match

如上所述, ., *, [, ], ^, %, /, ?, ~, $ 等字符有特殊含义, 如果对这些进行匹配, 需要考虑添加 \

查找时的常用操作

  • :noh : 取消查找模式的高亮匹配
  • *: 全文查找当前光标处单词 (n 为向下方向)
  • #: 全文查找当前光标处单词 (n 为向上方向)
  • n: 下一个列出的关键字
  • N: 上一个列出的关键字
  • gn: 进入面向字符的可视模式, 并选中下一项匹配
  • gN: 进入面向字符的可视模式, 并选中上一项匹配
  • gUgn: 使下一处匹配改为大写
  • <C-r><C-w>: 根据当前查找模式下已经输入的内容结合全文进行自动补全
  • /<UP>: 直接调用上次的查找逻辑.
  • /<DOWN>: 直接调用下次的查找逻辑.
  • /<C-N>: 直接调用下次的查找逻辑.
  • /<C-P>: 直接调用上次的查找逻辑.
  • /<C-r>/: 使用寄存器 / 将上次查找的值直接插入到当前模式中来

查找逻辑

/pattern/[e]

查找实例

  • /view: 全文查找 view 关键字 (n 为向下方向)
  • ?view: 全文查找 view 关键字 (n 为向上方向)
  • /\cview: 全文查找 view 关键字(大小写不敏感)
  • /view/e: 默认的查找会将光标置于单词首部, 使用 e 保证光标位于尾部, 方便 . 命令的调用
  • //e: 匹配 pattern 为空则直接重用上次的逻辑进行查找
  • /\<f\>: 使用 <> 限定词首与词尾, 保证只查找单词 f
  • /^\n\{3}: 查找三个空行
  • /\s\{2,}: 查找 2 个以上的空格
  • he\zsllo: 查找hello 并将 llo 作为匹配点进行高亮

还有一种是使用 global 命令: :g/pattern/d , 含义是对 patter 进行匹配搜索, 然后执行命令 delete, 也是基于查找的

替换

替换元字符

  • \r: 换行, 在 pattern 中使用\n 作为搜索串, 在string 中使用\r 作为换行命令(如果在 string 中仍然使用 \n 的话会出错)
  • \u\l: 把替换串中的下一个字符分别变成大写或者小写.
  • ~: 用在替换串中, 代表使用上次的替换串.
  • &: 用在替换串, 它代表与搜索模式想匹配的整个文本, 即“重现”搜索串. 这在试图避免重复输入文本时很有用.
  • \U\L: 将跟在后面的匹配串全部变成大写或小写

替换逻辑

:[range]s/pattern/string/flags

  • range: 范围
    • : 默认光标所在的行
    • .: 光标所在的当前行
    • N: 第 N 行
    • $: 最后一行
    • 'a: 标记 a 所在的行(使用 ma 标记的)
    • .+1: 当前光标的下面一行
    • $-1: 倒数第二行
    • 22,23: 第22 ~ 23行
    • 1,$: 第一行到最后一行
    • 1,.: 第一行到当前行
    • .,$: 当前行到最后一行
    • 'a, 'b: 标记 a 所在的行到 标记 b 所在的行
    • %: 所有行(与 1,$ 等价)
    • ?str?: 从当前位置向上搜索, 找到的第一个 str 所在的行(str 可以为正则表达式)
    • /str/: 从当前位置向下搜索, 找到的第一个 str 所在的行
    • 1,7 指第一行至第七行. 也可以使用 % 代表当前的文章(也可以理解为全部的行), # 代表前一次编辑的文章(基本不用)
  • s : 代表当前的模式为替换
  • /: 作为分隔符, 如果确实要替换文中的 /, 那么可以使用 # 代替作为分隔符. 例如 :s#vi/#vim#g, 代表替换 vi/vim
  • pattern : 要被替换掉的字符
  • string : 将要使用的字符
  • flags
    • : 只对指定范围内的每一行的第一个匹配项进行替换
    • g : global, 整行替换(基本上是必加的, 否则只会替换每一行的第一个符合字符)
    • c : confirm, 每次替换前会询问
    • e: ignore, 忽略错误(默认找不到会提示 pattern not found, 但是如果设置 vim 设置批量替换命令的话某一个项未匹配到不能影响到下一项的执行,
      可以使用此关键字, :silent %s/x/y/g == :%s/x/y/ge )
    • i : ignore, 不区分大小写
    • I: 区分大小写

变量替换

在表达式中可以使用 \(\) 将表达式括起来, 然后既可在后面使用 \1 \2 来依次访问由 \(\) 包围起来的内容.

例: :s/\(\w\+\)\s\+\(\w\+\)/\2\t\1 表示将 data1 data2 修改为 data2 data1

替换实例

  • r : 进入单字符替换模式
  • R : 进入替换模式
  • &: 重复上次的替换过程
  • :s/vi/vim/ : 只替换当前行的第一个 vi 为 vim
  • :s/vi/vim/g : 替换当前行的所有 vi 为 vim
  • :%s/vi/vim/g : 替换全文所有 vi 为 vim
  • :%s/vi/vim/gi : 替换全文所有 vi 为 vim, 大小写不敏感
  • :n,$s/vi/vim/gci : 替换从第 n 行到结尾所有 vi 为 vim, 每次替换提示, 不区分大小写
  • :.,$s/vi/vim/gci : 替换从当前行到结尾所有 vi 为 vim, 每次替换提示, 不区分大小写
  • :.,+3s/^/#: 在当前行到下面三行添加 # 的注释
  • :g/^\s*$/d : 删除所有空行
  • :215,237 s/\(.\)$/\1(自定义)/c: 将 215 至 237 行尾部添加 (自定义)
  • :%s/^\n$//gc/ : 替换多个空行为一个空行
  • :122,250s/\(201\d*\)\.\(\d*\)\.\(\d*\)\s/\1-\2-\3_/gc: 替换 2017.12.31类型的字段为2017-12-31_
  • %s/\(\](http:.*com\/\)\(HK.*\))/\](https:\/\/a.hanleylee.com\/\2?x-oss-process=style\/WaMa)/gc: 将[](http: ....com) 替换成 https 并且尾部带有样式参数
  • :%s/\(a.*bc\)\(<.*>\)\(xy.*z\)/\3\2\1/gc: 使用缓冲块实现对前后区域匹配并翻转位置(需要时再理解)
  • :%s/hello/&, world/: 将会把hello替换成hello, wolrd
  • :%s/.*/(&)/: 将会把所有行用()包含起来
  • : s/world/\U&/: 把 world 变成 WORLD
  • :%s ; /user1/tim;/home/time;g: /user1/tim改为/home/time, 除了/字符外, 还可以使用除反斜杆, 双引号和竖直线 \, ", 和 |, 之外的任何非字母表,
    非空白字符作为分隔符, 在对路径名进行修改时, 这点尤其便利
  • :s: 与 :s//~/相同, 重复上次替换
  • :&: 重复上次替换
  • %s/\<child\>/children/g: 保证在 child 是个完整单词的情况下进行替换
  • :g/mg[ira]box/s/box/square/g: 将 mgibox routine, mgrbox routine, mgabox routine, 中的 box 换为 square
  • &: 直接使用 & 也是重复上次替换的意思

替换时系统会对用户进行询问, 有 (y/n/a/q/1/^E/^Y)

  • y : 表示同意当前替换
  • n : 表示不同意当前 替换
  • a : 表示替换当前和后面的并且不再确认
  • q : 表示立即结束替换操作
  • 1 : 表示把当前的替换后结束替换操作;
  • ^E : 向上滚屏
  • ^Y : 向下滚屏,

多文件查找与替换

多文件操作的基础是一定要 设置好工作目录, 因为添加文件到操作列表是以当前路径下的文件进行判断筛选的, 设置当前路径可使用以下方式:

  • 手动 :cd path
  • NERDTree 插件的 cd 命令
  • netrw 插件的 cd 命令
  • .vimrc 中设置 set autochair 自动切换当前工作路径

多文件查找

himg

逻辑

vimgrep /pattern/[g][j] <range>

  • vimgrep: 批量查找命令, 其后可直接加 ! 代表强制执行. 也可以使用lvimgrep , 结果显示在 list 中
  • patten: 需要查找的内容, 支持正则表达式, 高级用法见元字符
  • g: 如果一行中有多个匹配是否全部列出
  • j: 搜索完后直接定位到第一个匹配位置
  • range : 搜索的文件范围
    • %: 在当前文件中查找
    • **/*.md: 在当前目录即子目录下的所有 .md 文件中
    • *: 当前目录下查找所有(不涉及子目录)
    • ** : 当前目录及子目录下所有
    • *.md : 当前目录下所有.md 文件
    • **/* : 只查找子目录

查找的结果使用 quick-fix 来进行展示, 可使用 :copen 查看所有结果项并进行相应跳转, 具体操作参考 神级编辑器 Vim 使用-操作篇

实例

  • :vimgrep /hello/g **: 在当前目录及子目录下的所有文件内查找 hello 字符串

quickfix-list 与 location-list 的区别

quickfix-list 是一个完整的窗口, 可以移动上下光标, 按下 enter 进行打开文件

location-list 只是一个局部的显示区域, 只能简单显示查找结果的信息, 目前看来没有必要使用此选项

多文件替换

多文件替换所依赖的是 vim 中的参数列表概念, 这里仅对流程命令进行演示, 具体的参数列表操作参考 神级编辑器 Vim 使用-操作篇

  • args: 显示当前的所有参数列表
  • :args *.md aa/**/*.md 表示添加子文件夹下的 md 文件及 aa 文件夹下的和其子文件夹下的 md 文件到参数列表中
  • :argdo %s/oldword/newword/egc | update : 对所有存在参数列表中的文件执行命令, s 代表替换, % 指对所有行进行匹配, g 代表整行替换(必用), e 指使用正则表达式, c 代表每次替换前都会进行确认, update 表示对文件进行读写
  • :argdo %s/!\[.*\]/!\[img\]/gc: 将所有参数列表中的以 ![ 开头, 以 ] 结尾的所有字段改为 [img]
  • :argdo write: 将所有参数列表中的内容进行缓冲区保存

最后

我的 vim 配置仓库: HanleyLee/dotvim

本文作者 Hanley Lee, 首发于 闪耀旅途, 如果对本文比较认可, 欢迎 Follow