欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

强悍的 vim —— g s 替换区别 (g 就是 global 吧)

global 命令是 Vim 最强大的命令之一(个人认为是No.1),将其摸透用熟可以事半功倍。

1. global 命令形式

:h :g
:h 12.4
:[range]global/{pattern}/{command}
  • 1

  • 2

  • 3

global命令在[range]指定的文本范围内(缺省为整个文件)查找{pattern},然后对匹配到的行执行命令{command},如果希望对没匹配上的行执行命令,则使用global!或vglobal命令。

先来看Vim用户手册里的一个经典例子。

【例1】倒序文件行(即unix下的tac命令)

:g/^/m 0
  • 1

这条命令用行首标记/^/匹配文件的所有行(这是查找的一个常用技巧,如果用/./则是匹配非空行,不满足本例要求),然后用move命令依次将每行移到第一行(第0行的下一行),从而实现了倒序功能。

global命令实际上是分成两步执行:

  • 首先扫描[range]指定范围内的所有行,给匹配{pattern}的行打上标记;

  • 然后依次对打有标记的行执行{command}命令,如果被标记的行在 
    对之前匹配行的命令操作中被删除、移动或合并,则其标记自动消失,而不对该行执行{command}命令。标记的概念很重要,以例说明。

【例2】删除偶数行

:g/^/+1 d
  • 1

这条命令也是匹配所有行,然后隔行删除(其中+1用以定位于当前行的下一行)。为什么是隔行呢?因为在对第一行执行+1 d命令时删除的是第二行,而第二行虽然也被标记了,但已不存在了,因此不会执行删除第三行的命令。

本例也可以用normal命令实现:

:%norm jdd
  • 1

%指定整个文件,然后依次执行普通模式下的jdd,即下移删除一行。与global命令不同之处在于,%norm是按照行号顺序执行,在第一行时删除了第二行,后面的所有行号都减一,因此在第二行执行jdd时删除的是原来的第四行。也就是说,global命令是通过偶数行标记的消失实现的,而normal命令是通过后续行的自动前移实现的。

【例3】删除奇数行

:g/^/d|m.
  • 1

光是:g/^/d显然不行,这会删除所有行,我们需要用move命令把偶数行的标记去掉。当然,本例可以很简单的转换成【例2】,在此只是用来强调标记的概念。

本例若想用normal命令实现比较有意思,%norm dd也同样会删除整个文件,%norm jkdd 
就可以,我不知道两者为什么不同,可能和normal命令内部的运行机制有关。

2. global与substitute

不少vimmer觉得这两个命令差不多,的确,它们的形式很相似,都是要进行查找匹配,只不过substitute执行的是替换而global执行的其它命令(当然,substitute缺省的[range]是当前行,这点也不同)。先看两个例子,体会一下:s和:g不同的思维方式。

【例4】double所有行

:%s/.*/&r&/

:g/^/t.
  • 1

  • 2

  • 3

substitue是查找任意行,然后替换为两行夹回车;global是将每一行复制(:t就是:copy)到自己下面,更加清晰明了。

【例5】把以回车排版、以空行分段的文本变成以回车分段的文本

很多txt格式的ebook,以及像vim help这样的文本,每行的字符数受限,段之间用空行 
分隔。若把它们拷贝到word里,那些硬回车和空行就比较讨厌了,虽然word里也有自动 
调整格式的功能,不过在Vim里搞定更是小菜一碟。先看看用替换如何实现。

:s/nn@!/ /

nn@!是查找后面不跟回车的回车(关于@!的用法请:h /@!,在此不多说了),然后 
替换为空格,也就是去掉用于排版的回车。global命令则完全是另一种思路。

:g/./,/^$/j

/./标记非空行,/^$/查找其后的空行,然后对二者之间的行进行合并操作。也许有人会 
问,段中的每一行会不会都执行了j命令?前面已经说过,在之前操作中消失掉的标记行 
不执行操作命令,在处理每段第一行时已经把段内的其余行都合并了,所以每段只会执 
行一次j命令。这条命令使用global标记做为[range]的起始行,这样的用法后面还会详 
述。

global经常与substitute组合使用,用前者定位满足一定条件的行,用后者在这些行中 
进行查找替换。如:

【例6】将aaa替换成bbb,除非该行中有ccc或者ddd

:v/ccc|ddd/s/aaa/bbb/g

【例7】将aaa替换成bbb,条件是该行中有ccc但不能有ddd

如何写出一个匹配aaa并满足行内有ccc但不能有ddd的正则表达式?我不知道。即便能写 
出来,也必定极其复杂。用global命令则并不困难:

:g/ccc/if getline(‘.’) !~ ‘ddd’ | s/aaa/bbb/g

该命令首先标记匹配ccc的行,然后执行if命令(if也是ex命令!),getline函数取得 
当前行,然后判断是否匹配ddd,如果不匹配(!~的求值为true)则执行替换。要掌握这 
样的用法需要对ex命令、Vim函数和表达式有一定了解才行,实际上,这条命令已经是一 
个快捷版的脚本了。可能有人会想,把g和v连起来用不就行了么,可惜global命令不支 
持(恐怕也没法支持)嵌套。

  1. global标志的[range]用法

:h range

在global命令第一步中所设的标记,可以被用来为{command}命令设定各种形式的[rang 
e]。在【例2】和【例5】中都已使用了这一技巧,灵活使用[range],是一项重要的基本 
功。先看看【例2】和【例3】的一般化问题。

【例8】每n行中,删除前/后m行(例如,每10行删除前/后3行)

:g/^/,+2 d | ,+6 m -1

:g/^/,+6 m -1 | +1,+3 d

这两个命令还是利用move来清除保留行的标志,需要注意的是执行第二个命令时的当前 
行是第一个命令寻址并执行后的位置。再看两个更实用点的例子。

【例9】提取条件编译内容。例如,在一个多平台的C程序里有大量的条件编译代码:

ifdef WIN32

XXX1

XXX2

endif

ifdef WIN32

XXX3

XXX4

else

YYY1

YYY2

endif

现在用global命令把Win32平台下代码提取出来,拷贝到文件末:

:g/#ifdef WIN32/+1,/#else|#endif/-1 t $

t命令的[range]是由逗号分隔,起始行是/#ifdef WIN32/标记行的下一行,结束行是一 
个查找定位,是在起始行后面出现的#endif或#else的上一行,t将二者间的内容复制到 
末尾。

【例10】提取上述C程序中的非Win32平台的代码(YYY部分)

首先说明一下,这个例子比前例要复杂的多,主要涉及的是[range]的操作,已经和glo 
bal命令没多少关系,大可不看。加到这的目的是把问题说完,供喜欢细抠的朋友参考。 
本例的复杂性在于:首先,不能简单的用#else和#endif定位,因为代码中可能有其它的 
条件编译,我们必须要将查找范围限定在#ifdef WIN32的block中;另外,在block中可 
能并没有#else部分,这会给定位带来很大麻烦。解决方法是:

:try | g/#ifdef WIN32//#else/+1, /#endif/-1 t $ | endtry

先不管try和endtry,只看中间的global部分:找到WIN32,再向后找到#else,将其下一 
行作为[range]的起始行,然后从当前的光标(WIN32所在行,而非刚找到的#else的下一 
行)向下找到#endif,将其上一行作为[range]的结束行,然后执行t命令。但对于没有

else的block,如第一段代码,[range]的起始行是YYY1,而结束行是XXX2(因为查找

endif时是从第一行开始的,而不是从YYY1开始),这是一个非法的[range],会引起ex 
ception,如果不放在try里面global命令就会立刻停止。

与逗号(,)不同,如果[range]是用分号(;)分隔的,则会使得当前光标移至起始行,在查 
找#endif时是从#else的下一行开始,这样就产生非法[range],用不着try,但带来的问 
题是:没有#else的block会错误的把后面block中的#else部分找出来。

  1. global与Vim脚本

:h script

:h expression

经常有人问:XxEditor有个什么功能,Vim支持么?很可能不支持,因为Vim不大会为特 
定用户群提供非一般化的功能,但很少有什么功能不能在Vim定制出来,如果是你常用, 
就加到你的vimrc或者plugin里。脚本就是定制Vim的一种利器。本文不讨论脚本的编写 
,而是介绍如何实用global实现类似脚本的功能,实际上,就是利用命令提供的机制, 
做一个简化的脚本。

【例11】计算文件中数字列之和(或其它运算)

:let i=0

:g/^/let i+=str2nr(getline(‘.’))

:echo i

首先定义变量i并清零,然后用str2nr函数把当前行转成数字累加到i中,注意Vim不支持 
浮点数。global在这里实际上是替代了脚本里的for循环。

Vim中最常见的一个问题是如何产生一列递增数字,有很多解决办法,调用外部命令,录 
宏,用substitute命令,还有专门的插件,而用global命令,可以实现一些更高级的功 
能。见下例。

【例12】给有效代码行添加标号

Data Structures and Algorithm Analysis in C一书中,作者为了便于讨论,将代 
码中的有效行加上注释标号,例如:

unsigned int factorial( unsigned int n )

{

if( n <= 1 )

return 1;

return( n * factorial(n-1) );

}

为了在添加标号后能对齐,我们预先在每行代码前面插入足够多的空格(这当然很简单 
),然后用global命令自动添加标号:

:let i=1 | g/a/s/ {8}/=printf(“/* - */”,i)/ | let i+=1

其中变量i用来记录标号,g命令查找有字母的行,然后把前8个空格替换成注释标号,每 
行处理完成后标号加一。替换中用到了/=,一个非常有用的功能。

5.小结

要用好global命令并非易事,命令中的每一部分都值得仔细研究:只有掌握了range原理 
,才能自如的在文件中定位;只有精通pattern,才能有效的匹配到想要找的行;只有熟 
悉ex命令,才能选用最合适的功能进行操作;只有对变量、表达式、函数等内容有一定 
了解,才更能让global命令实现脚本的功能。总之,global是一个非常好的框架,对Vi 
m越是熟悉,就越能将其种种武器架设在其上使用,发挥更大的威力。

global当然并非万能,功能也有所欠缺,最主要的问题是只能用正则表达式来标志匹配 
行,如果能用任意表达式来标记(或者从另一个角度,如前mv版主runsnake所说,引入 
求值正则表达式),则可实现更加方便功能。比如前述的几个删除特定行的问题,将会 
有简单而统一的解决方法。上述例子如果用sed、awk等专门的文本处理工具,或者perl 
之类的script语言也非难事,有些实现起来会更加方便。本文提供的Vim解决方法未必简 
单,甚至可能是难于理解,目的在于介绍global的使用。对于那些不会或者不能使用其 
它工具的朋友,参考价值可能更大一些。其实Vim的功能实在很丰富,值得我们深入学习 
。打个不恰当的比方,少林七十二绝技固然高妙,会的越多自然功力越强,不过只要会 
上一门六脉神剑或小无相功,也足以独步江湖了。


普通分类: