global 命令是 Vim 最强大的命令之一(个人认为是No.1),将其摸透用熟可以事半功倍。
1. global 命令形式
1
2
3
global命令在[range]指定的文本范围内(缺省为整个文件)查找{pattern},然后对匹配到的行执行命令{command},如果希望对没匹配上的行执行命令,则使用global!或vglobal命令。
先来看Vim用户手册里的一个经典例子。
【例1】倒序文件行(即unix下的tac命令)
1
这条命令用行首标记/^/
匹配文件的所有行(这是查找的一个常用技巧,如果用/./则是匹配非空行,不满足本例要求),然后用move命令依次将每行移到第一行(第0行的下一行),从而实现了倒序功能。
global命令实际上是分成两步执行:
首先扫描[range]指定范围内的所有行,给匹配{pattern}的行打上标记;
然后依次对打有标记的行执行{command}命令,如果被标记的行在
对之前匹配行的命令操作中被删除、移动或合并,则其标记自动消失,而不对该行执行{command}命令。标记的概念很重要,以例说明。
【例2】删除偶数行
1
这条命令也是匹配所有行,然后隔行删除(其中+1用以定位于当前行的下一行)。为什么是隔行呢?因为在对第一行执行+1 d命令时删除的是第二行,而第二行虽然也被标记了,但已不存在了,因此不会执行删除第三行的命令。
本例也可以用normal命令实现:
1
%指定整个文件,然后依次执行普通模式下的jdd,即下移删除一行。与global命令不同之处在于,%norm是按照行号顺序执行,在第一行时删除了第二行,后面的所有行号都减一,因此在第二行执行jdd时删除的是原来的第四行。也就是说,global命令是通过偶数行标记的消失实现的,而normal命令是通过后续行的自动前移实现的。
【例3】删除奇数行
1
光是:g/^/d显然不行,这会删除所有行,我们需要用move命令把偶数行的标记去掉。当然,本例可以很简单的转换成【例2】,在此只是用来强调标记的概念。
本例若想用normal命令实现比较有意思,%norm dd也同样会删除整个文件,%norm jkdd
就可以,我不知道两者为什么不同,可能和normal命令内部的运行机制有关。
2. global与substitute
不少vimmer觉得这两个命令差不多,的确,它们的形式很相似,都是要进行查找匹配,只不过substitute执行的是替换而global执行的其它命令(当然,substitute缺省的[range]是当前行,这点也不同)。先看两个例子,体会一下:s和:g不同的思维方式。
【例4】double所有行
1
2
3
substitue是查找任意行,然后替换为两行夹回车;global是将每一行复制(:t就是:copy)到自己下面,更加清晰明了。
【例5】把以回车排版、以空行分段的文本变成以回车分段的文本
很多txt格式的ebook,以及像vim help这样的文本,每行的字符数受限,段之间用空行
分隔。若把它们拷贝到word里,那些硬回车和空行就比较讨厌了,虽然word里也有自动
调整格式的功能,不过在Vim里搞定更是小菜一碟。先看看用替换如何实现。
:s/nn@!/ /
nn@!是查找后面不跟回车的回车(关于@!的用法请:h /@!,在此不多说了),然后
替换为空格,也就是去掉用于排版的回车。global命令则完全是另一种思路。
:g/./,/^$/j
/./标记非空行,/^$/查找其后的空行,然后对二者之间的行进行合并操作。也许有人会
问,段中的每一行会不会都执行了j命令?前面已经说过,在之前操作中消失掉的标记行
不执行操作命令,在处理每段第一行时已经把段内的其余行都合并了,所以每段只会执
行一次j命令。这条命令使用global标记做为[range]的起始行,这样的用法后面还会详
述。
global经常与substitute组合使用,用前者定位满足一定条件的行,用后者在这些行中
进行查找替换。如:
【例6】将aaa替换成bbb,除非该行中有ccc或者ddd
:v/ccc|ddd/s/aaa/bbb/g
【例7】将aaa替换成bbb,条件是该行中有ccc但不能有ddd
如何写出一个匹配aaa并满足行内有ccc但不能有ddd的正则表达式?我不知道。即便能写
出来,也必定极其复杂。用global命令则并不困难:
:g/ccc/if getline(‘.’) !~ ‘ddd’ | s/aaa/bbb/g
该命令首先标记匹配ccc的行,然后执行if命令(if也是ex命令!),getline函数取得
当前行,然后判断是否匹配ddd,如果不匹配(!~的求值为true)则执行替换。要掌握这
样的用法需要对ex命令、Vim函数和表达式有一定了解才行,实际上,这条命令已经是一
个快捷版的脚本了。可能有人会想,把g和v连起来用不就行了么,可惜global命令不支
持(恐怕也没法支持)嵌套。
global标志的[range]用法
:h range
在global命令第一步中所设的标记,可以被用来为{command}命令设定各种形式的[rang
e]。在【例2】和【例5】中都已使用了这一技巧,灵活使用[range],是一项重要的基本
功。先看看【例2】和【例3】的一般化问题。
【例8】每n行中,删除前/后m行(例如,每10行删除前/后3行)
:g/^/,+2 d | ,+6 m -1
:g/^/,+6 m -1 | +1,+3 d
这两个命令还是利用move来清除保留行的标志,需要注意的是执行第二个命令时的当前
行是第一个命令寻址并执行后的位置。再看两个更实用点的例子。
【例9】提取条件编译内容。例如,在一个多平台的C程序里有大量的条件编译代码:
ifdef WIN32
XXX1
XXX2
endif
…
ifdef WIN32
XXX3
XXX4
else
YYY1
YYY2
endif
现在用global命令把Win32平台下代码提取出来,拷贝到文件末:
:g/#ifdef WIN32/+1,/#else|#endif/-1 t $
t命令的[range]是由逗号分隔,起始行是/#ifdef WIN32/标记行的下一行,结束行是一
个查找定位,是在起始行后面出现的#endif或#else的上一行,t将二者间的内容复制到
末尾。
【例10】提取上述C程序中的非Win32平台的代码(YYY部分)
首先说明一下,这个例子比前例要复杂的多,主要涉及的是[range]的操作,已经和glo
bal命令没多少关系,大可不看。加到这的目的是把问题说完,供喜欢细抠的朋友参考。
本例的复杂性在于:首先,不能简单的用#else和#endif定位,因为代码中可能有其它的
条件编译,我们必须要将查找范围限定在#ifdef WIN32的block中;另外,在block中可
能并没有#else部分,这会给定位带来很大麻烦。解决方法是:
:try | g/#ifdef WIN32//#else/+1, /#endif/-1 t $ | endtry
先不管try和endtry,只看中间的global部分:找到WIN32,再向后找到#else,将其下一
行作为[range]的起始行,然后从当前的光标(WIN32所在行,而非刚找到的#else的下一
行)向下找到#endif,将其上一行作为[range]的结束行,然后执行t命令。但对于没有
else的block,如第一段代码,[range]的起始行是YYY1,而结束行是XXX2(因为查找
endif时是从第一行开始的,而不是从YYY1开始),这是一个非法的[range],会引起ex
ception,如果不放在try里面global命令就会立刻停止。
与逗号(,)不同,如果[range]是用分号(;)分隔的,则会使得当前光标移至起始行,在查
找#endif时是从#else的下一行开始,这样就产生非法[range],用不着try,但带来的问
题是:没有#else的block会错误的把后面block中的#else部分找出来。
global与Vim脚本
:h script
:h expression
经常有人问:XxEditor有个什么功能,Vim支持么?很可能不支持,因为Vim不大会为特
定用户群提供非一般化的功能,但很少有什么功能不能在Vim定制出来,如果是你常用,
就加到你的vimrc或者plugin里。脚本就是定制Vim的一种利器。本文不讨论脚本的编写
,而是介绍如何实用global实现类似脚本的功能,实际上,就是利用命令提供的机制,
做一个简化的脚本。
【例11】计算文件中数字列之和(或其它运算)
:let i=0
:g/^/let i+=str2nr(getline(‘.’))
:echo i
首先定义变量i并清零,然后用str2nr函数把当前行转成数字累加到i中,注意Vim不支持
浮点数。global在这里实际上是替代了脚本里的for循环。
Vim中最常见的一个问题是如何产生一列递增数字,有很多解决办法,调用外部命令,录
宏,用substitute命令,还有专门的插件,而用global命令,可以实现一些更高级的功
能。见下例。
【例12】给有效代码行添加标号
在Data Structures and Algorithm Analysis in C一书中,作者为了便于讨论,将代
码中的有效行加上注释标号,例如:
unsigned int factorial( unsigned int n )
{
if( n <= 1 )
return 1;
return( n * factorial(n-1) );
}
为了在添加标号后能对齐,我们预先在每行代码前面插入足够多的空格(这当然很简单
),然后用global命令自动添加标号:
:let i=1 | g/a/s/ {8}/=printf(“/* - */”,i)/ | let i+=1
其中变量i用来记录标号,g命令查找有字母的行,然后把前8个空格替换成注释标号,每
行处理完成后标号加一。替换中用到了/=,一个非常有用的功能。
5.小结
要用好global命令并非易事,命令中的每一部分都值得仔细研究:只有掌握了range原理
,才能自如的在文件中定位;只有精通pattern,才能有效的匹配到想要找的行;只有熟
悉ex命令,才能选用最合适的功能进行操作;只有对变量、表达式、函数等内容有一定
了解,才更能让global命令实现脚本的功能。总之,global是一个非常好的框架,对Vi
m越是熟悉,就越能将其种种武器架设在其上使用,发挥更大的威力。
global当然并非万能,功能也有所欠缺,最主要的问题是只能用正则表达式来标志匹配
行,如果能用任意表达式来标记(或者从另一个角度,如前mv版主runsnake所说,引入
求值正则表达式),则可实现更加方便功能。比如前述的几个删除特定行的问题,将会
有简单而统一的解决方法。上述例子如果用sed、awk等专门的文本处理工具,或者perl
之类的script语言也非难事,有些实现起来会更加方便。本文提供的Vim解决方法未必简
单,甚至可能是难于理解,目的在于介绍global的使用。对于那些不会或者不能使用其
它工具的朋友,参考价值可能更大一些。其实Vim的功能实在很丰富,值得我们深入学习
。打个不恰当的比方,少林七十二绝技固然高妙,会的越多自然功力越强,不过只要会
上一门六脉神剑或小无相功,也足以独步江湖了。