欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

正则表达式-不包含某个字符串

shiping1 的头像
正则表达式-不包含某个字符串
2012-01-18 22:30:47
原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://jianshusoft.blog.51cto.com/2380869/766007

     在使用正则表达式的场合,常常有这种需求,就是匹配一个不包含某个子串的子符串。比如说,我要从“eabcdfgh”得到"cd"之前的子串。有些人可能会写:

([^cd]*)

这种写法是彻底错误的,因为[]中的是集合,也就是说,[^cd]表示不等于c或者d,而不是cd。下面的程序中没有cd,但eab还是被匹配出来了。

  1. String s = "([^cd]*)"
  2. Match m = Regex.Match("eabcfgh", s); 
  3. MessageBox.Show(m.Value);//eab 
  4. MessageBox.Show(m.Groups[1].Value);//eab 

上面这种写法是错的比较离谱的,正常青年一般都可以避免这种错误。在特殊情况下,正则表达式可以这么写,而且效率是比较高的。

([/s/S]*cd)

先说明下/s/S是表示匹配任何字符。所谓特殊情况,就是我知道这个字符串中必有cd的存在。假如,我的要求是匹配不包含cd的部分(为了描述方便,只匹配cd之前的部分),也就是说,当cd不存在时,应该把整个字符串都取出来。

  1. String s = "((.(?!cd))*.)"
  2. //String s = "([/s/S]*cd)"; 
  3. Match m = Regex.Match("eabcdfgh", s); 
  4. MessageBox.Show(m.Value);//eab 
  5. MessageBox.Show(m.Groups[1].Value);//eab 

这种写法终于符合要求了。不过值得一提的是,相较前一种而言,它的效率比较低。

回顾一下相关的语法:

(?:子表达式)         定义非捕获组。

  1. //定义非捕获组 
  2. String s = "e(?:ab)(.*)"
  3. Match m = Regex.Match("eabcd", s); 
  4. MessageBox.Show(m.Value);//eabcd 
  5. MessageBox.Show(m.Groups[1].Value);//cd 

ab是被匹配的,但是它所在的组没有被捕获,Group[1]是cd

(?=子表达式)       零宽度正预测先行断言。

  1. //零宽度正预测先行断言 
  2. //String s = "b(cd|de)(.*)"; 
  3. String s = "b(?=cd|de)(.*)"
  4. Match m = Regex.Match("eabcdfg", s); 
  5. MessageBox.Show(m.Value); 
  6. MessageBox.Show(m.Groups[1].Value);//区别 cd  cdfg 

这种写法和注释掉的写法是有区别的,区别就是“零宽度”,这种写法会被捕获,也就是不占一个Group。

(?!子表达式)       零宽度负预测先行断言。

!表示非,就是不包含,同样是零宽度,不会被捕获。

 

(?<=子表达式)    零宽度正回顾后发断言。

例:(?<=19)\d{2}\b

“1851 1999 1950 1905 2003”中的“99”、“50”和“05”

(?<!子表达式)     零宽度负回顾后发断言。

例:(?<!19)\d{2}\b

“1851 1999 1950 1905 2003”中的“51”和“03”

参考文章: http://msdn.microsoft.com/zh-cn/library/az24scfc.aspx
来自 http://jianshusoft.blog.51cto.com/2380869/766007



 

[正则表达式]如何判断不包含某些子字符串呢?(转)

(2009-04-08 11:12:01)
标签:

杂谈

分类: 好好学习

[正则表达式]如何判断字符串中不包含某些子字符串呢?
 

用正则表达式找出不包含连续字符串abc的单词
 

php不包含某字符串的正则表达式




php不包含某字符串的正则表达式

类别:PHP , 来自: 龙鸟, 时间:2008-03-12 16:45

摘要: 用正则实现包含某个字符串很容易,但如果实现不包含某个字符串呢?作者给出了一个解决方案。

判断一个字符串中是否含有另一字符串,php有很多方法,如下:

1. 常见函数
  1. strstr($str"abc");  

2. 正则匹配
  1. preg_match("/(abc)/is"$str);  

但是要匹配一个字符串中,不包含某字符串,用正则就比较麻烦了。
1. 如果不用正则如下就可以解决问题
  1. !strstr($str"abc");  

2. 但是用正则呢,就只有这样了
  1. preg_match("/^((?!abc).)*$/is"$str);  

完整代码示例

  1. $str "dfadfadf765577abc55fd" 
  2. $pattern_url "/^((?!abc).)*$/is" 
  3. if (preg_match($pattern_url$str))  
  4.  
  5.     echo "不含有abc!" 
  6.  
  7. else  
  8.  
  9.     echo "含有abc!" 
  10.  

结果为:false,含有abc!

同时匹配,包含字符串 “abc”,而且不包含字符串 “xyz”的正则表达式:

  1. preg_match("/(abc)[^((?!xyz).)*$]/is"$str);  
http://www.52web.com/52article/?view-121.html




来自  http://blog.sina.com.cn/s/blog_53df94780100crty.html

普通分类: