星期一, 2013-11-04 11:06 — shiping1

2009-03-16

关于正则表达式匹配任意字符（包括换行符）的写法

Posted in Java at 17:21 Author:仲远

今天在Java中想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则：

(.*)

结果运行之后才发现，无法获得换行之后的文本。于是查了一下手册，才发现正则表达式中，“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。同时，手册上还有一句话：要匹配包括 '\n' 在内的任何字符，请使用像 '[.\n]' 的模式。于是我将正则表达式的匹配规则修改如下：

([.\n]*)，当然，如果是在java程序中直接写到话，需要改为([.\\n]*)

结果再次运行程序，发现什么内容也取不到了。我百思不得其解，又将其修改为如下规则：

([.|\n]*) 以及 ([\n.]*)

结果还是不行，什么内容都取不到。看来点符号和换行符卯上劲了～

然后上网一查，虽然没有查出上述规则到底是什么地方出问题了，但是查出了一个解决办法，经过一试，果然可以匹配包括换行符在内的任意字符，以下为正确的正则表达式匹配规则：

([\s\S]*)

同时，也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。

本文可以自由转载，转载时请保留全文并注明出处：
转载自仲子说 [ http://www.wangzhongyuan.com/ ]
原文链接：http://www.wangzhongyuan.com/archives/640.html
来自 http://www.wangzhongyuan.com/archives/640.html

在文本文件里, 这个表达式可以匹配所有的英文
/[ -~]/
这个表达式可以匹配所有的非英文(比如中文)
/[^ -~]/
/是VI里用的. 你在editplus或程序里不需要/

正则表达式匹配中文与双字节的代码

匹配中文字符
[\u4e00-\u9fa5]
C#

复制代码代码如下:

class Class1 
{ 
static void Main() 
{ 
string s = "中文 chinese"; 
Regex regx = new Regex("[\u4e00-\u9fa5]+"); 
Match m = regx.Match(s); 
Console.WriteLine(m.Groups[0].Value); // 中文 
Console.ReadKey(); 
} 
} 

匹配双字节字符(包括汉字)
[^\x00-\xff]

来自 http://www.csdn123.com/html/20130206/3/87dddf5d6728a7ce6b6dcf1808814740.htm

普通分类:

regular

You are here

关于正则表达式匹配任意字符（包括换行符）的写法

2009-03-16

关于正则表达式匹配任意字符（包括换行符）的写法

正则表达式匹配中文与双字节的代码

友情链接

搜索表单

用户登录

You are here

关于正则表达式匹配任意字符（包括换行符）的写法

2009-03-16

关于正则表达式匹配任意字符（包括换行符）的写法

正则表达式匹配中文与双字节的代码

友情链接