欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

Python 匹配任意字符(包括换行符)的正则表达式写法

shiping1 的头像
Python 正则表达式匹配任意字符(包括换行符)的写法
想使用正则表达式来获取一段文本中的任意字符,写出如下匹配规则: 
(.*) 
结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。 

以下为正确的正则表达式匹配规则: 
([\s\S]*) 
同时,也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。 Web技术之家_www.waweb.cn 

在文本文件里, 这个表达式可以匹配所有的英文 
/[ -~]/

来自 http://www.jb51.net/article/20654.htm


网上关于取任意字符(含换行符)的正则表达式十有八九是错的

作者:vkvi 来源:千一网络(原创) 时间:2012-8-27

正则表达式中,点(.)是指不含换行符(\n)(但包含 Tab)在内的所有字符。

要把 \n 也包含在内怎么办?

很多人的答案是:[.\n]。包括微软的某些教程也是这么说的。但是这个说法错误的,包括 [.\s]、[.\r\n] 也是错误的,[\n.]、[\s.] 也是错误的。

如下字符串:

s123e
s1
23e

用 s[.\n]*?e,是取不到任何记录的,可以在 http://regexlib.com/RETester.aspx?AspxAutoDetectCookieSupport=1 测试。如果您觉得它不保险,也可以自己写程序来测试。

正确的做法

s[\s\S]*?e,这样就有两条记录了,均是以 s 开头、e 结尾。\s 是空白字符,包含 \n、空格、Tab 等,而 \S 则是 \s 以外的。* 后面加上 ? 表示懒惰匹配

还有一种做法:s(.|\n)*?e。

相关阅读

来自 http://www.cftea.com/c/2012/08/5627.asp


正则表达式匹配任意字符(包括换行符)的写法

作者: 字体:[增加 减小] 类型:转载
在正则中,匹配任意字符,其实写法网上有很多,但因为各种软件或程序写法不支持等原因导致的问题,大家可以多研究。
今天在Java中想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则: 
(.*) 
结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。同时,手册上还有一句话:要匹配包括 '\n' 在内的任何字符,请使用像 '[.\n]' 的模式。于是我将正则表达式的匹配规则修改如下: 
([.\n]*),当然,如果是在java程序中直接写到话,需要改为([.\\n]*) 
结果再次运行程序,发现什么内容也取不到了。我百思不得其解,又将其修改为如下规则: 
([.|\n]*) 以及 ([\n.]*) 
结果还是不行,什么内容都取不到。看来点符号和换行符卯上劲了~ 
然后上网一查,虽然没有查出上述规则到底是什么地方出问题了,但是查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为正确的正则表达式匹配规则: 
([\s\S]*) 
同时,也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。 


在文本文件里, 这个表达式可以匹配所有的英文 
/[ -~]/ 
这个表达式可以匹配所有的非英文(比如中文) 
/[^ -~]/ 
/是VI里用的. 你在editplus或程序里不需要/

来自 http://www.jb51.net/article/19713.htm



正则表达式匹配包括换行符的所有字符

分类: 正则表达式 108人阅读 评论(0) 收藏 举报
今天在Java中想使用正则表达式来获取一段文本中的任意字符。
(.*) 

结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。

 

查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为正确的正则表达式匹配规则:

([\s\S]*)

来自 http://blog.csdn.net/nickyzhi/article/details/38712281


正则表达式匹配任意字符(包括换行符)的写法

今天在Java中想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则: 
(.*) 
结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。同时,手册上还有一句话:要匹配包括 '\n' 在内的任何字符,请使用像 '[.\n]' 的模式。于是我将正则表达式的匹配规则修改如下: 
([.\n]*),当然,如果是在java程序中直接写到话,需要改为([.\\n]*) 
结果再次运行程序,发现什么内容也取不到了。我百思不得其解,又将其修改为如下规则: 
([.|\n]*) 以及 ([\n.]*) 
结果还是不行,什么内容都取不到。看来点符号和换行符卯上劲了~ 
然后上网一查,虽然没有查出上述规则到底是什么地方出问题了,但是查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为正确的正则表达式匹配规则: 
([\s\S]*) 
同时,也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。 


在文本文件里, 这个表达式可以匹配所有的英文 
/[ -~]/ 
这个表达式可以匹配所有的非英文(比如中文) 
/[^ -~]/ 
/是VI里用的. 你在editplus或程序里不需要/ 

 
普通分类: