[]能够匹配所包含的一系列字符中的任意一个。需要注意的是,[]虽然能匹配其中的任意一个字符,但匹配的结果只能是一个字符,不是多个。
例如[abc]表示字符“a”或“b”或“c”。
[]支持用连字符“-”连接两个字符,来表示一个字符范围。需要注意的是,“-”前后的两个字符是有顺序的,即使用相同的编码时,后面的字符码位应大于或等于前面字符的码位。
例如[a-z]表示任意一个小写字母。而在程序中使用[z-a]则会报“[x-y] 范围的顺序颠倒”这样的异常。
大部分在正则中有特殊意义、在匹配其本身时需转义的字符,在[]内是不需要转义的。必须转义的只有“\”、“[”和“]”,而“^”出现在[]开始位置,“-”前后构成范围区间时,需要转义,出现在其它位置不需要转义,例如[\^.$^{\[(|)*+?-\\]
在.NET中,不构成歧义的情况下,“[”和“]”可以不用转义,程序也可以得到预期结果,但是这种写法可读性较差,而且出现错误时不易排查,因此不推荐这种写法
举例:Regex reg = new Regex("[^]]+"); //不推荐
.NET的字符组中支持集合减法,语法[set1-[set2]],例如[a-z-[aeiou]]表示除元音外的小写字母。但是除非你很了解这种语法的支持范围,以及确实有必要这样做,否则不要轻易使用这种可读性较差的语法。事实上完全可以用多个范围区间[b-df-hj-np-tv-z],在区间较多,导致可读性差、容易出错的情况下,可以使用正向预搜索来实现以上需求,(?![aeiou])[a-z],这种语法规则,支持范围要大得多,可读性也要好一些。
常见错误用法:
因为[]本身表示的就是字符之间“或”的关系,因此在[]中使用“|”来表示“或”的关系是错误的。
举例:[a|b|c]表示的是“a”或“b”或“c”或“|”中的任意一个字符。
举例
源字符串:ab|ac
正则表达式:[a|b|c]+
匹配结果:ab|ac
[^ ] 排除型字符组
[^ ]表示匹配任意一个未列举的字符,同样的,匹配的结果也只能是一个字符。
例如[^abc]表示除字符“a”、“b”、“c”外的任意一个字符。
[^ ]也支持字符分组,例如[^0-9]表示除数字外的任意一个字符。
新手最容易犯的错误就是,用[^abc]或[^(abc)]这样的表达式来匹配不包含“abc”子字符串的字符串。
举例
源字符串:string yourStr = "<aaa>bbb<abc>ccc<ddd>";
规则描述:取出yourStr中格式为<...>,但<>中不是abc的内容
预期结果:<aaa>、<ddd>
错误写法:<[^abc]*>
正确写法:<(?!abc>)[^>]*>
还有一点并不常见,\b在字符组外表示单词边界,但是在字符组内[\b]表示退格符。
相关推荐
正则表达式——字符组(Character Classes) [ ].rar
使用正则表达式拆分字符串,程序完全可以运行,方便大家开发和调试
Java根据正则表达式生成字符串,包括了Xeger和automaton
正则表达式特殊字符的转义,常用网页特殊字符转义,网络爬虫特殊字符处理
正则表达式需要转义的特殊字符 一定要注意书写规范。
正则表达 转义字符正则表达 转义字符正则表达 转义字符正则表达 转义字符正则表达 转义字符
正则表达式元字符-详细说明
VBA正则提取A字符串之后B字符串之前中间的内容.txt
java正则表达式替换字符串
其中包括5个类,这5个类的代码基本概括了java正则表达式替换String的多种情况,比如获取某个文件路径中盘符/后边的部分内容,提取"<title>XXXX</title>"中的文字XXXX,用正则表达式获取指定字符串内容中的指定内容,...
一个用于正则匹配检查的工具,用于使用正则表达式提取字符串!
正则表达式元字符表,可以作为查询工具使用,希望大家喜欢
正则表达式 正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。
string :需要进行正则处理的字符串 pattern :进行匹配的正则表达式 position :起始位置,从第几个字符开始正则表达式匹配(默认为1) occurrence :标识第几个匹配组,默认为1 modifier :模式(‘i’不区分大...
给写了2个方法,一个是直接截取单个需要的字符串,比如字符串string a="ab123456",我只需要提取3,那么就是单独截取就可以了,从2开始到4结束就行。 第二个是把所有的符合条件的字符串都截取出来,提取出来,比如...
正则表达式在。net下的转义符意义 正则表达式是正则表达式引擎尝试匹配输入文本的一种模式。 模式由一个或多个字符文本、运算符或构造组成
Java 正则表达式判断字符串是否包含中文
C#.net使用正则表达式拆分字符串 提供的测试源码,直接使用
java 利用正则表达式从字符串中提取省、市、区、镇、乡等区域名称(包含少数民族地区),支持地址中无省,无市,无县情况。