正则表达式

正则表达式(regular expression)就是用一个“字符串”来描述一个特征,然后去验证另一个“字符串”是否符合这个特征。

语法

常用元字符

代码 说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束

常用限定符

代码 说明
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

常用反义词

代码 说明
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
[a-z] 字符a到z之间的字符
[ab] 字符ab中任意字符

实例

  1. 匹配连续出现的字母
    function containsRepeatingLetter(str) {
    //\1就是引用第一个分组
    return /([a-zA-Z])\1/.test(str);
    }

语法支持

正则表达式的语法支持:

命令或环境

.

[ ]

^

$

( )

{ }

?

+

|

( )

vi






     
Visual C++






     
awk





 
awk是支持该语法的,只是要在命令

行加入 –posix or –re-interval参数即可,可见

man awk中的interval expression





sed







    
delphi






 




python







java







√ √ [2] 
javascript






 




php






     
perl






 




C#