shell符号、正则表达式

Shell符号及各种解释对照如下：

特殊符号（#）

注释符号(Hashmark[Comments])

1.在shell文件的行首，作为shebang标记，#!/bin/bash;

2. 其他地方作为注释使用，在一行中，#后面的内容并不会被执行，除非；

3. 但是用单/双引号包围时，#作为#号字符本身，不具有注释作用。

特殊符号（;）

作为多语句的分隔符(Command separator [semicolon])。

多个语句要放在同一行的时候，可以使用分号分隔。注意，有时候分号需要转义。

特殊符号（;;）

连续分号(Terminator [double semicolon])。

在使用case选项的时候，作为每个选项的终结符。在Bash version 4+ 的时候，还可以使用[;;&], [;&]

特殊符号（.）

点号(dot command [period])。

1. 相当于bash内建命令source，如：

#!/bin/bash . data-file #包含data-file;

2. 作为文件名的一部分，在文件名的开头，表示该文件为隐藏文件，ls一般不显示出来（ls -a 可以显示）；

3. 作为目录名，一个点代表当前目录，两个点号代表上层目录（当前目录的父目录）。注意，两个以上的点不出现，除非你用引号（单/双）包围作为点号字符本身；

4. 正则表达式中，点号表示任意一个字符。

特殊符号（"）

双引号（partial quoting [double quote]）。

部分引用。双引号包围的内容可以允许变量扩展，也允许转义字符的存在。如果字符串内出现双引号本身，需要转义，因此不一定双引号是成对的。\

特殊符号（'）

单引号(full quoting [single quote])。

单引号括住的内容，被视为单一字符串，引号内的禁止变量扩展，所有字符均作为字符本身处理（除单引号本身之外），单引号必须成对出现。

特殊符号（,）

逗号(comma operator [comma])。

1. 用在连接一连串的数学表达式中，这串数学表达式均被求值，但只有最后一个求值结果被返回。如：

#!/bin/bash let t1=((a=5+1, b=7+2)) echo t1=$t1, a=$a, b=$b ## 这个$t1=$b；

2. 用于参数替代中，表示首字母小写，如果是两个逗号，则表示全部小写，注意，这个特性在bash version 4的时候被添加的。例子：

a="ATest" echo ${a,} echo ${a,,} ## 前面输出aTest，后面输出的是atest。

特殊符号（\）

反斜线，反斜杆(escape [backslash])。

1. 放在特殊符号之前，转义特殊符号的作用，仅表示特殊符号本身，这在字符串中常用；

2. 放在一行指令的最末端，表示紧接着的回车无效（其实也就是转义了Enter），后继新行的输入仍然作为当前指令的一部分。

特殊符号（/）

斜线，斜杆（Filename path separator [forward slash]）。

1.作为路径的分隔符，路径中仅有一个斜杆表示根目录，以斜杆开头的路径表示从根目录开始的路径；

2.在作为运算符的时候，表示除法符号。如：a=4/2

特殊符号（`）

反引号，后引号（Command substitution[backquotes])。

命令替换。这个引号包围的为命令，可以执行包围的命令，并将执行的结果赋值给变量。如：a=`dirname '/tmp/x.log'` 。

后面dirname返回的结果会赋值给a，注意，此处Mitchell特地使用了反引号和单引号，注意区别。

特殊符号（:）

冒号(null command [colon])。

空命令，这个命令什么都不做，但是有返回值，返回值为0（即：true）。这个命令的作用非常奇妙。

1. 可做while死循环的条件；

2. 在if分支中作为占位符（即某一分支什么都不做的时候）；

3. 放在必须要有两元操作的地方作为分隔符，如：: ${username=`whoami`}

4. 在参数替换中为字符串变量赋值，在重定向操作(>)中，把一个文件长度截断为0（:>>这样用的时候，目标存在则什么都不做），这个只能在普通文件中使用，不能在管道，符号链接和其他特殊文件中使用；

5. 甚至你可以用来注释（#后的内容不会被检查，但:后的内容会被检查，如果有语句如果出现语法错误，则会报错）；

6. 你也可以作为域分隔符，比如环境变量$PATH中，或者passwd中，都有冒号的作为域分隔符的存在；

7. 你也可以将冒号作为函数名，不过这个会将冒号的本来意义转变（如果你不小心作为函数名，你可以使用unset -f : 来取消function的定义）。

特殊符号（!）

感叹号（reverse (or negate) [bang],[exclamation mark])。

取反一个测试结果或退出状态。

1. 表示反逻辑，比如后面的!=,这个是表示不等于；

2. 表示取反，如：ls a[!0-9] #表示a后面不是紧接一个数字的文件；

3. 在不同的环境里面，感叹号也可以出现在间接变量引用里面；

4. 在命令行中，可以用于历史命令机制的调用，你可以试试!$,!#，或者!-3看看，不过要注意，这点特性不能在脚本文件里面使用（被禁用）。

特殊符号（*）

星号（wildcard/arithmetic operator[asterisk])。

1. 作为匹配文件名扩展的一个通配符，能自动匹配给定目录下的每一个文件；

2. 正则表达式中可以作为字符限定符，表示其前面的匹配规则匹配任意次；

3. 算术运算中表示乘法。

特殊符号（**）

双星号(double asterisk)。算术运算中表示求幂运算。

特殊符号（?）

问号（test operator/wildcard[Question mark])。

1. 表示条件测试；

2. 在双括号内表示C风格的三元操作符((condition?true-result:false-result))；

3. 参数替换表达式中用来测试一个变量是否设置了值；

4. 作为通配符，用于匹配文件名扩展特性中，用于匹配单个字符；

5. 正则表达式中，表示匹配其前面规则0次或者1次。

特殊符号（$）

美元符号(Variable substitution[Dollar sign])。

1. 作为变量的前导符，用作变量替换，即引用一个变量的内容，比如：echo $PATH；

2. 在正则表达式中被定义为行末（End of line）。

特殊符号（${}）

参数替换(Variable substitution)。

用于在字符串中表示变量。

特殊符号（$‘...’）

引用内容展开，执行单引号内的转义内容（单引号原本是原样引用的），这种方式会将引号内的一个或者多个[\]转义后的八进制，十六进制值展开到ASCII或Unicode字符。

特殊符号（$*或$@）

位置参数(Positional Parameters)。

这个在使用脚本文件的时候，在传递参数的时候会用到。两者都能返回调用脚本文件的所有参数，但$*是将所有参数作为一个整体返回（字符串），而$@是将每个参数作为单元返回一个参数列表。注意，在使用的时候需要用双引号将$*,$@括住。这两个变量受到$IFS的影响，如果在实际应用中，要考虑其中的一些细节。

特殊符号（$#）

表示传递给脚本的参数数量。

特殊符号（$?）

此变量值在使用的时候，返回的是最后一个命令、函数、或脚本的退出状态码值，如果没有错误则是0，如果为非0，则表示在此之前的最后一次执行有错误。

特殊符号（$$）

进程ID变量，这个变量保存了运行当前脚本的进程ID值。

特殊符号（()）

圆括号(parentheses)。

1，命令组（Command group）。由一组圆括号括起来的命令是命令组，命令组中的命令实在子shell（subshell）中执行。因为是在子shell内运行，因此在括号外面是没有办法获取括号内变量的值，但反过来，命令组内是可以获取到外面的值，这点有点像局部变量和全局变量的关系，在实作中，如果碰到要cd到子目录操作，并在操作完成后要返回到当前目录的时候，可以考虑使用subshell来处理；

2. 用于数组的初始化。

特殊符号（{x,y,z,...}）

花括号扩展(Brace Expansion)。

在命令中可以用这种扩展来扩展参数列表，命令将会依照列表中的括号分隔开的模式进行匹配扩展。注意的一点是，这花括号扩展中不能有空格存在，如果确实有必要空格，则必须被转义或者使用引号来引用。例子：echo {a,b,c}-{\ d," e",' f'}

特殊符号（{a..z}）

在Bash version 3时添加了这种花括号扩展的扩展，可以使用{A..Z}表示A-Z的所有字符列表，这种方式的扩展Mitchell测试了一下，好像仅适用于A-Z，a-z，还有数字{最小..最大}的这种方式扩展。

特殊符号（{}）

代码块(curly brackets)。

这个是匿名函数，但是又与函数不同，在代码块里面的变量在代码块后面仍能访问。注意：花括号内侧需要有空格与语句分隔。另外，在xargs -i中的话，还可以作为文本的占位符，用以标记输出文本的位置。

特殊符号（{} \;）

这个{}是表示路径名，这个并不是shell内建的，现在接触到的情况看，好像只用在find命令里。注意后面的分号，这个是结束find命令中-exec选项的命令序列，在实际使用的时候，要转义一下以免被shell理解错误。

特殊符号（[]）

中括号（brackets）。

1. 测试的表示，Shell会测试在[]内的表达式，需要注意的是，[]是Shell内建的测试的一部分，而非使用外部命令/usr/bin/test的链接；

2. 在数组的上下文中，表示数组元素，方括号内填上数组元素的位置就能获得对应位置的内容，如：

Array[1]=xxx echo ${Array[1]};

3. 表示字符集的范围，在正表达式中，方括号表示该位置可以匹配的字符集范围。

特殊符号（[[]]）

双中括号(double brackets)。

这个结构也是测试，测试[[]]之中的表达式(Shell的关键字)。这个比单中括号更能防止脚本里面的逻辑错误，比如：&&,||,<,>操作符能在一个[[]]里面测试通过，但是在[]却不能通过。[[]]里面没有文件名扩展(filename expansion）或是词分隔符(Word splitting)，但是可以用参数扩展(Parameter expansion)和命令替换(command substitution)。不用文件名通配符和像空白这样的分隔符。注意，这里面如果出现了八进制，十六进制等，shell会自动执行转换比较。

特殊符号（$[...]）

词表达表示整数扩展(integer expansion)。

在方括号里面执行整数表达式。例：

a=3 b=7 echo $[$a+$b] echo $[$a*$b] ##返回是10和21

特殊符号（(())）

双括号(double parentheses)。

表示整数扩展（integer expansion）。功能和上面的$[]差不多，但是需要注意的是，$[]是会返回里面表达式的值的，而(())只是执行，并不会返回值。两者执行后如果变量值发生变化，都会影响到后继代码的运行。可对变量赋值，可以对变量进行一目操作符操作，也可以是二目，三目操作符。

特殊符号（> ， &< ，>&，>>，<，<> ）

重定向(redirection)。

scriptname >filename 重定向scriptname的输出到文件filename中去，如果文件存在则覆盖；

command &>filename 重定向command的标准输出(stdout)和标准错误(stderr)到文件filename中；

command >&2 把command的标准输出(stdout)重定向到标准错误(stderr)中；

scriptname >>filename 把scriptname的输出（同>)追加到文件filenmae中，如果文件不存在则创建。

[i]<>filename 打开filename这个文件用来读或者写，并且给文件指定i为它的文件描述符(file descriptor)，文件不存在就会创建。

特殊符号（(command)>，<(command) ）

这是进程替换(Process Substitution)。

使用的时候注意，括号和<,>之间是不能有空格的，否则报错。其作用有点类似通道，但和管道在用法上又有些不同，管道是作为子进程的方式来运行的，这个命令会在/dev/fd/下面产生类似/dev/fd/63,/dev/fd/62这类临时文件，用来传递数据。

Mitchell个人猜测之所以用这种方法来传递，是因为前后两个不属于同一个进程，因此需要用共享文件的方式来传递资料(这么说其实管道也应该有同样的文件?)。网上有人说这个只是共享文件而已，但是经过测试，发现虽然有/dev/fd/63这样的文件产生，但是这个文件其实是指向pipe:[43434]这样的通道的链接。

特殊符号（<<）

双小于号(here-document[double less then marks])。

这个也被称为Here-document，用来将后继的内容重定向到左侧命令的stdin中。<<可以节省格式化时间，别且使命令执行的处理更容易。在实作的时候只需要输入<<和终止标志符，而后（一般是回车后）你就可以输入任何内容，只要在最后的新行中输入终止标志符，即可完成数据的导入。使用here-document的时候，你可以保留空格，换行等。如果要让shell脚本更整洁一点，可以在<<和终止符之间放上一个连字符(-)。

特殊符号（<<<）

三个小于号(here-strings)。Here-字串和Here-document类似，here-strings语法：command [args] <<<["]$word["]；$word会展开并作为command的stdin。

特殊符号（>, <）

小于，大于号(ASCII Comparison)。

ASCII比较，进行的是变量的ASCII比较，字串？数字?呃...这个...不就是ASCII比较么？

特殊符号（\<...\>）

词界符(word boundary)。

这个是用在正则表达式中的一个特殊分隔符，用来标记单词的分界。比如：the会匹配there，another，them等等，如果仅仅要匹配the，就可以使用这个词界符，\<the\>就只能匹配the了。

特殊符号（|）

管道(pipe)。管道是Linux，Unix都有的概念，是非常基础，也是非常重要的一个概念。它的作用是将管道前（左边）的命令产生的输出(stdout)作为管道后（右边）的命令的输入(stdin)。如：ls | wc l，使用管道就可以将命令连接在一起。注意：管道是每一个进程的标准输出都会作为下一个命令的标准输入，期间的标准输出不能跨越管道作为后继命令的标准输入，如： cat filename | ls -al | sort 。想想这个的输出? 同时，管道是以子进程来运行的，所以管道并不能引起变量改变。

特殊符号（>|）

强制重定向(force redirection)。

这会强制重写已经存在的文件。

特殊符号（&）

与号(Run job in background[ampersand])。

如果命令后面跟上一个&符号，这个命令将会在后台运行。有的时候，脚本中在一条在后台运行的命令可能会引起脚本挂起，等待输入，出现这种情况可以在原有的脚本后面使用wait命令来修复。

特殊符号（&&，||）

逻辑操作符(logical operator)。

在测试结构中，可以用这两个操作符来进行连接两个逻辑值。||是当测试条件有一个为真时返回0（真），全假为假；&&是当测试条件两个都为真时返回真(0)，有假为假。

特殊符号（-）

减号，连字符(Hyphen/minus/dash)。

1. 作为选项，前缀[option, prefix]使用。用于命令或者过滤器的选项标志；操作符的前缀。如：

## COMMAND -[选项列表] ls -al sort -dfu $file set -- $variable if [ $file -ot $file2 ] then echo "$file is older than $file2." fi

2. 用于stdin或者stdout的重定向的源或目的[dash].在tar没有bunzip2的程序补丁时，我们可以这样： bunzip2 linux-2.6.13.tar.bz2 | tar xvf - 。将前面解压的数据作为tar的标准输入（这里使用一个-表示）

注意：在实作的时候，如果文件名是以[-]开头的，那么在加上这个作为定向操作符的时候，可能会出错，此时应该为文件加上合适的前缀路径，以避免这种情况发生，同样的，在echo变量的时候，如果变量是以[-]开始，那么可能也会产生意想不到的结果，为了保险起见，可以使用双引号引用标量：

var="-n" echo $var ## 试试看有什么输出？

还有，这种表示方法不是Bash内建的，要达到此点的这种效果，需要看你使用的软件是否支持这种操作；

3. 表示先前的工作目录(previous working directory)，因此，如果你cd到其他目录下要放回前一个路径的时候，可以使用cd -来达到目的，其实，这里的[-]使用的是环境变量的$OLDPWD，注意：这里的[-]和前一点是不同的；

4. 减号或者负号，用在算术操作中。

特殊符号（=）

等号(Equals)。

1. 赋值操作，给变量赋值，么有空格在等号两侧；

2. 在比较测试中作为比较符出现，这里要注意，如果在中括号中作为比较出现，需要有空格符在等号左右两侧。

特殊符号（+）

加号(Plus)。

1. 算术操作符，表示加法；

2. 在正则表达式中，表示的是其前的这个匹配规则匹配最少一次;

3.在命令或过滤器中作为选项标记，在某些命令或者内置命令中使用+来启用某些选项，使用-来禁止；

4. 在参数替换(parameter substitution)中，+前缀表示替代值(当变量为空的时候，使用+后面的值)

特殊符号（%）

百分号(modulo[percent sign])。

1.在算术运算中，这个是求模操作符，即两个数进行除法运算后的余数；

2. 在参数替换(parameter substitution)中，可以作为模式匹配。例子：

p=b*9 var="abcd12345abc479" echo ${var%p}, ${var%%p} ##从右边开始查找(想想从左是那个符号?) ##任何在b和9之间的内容（含） ##第一个是找到最短的符合匹配项 ##后一个是找最大符合的匹配项（贪婪匹配?)

特殊符号（~）

波浪号(Home directory[tilde])。

这个和内部变量$HOME是一样的。默认表示当前用户的家目录（主目录），这个和~/效果一致，如果波浪号后面跟用户名，表示是该用户的家目录。

特殊符号（~+）

当前的工作目录(current working directory)。

这个和内置变量$PWD一样。

特殊符号（~-）

前一个工作目录(previous working directory)。

这个和内部变量$OLDPWD一致，之前的[-]也一样。

特殊符号（=~）

Bash 版本3中有介绍，这个是正则表达式匹配。可用在[[]]测试中，比如：

var="this is a test message." [[ "$var" =~ tf*message ]] && echo "Sir. Found that." || echo "Sorry Sir. No match be found." ##你可以修改中间的正则表达式匹配项，正则表达式可以但不一定需要使用双引号括起来。

特殊符号（^）

脱字符(caret)。

1. 在正则表达式中，作为一行的行首(beginning-of-line)位置标志符；

2. 在参数替换(Parameter substitution)中，这个用法有两种，一个脱字符(${var^})，或两个(${var^^})，分别表示第一个字母大写，全部大写的意思(Bash version >=4)。

特殊符号（空白）

空白符(Whitespace)。

空白符不仅仅是指空格(spaces)，还包括制表符(tabs)，空行(blank lines)，或者这几种的组合。可用做函数的分隔符,分隔命令或变量，空行不会影响脚本的行为，因此可以用它来规划脚本代码，以增加可读性，在内置的特殊变量$IFS可以用来针对某些命令进行输入的参数进行分割，其默认就是空白符。在字符串或变量中如果有空白符，可以使用引号来规避可能的错误。

常用正则表达式

用户名	/^[a-z0-9_-]{3,16}$/
密码	/^[a-z0-9_-]{6,18}$/
密码2	(?=^.{8,}$)(?=.\d)(?=.\W+)(?=.[A-Z])(?=.[a-z])(?!.\n).$ (由数字/大写字母/小写字母/标点符号组成，四种都必有，8位以上)
十六进制值	/^#?([a-f0-9]{6}\|[a-f0-9]{3})$/
电子邮箱	/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/ /^[a-z\d]+(\.[a-z\d]+)@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$/或\w+([-+.]\w+)@\w+([-.]\w+)\.\w+([-.]\w+)
URL	/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-])\/?$/ 或 [a-zA-z]+://[^\s]*
IP 地址	/((2[0-4]\d\|25[0-5]\|[01]?\d\d?)\.){3}(2[0-4]\d\|25[0-5]\|[01]?\d\d?)/ /^(?:(?:25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)$/ 或 ((2[0-4]\d\|25[0-5]\|[01]?\d\d?)\.){3}(2[0-4]\d\|25[0-5]\|[01]?\d\d?)
HTML 标签	/^<([a-z]+)([^<]+)(?:>(.)<\/\1>\|\s+\/>)$/或<(.)(.)>.<\/\1>\|<(.) \/>
删除代码\\注释	(?<!http:\|\S)//.*$
匹配双字节字符(包括汉字在内)	[^\x00-\xff]
汉字(字符)	[\u4e00-\u9fa5]
Unicode编码中的汉字范围	/^[\u2E80-\u9FFF]+$/
中文及全角标点符号(字符)	[\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]
日期(年-月-日)	(\d{4}\|\d{2})-((0?([1-9]))\|(1[1\|2]))-((0?[1-9])\|([12]([1-9]))\|(3[0\|1]))
日期(月/日/年)	((0?[1-9]{1})\|(1[1\|2]))/(0?[1-9]\|([12][1-9])\|(3[0\|1]))/(\d{4}\|\d{2})
时间(小时:分钟, 24小时制)	((1\|0?)[0-9]\|2[0-3]):([0-5][0-9])
中国大陆固定电话号码	(\d{4}-\|\d{3}-)?(\d{8}\|\d{7})
中国大陆手机号码	1\d{10}
中国大陆邮政编码	[1-9]\d{5}
中国大陆身份证号(15位或18位)	\d{15}(\d\d[0-9xX])?
非负整数(正整数或零)	\d+
正整数	[0-9][1-9][0-9]
负整数	-[0-9][1-9][0-9]
整数	-?\d+
小数	(-?\d+)(\.\d+)?
空白行	\n\s\r 或者 \n\n(editplus) 或者 ^[\s\S ]\n
QQ号码	[1-9]\d{4,}
不包含abc的单词	\b((?!abc)\w)+\b
匹配首尾空白字符	^\s\|\s$
编辑常用	以下是针对特殊中文的一些替换(editplus) ^[0-9].\n ^[^第].\n ^[习题].\n ^[\s\S ]\n ^[0-9]\. ^[\s\S ]\n <p[^<>]> href="javascript:if$confirm\('(.?)'$\)window\.location='(.?)'" <span style=".[^"]rgb$255,255,255$">.[^<>]</span> <DIV class=xs0>[\s\S]?</DIV>

正则表达式速查表

字符	描述
\	将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如，“n"匹配字符"n"。"\n"匹配一个换行符。串行"\\"匹配"\"而"\("则匹配"("。
^	匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性，^也匹配“\n"或"\r"之后的位置。
$	匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性，$也匹配“\n"或"\r"之前的位置。
*	匹配前面的子表达式零次或多次。例如，zo能匹配“z"以及"zoo"。等价于{0,}。
+	匹配前面的子表达式一次或多次。例如，“zo+"能匹配"zo"以及"zoo"，但不能匹配"z"。+等价于{1,}。
?	匹配前面的子表达式零次或一次。例如，“do(es)?"可以匹配"does"或"does"中的"do"。?等价于{0,1}。
{n}	n是一个非负整数。匹配确定的n次。例如，“o{2}"不能匹配"Bob"中的"o"，但是能匹配"food"中的两个o。
{n,}	n是一个非负整数。至少匹配n次。例如，“o{2,}"不能匹配"Bob"中的"o"，但能匹配"foooood"中的所有o。"o{1,}"等价于"o+"。"o{0,}"则等价于"o*"。
{n,m}	m和n均为非负整数，其中n<=m。最少匹配n次且最多匹配m次。例如，“o{1,3}"将匹配"fooooood"中的前三个o。"o{0,1}"等价于"o?"。请注意在逗号和两个数之间不能有空格。
?	当该字符紧跟在任何一个其他限制符（*,+,?，{n}，{n,}，{n,m}）后面时，匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串，而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如，对于字符串“oooo"，"o+?"将匹配单个"o"，而"o+"将匹配所有"o"。
.	匹配除“\n"之外的任何单个字符。要匹配包括"\n"在内的任何字符，请使用像"(.\|\n)"的模式。
(pattern)	匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到，在VBScript中使用SubMatches集合，在JScript中则使用$0…$9属性。要匹配圆括号字符，请使用“$"或"$"。
(?:pattern)	匹配pattern但不获取匹配结果，也就是说这是一个非获取匹配，不进行存储供以后使用。这在使用或字符“(\|)"来组合一个模式的各个部分是很有用。例如"industr(?:y\|ies)"就是一个比"industry\|industries"更简略的表达式。
(?=pattern)	正向肯定预查，在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，“Windows(?=95\|98\|NT\|2000)"能匹配"Windows2000"中的"Windows"，但不能匹配"Windows3.1"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。
(?!pattern)	正向否定预查，在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如“Windows(?!95\|98\|NT\|2000)"能匹配"Windows3.1"中的"Windows"，但不能匹配"Windows2000"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始
(?<=pattern)	反向肯定预查，与正向肯定预查类拟，只是方向相反。例如，“(?<=95\|98\|NT\|2000)Windows"能匹配"2000Windows"中的"Windows"，但不能匹配"3.1Windows"中的"Windows"。
(?<!pattern)	反向否定预查，与正向否定预查类拟，只是方向相反。例如“(?<!95\|98\|NT\|2000)Windows"能匹配"3.1Windows"中的"Windows"，但不能匹配"2000Windows"中的"Windows"。
x\|y	匹配x或y。例如，“z\|food"能匹配"z"或"food"。"(z\|f)ood"则匹配"zood"或"food"。
[xyz]	字符集合。匹配所包含的任意一个字符。例如，“[abc]"可以匹配"plain"中的"a"。
[^xyz]	负值字符集合。匹配未包含的任意字符。例如，“[^abc]"可以匹配"plain"中的"p"。
[a-z]	字符范围。匹配指定范围内的任意字符。例如，“[a-z]"可以匹配"a"到"z"范围内的任意小写字母字符。
[^a-z]	负值字符范围。匹配任何不在指定范围内的任意字符。例如，“[^a-z]"可以匹配任何不在"a"到"z"范围内的任意字符。
\b	匹配一个单词边界，也就是指单词和空格间的位置。例如，“er\b"可以匹配"never"中的"er"，但不能匹配"verb"中的"er"。
\B	匹配非单词边界。“er\B"能匹配"verb"中的"er"，但不能匹配"never"中的"er"。
\cx	匹配由x指明的控制字符。例如，\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则，将c视为一个原义的“c"字符。
\d	匹配一个数字字符。等价于[0-9]。
\D	匹配一个非数字字符。等价于[^0-9]。
\f	匹配一个换页符。等价于\x0c和\cL。
\n	匹配一个换行符。等价于\x0a和\cJ。
\r	匹配一个回车符。等价于\x0d和\cM。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
\S	匹配任何非空白字符。等价于[^ \f\n\r\t\v]。
\t	匹配一个制表符。等价于\x09和\cI。
\v	匹配一个垂直制表符。等价于\x0b和\cK。
\w	匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]"。
\W	匹配任何非单词字符。等价于“[^A-Za-z0-9_]"。
\xn	匹配n，其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如，“\x41"匹配"A"。"\x041"则等价于"\x04&1"。正则表达式中可以使用ASCII编码。.
\num	匹配num，其中num是一个正整数。对所获取的匹配的引用。例如，“(.)\1"匹配两个连续的相同字符。
\n	标识一个八进制转义值或一个向后引用。如果\n之前至少n个获取的子表达式，则n为向后引用。否则，如果n为八进制数字（0-7），则n为一个八进制转义值。
\nm	标识一个八进制转义值或一个向后引用。如果\nm之前至少有nm个获得子表达式，则nm为向后引用。如果\nm之前至少有n个获取，则n为一个后跟文字m的向后引用。如果前面的条件都不满足，若n和m均为八进制数字（0-7），则\nm将匹配八进制转义值nm。
\nml	如果n为八进制数字（0-3），且m和l均为八进制数字（0-7），则匹配八进制转义值nml。
\un	匹配n，其中n是一个用四个十六进制数字表示的Unicode字符。例如，\u00A9匹配版权符号（©）。