• 正则表达式的语法解读
  • 发布于 2个月前
  • 300 热度
    0 评论
概述
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。

场景
用户注册时,都会用到密码正则校验。要写出正确的正则表达式,先要定义表达式规则。

方案1 (简单)
假设密码验证做如下规则定义:
1.最短6位,最长16位 {6,16}
2.可以包含小写大母 [a-z] 和大写字母 [A-Z]
3.可以包含数字 [0-9]
4.可以包含下划线 [ _ ] 和减号 [ - ]

根据以上规则,很容易给出正则字面量定义如下:
var pattern = /^[\w_-]{6,16}$/;
方案1分析
字面量 / /
正则表达式的字面量定义为包含在一对斜杠(/)之间的字符,例如:
var pattern = /s$/;
上述字面量匹配所有以字母“s”结尾的字符串。

字符类 [ ]
将字符放进方括号内就组成了字符类。一个字符类可以匹配它所包含的任意字符。因此,正则表达式/[abc]/就和字母“a”,“b”,“c”中的任意一个都匹配。字符类可以使用连字符来表示字符范围。要匹配拉丁小写字母可以使用/[a-z]/。

字符类 \w
字符类 \w 匹配任何ASCII字符组成的单词,等价于[a-zA-Z0-9]。
[\w_-]表示匹配任意的拉丁大小写字母,数字再加上下划线和减号。

重复 {}
在正则表达式中用{ }来表示元素重复出现的次数。
{n,m} 匹配前一项至少n次,但不能超过m次
{n,} 匹配前一项n次或更多次
{n} 匹配前一项n次

[\w_-]{6,16} 表示匹配任意的拉丁大小写字母,数字再加上下划线和减号出现最少6次,最多16次。

匹配位置
^ 匹配字符串的开头,在多行检索中,匹配一行的开头
$ 匹配字符串的结尾,在多行检索中,匹配一行的结尾
/^\w/ 匹配以大小写字母或数字开头的字符串。

方案1测试
给出测试结果如下:
var pattern = /^[\w_-]{6,16}$/;
pattern.test('123456') = true;
pattern.test('-ifat33') = true; 
pattern.test('42du') = false; 
pattern.test('du42du42du42du421') = false; 
pattern.test('42du42@') = false;
根据测试结果可以看出,方案1只是对密码做了简单的限定,不能保证密码的强度和帐号安全。

方案2 (安全)
假设密码验证做如下规则定义:
1.最短6位,最长16位 {6,16}
2.必须包含1个数字
3.必须包含2个小写字母
4.必须包含2个大写字母
5.必须包含1个特殊字符
根据以上规则,很容易给出正则字面量定义如下:
var pattern = /^.*(?=.{6,16})(?=.*\d)(?=.*[A-Z]{2,})(?=.*[a-z]{2,})(?=.*[!@#$%^&*?\(\)]).*$/;
方案2分析
字符类 .
字符类 . 表示除换行符和其他Unicode行终止符之外的任意字符。
正向先行断言 (?= )
在符号“(?=” 和 “)” 之间加入一个表达式,它就是一个先行断言,用以说明圆括号内的表达式必须正确匹配。比如:/Java(?=:)/ 只能匹配Java且后面有冒号的。
(?=.*[!@#$%^&*?\(\)])
该先行断言表示,必须包括一个特殊字符。上述表达式中的10个特殊字符为键盘1,2...0的上档键字符,也可以添加别的特殊字符。注意:如果添加字符是正则表达式中具有特殊含义的,需要在符号前加反斜线(\)转义。

方案2测试
给出测试结果如下:
var pattern = /^.*(?=.{6,16})(?=.*\d)(?=.*[A-Z]{2,})(?=.*[a-z]{2,})(?=.*[!@#$%^&*?\(\)]).*$/;
pattern.test('du42DU!') = true; 
pattern.test('duDUd!') = false;
pattern.test('42dud!') = false;
pattern.test('42DUD!') = false;
pattern.test('42duDU') = false;
pattern.test('42duU(') = false; 
pattern.test('42dUU!') = false;
从以上测试可以看出,密码足够强壮和安全。你可以根据项目需要,自己调整上述正则表达式。
用户评论