32-正则表达式
title: 32-正则表达式
publish: true
正则表达式简介
定义:正则表达式用于定义一些字符串的规则。
作用:计算机可以根据正则表达式,来检查一个字符串是否符合指定的规则;或者将字符串中符合规则的内容提取出来。
如果你想查看正则更多的内容,可以查阅官方文档关于 RegExp 这个内置对象的用法。
创建正则表达式的对象
方式一:使用构造函数创建正则表达式的对象
语法:
var 变量 = new RegExp("正则表达式"); // 注意,参数是字符串 |
备注:RegExp
的意思是 Regular expression。使用typeof检查正则对象,会返回object。
上面的语法中,既可以传一个参数,也可以传两个参数。
创建了正则表达式的对象后,该怎么使用呢?大致分为两个步骤:
(1)创建正则表达式的对象 reg。
(2)使用 reg 的test() 方法,判断指定字符串是否符合规则。
正则表达式的test()
方法:【重要】
myReg.test(str); // 判断字符串 str 是否符合 指定的 myReg 这个正则表达式的规则 |
解释:使用test()
这个方法可以用来检查一个字符串是否符合正则表达式的规则,如果符合则返回true,否则返回false。
我们来看看下面的例子。
1、传一个参数时:
构造函数 RegExp 中,可以只传一个参数。
代码举例:
var reg = new RegExp("a"); // 定义一个正则表达式:检查一个字符串中是否含有 a |
注意,上面的例子中,我们是先定义了一个正则表达式的规则,然后通过正则表达式的test()
方法来判断字符串是否符合之前定义的规则。
2、传两个参数时:匹配模式 【重要】
构造函数 RegExp 中,也可以传两个参数。我们可以传递一个匹配模式作为第二个参数。这个参数可以是:
i
忽略大小写。这里的 i 指的是 ignore。g
全局匹配模式。这里的 g 指的是 global。
代码举例:
var reg = new RegExp('A', 'i'); |
方式二:使用字面量创建正则表达式
我们可以使用字面量来创建正则表达式。
语法:
var 变量 = /正则表达式/; // 注意,这个语法里没有引号 |
代码举例:
var reg = /A/i; // 定义正则表达式的规则:检查一个字符串中是否含有 a。忽略大小写。 |
以上两种方式的对比
方式一:使用构造函数创建时,更加灵活,因为参数中还可以传递变量。
方式二:使用字面量的方式创建,更加简单。
代码举例:
var reg = new RegExp("a", "i"); // 方式一 |
上面这两行代码的作用是等价的。
避坑指南:全局匹配 g 慎用test()方法
对于非全局匹配的正则表达式,test()
只会检测是否存在某个目标字符串(只要存在就为 true),多次检测的结果都相同。例如:
const reg = /test/; |
重点来了。
当设置全局标志 /g
时,一旦字符串中还存在匹配,test() 方法都将返回 true,同时匹配成功后将把 lastIndex
属性的值设置为上次匹配成功结果之后的第一个字符所在的位置,下次匹配将从 lastIndex
指示的位置开始;匹配不成功时返回 false,同时将 lastIndex 属性的值重置为 0。
举例:(很重要的例子,看仔细)
const reg = /test/g; |
总结:
全局匹配模式g
一般用于 exec()
、match()
、replace()
等方法。
全局匹配模式g
如果用于test()方法会有问题。因为g模式会生成一个lastindex
参数来存储匹配最后一次的位置。
参考链接:
正则表达式的简单语法
检查一个字符串中是否包含 a或b
写法1:
var reg = /a|b/; |
解释:使用 |
表示或
的意思。
写法2:
var reg = /[ab]/; // 跟上面的那行语法,是等价的 |
解释:这里的[]
也是表示或
的意思。
[]
这个符号在正则还是比较常用的。我们接下来看几个例子。
[]表示:或
一些规则:
/[ab]/
等价于/a|b/
:检查一个字符串中是否包含 a或b/[a-z]/
:检查一个字符串那种是否包含任意小写字母/[A-Z]/
:任意大写字母/[A-z]/
:任意字母/[0-9]/
:任意数字/a[bde]c/
:检查一个字符串中是否包含 abc 或 adc 或 aec
[^ ] 表示:除了
举例1:
var reg = /[^ab]/; // 规则:字符串中,除了a、b之外,还有没有其他的字符内容? |
举例2:(可以用来验证某字符串是否为 纯数字)
var reg = /[^0-9]/; // 规则:字符串中,除了数字之外,还有没有其他的内容? |
支持正则表达式的 String 对象的方法
String对象的如下方法,是支持正则表达式的:
方法 | 描述 | 备注 |
---|---|---|
split() | 将字符串拆分成数组 | |
search() | 搜索字符串中是否含有指定内容,返回索引 index | |
match() | 根据正则表达式,从一个字符串中将符合条件的内容提取出来 | |
replace() | 将字符串中的指定内容,替换为新的内容并返回 |
下面来分别介绍和举例。
split()
split()
:将一个字符串拆分成一个数组。可以接受一个正则表达式作为参数。
备注:关于split()
更详细的用法,可以看之前的关于《内置对象:String》这篇文章。
正则相关的举例:根据任意字母,将字符串拆分成数组。
代码实现:(通过正则)
var str = "1a2b3c4d5e6f7g"; |
打印结果:
["1", "2", "3", "4", "5", "6", "7", ""] |
search()
search()
:搜索字符串中是否含有指定内容。如果搜索到指定内容,则会返回第一次出现的索引;否则返回-1。
search()
方法可以接受一个正则表达式作为参数,然后会根据正则表达式去检索字符串。serach()
只会查找第一个,即使设置全局匹配也没用。
举例:
var str = "hello abc hello aec afc"; |
match()
match()
:根据正则表达式,从一个字符串中将符合条件的内容提取出来,封装到一个数组中返回(即使只查询到一个结果)。
注意:默认情况下,match()
方法只会找到第一个符合要求的内容,找到以后就停止检索。我们可以设置正则表达式为全局匹配模式,这样就会匹配到所有的内容,并以数组的形式返回。
另外,我们可以为一个正则表达式设置多个匹配模式,且匹配模式的顺序无所谓。
代码举例:
var str = "1a2a3a4a5e6f7A8B9C"; |
总结:
match()这个方法还是很实用的,可以在一个很长的字符串中,提取出有规则的内容。这不就是爬虫的时候经常会遇到的场景么?
replace()
replace()
:将字符串中的指定内容,替换为新的内容并返回。不会修改原字符串。
语法:
新的字符串 = str.replace(被替换的内容,新的内容); |
参数解释:
被替换的内容:可以接受一个正则表达式作为参数。
新的内容:默认只会替换第一个。如果需要替换全部符合条件的内容,可以设置正则表达式为全局匹配模式。
代码举例:
//replace()方法:替换 |
常见正则表达式举例
检查一个字符串是否是一个合法手机号
手机号的规则:
以1开头(
^1
表示1开头 ,[^1]
表示非1或除了1)第二位是3~9之间任意数字
三位以后任意9位数字
正则实现:
var phoneStr = "13067890123"; |
备注:如果在正则表达式中同时使用^
和$
符号,则要求字符串必须完全符合正则表达式。
去掉字符串开头和结尾的空格
正则实现:
str = str.replace(/^\s*|\s*$/g,""); |
解释如下:
str = str.replace(/^\s*/, ""); //去除开头的空格 |
判断字符串是否为电子邮件
正则实现:
var emailReg = /^\w{3,}(\.\w+)*@[A-z0-9]+(\.[A-z]{2,5}){1,2}$/; |
我的公众号
想学习更多技能?不妨关注我的微信公众号:千古壹号(id:qianguyihao
)。
扫一扫,你将发现另一个全新的世界,而这将是一场美丽的意外: