js正则表达式之前瞻后顾与非捕获分组

前瞻后顾与捕获分组的结合使用

在现实的应用场景中，捕获分组或非捕获分组通常被限制在前瞻后顾条件内，举例来说，对数字12345678格式化，结果为12,345,678。其正则实现如下：

let formatSum = '12345678'.replace(/\B(?=(?:\d{3})+(?!\d))/g, ',')

捕获分组与非捕获分组

为了理解前瞻与后顾，首先要先理解捕获分组与非捕获分组

在js中，

()表示捕获分组，() 会把每个分组里的匹配的值保存起来，使用$n(n是一个数字，表示第n个捕获组的内容)；

(?:)表示非捕获分组，和捕获分组唯一的区别在于，非捕获分组匹配的值不会保存起来。

以formatSum 表达式为例，(?=(?:\d{3})+(?!\d)) ，(?:\d{3}) ，(?!\d) 都是分组，其中第二个分组是非捕获分组。

前瞻、后顾与负前瞻、负后顾

在上述的formatSum表达式中，用到了 ‘?=‘与’?!’，这就是所谓的前瞻与负前瞻了。为了方便理解，我们以一个简单的例子入手。

// 前瞻：
A(?=B)   //查找B前面的A
// 后顾：
(?<=B)A   //查找B后面的A
// 负前瞻：
A(?!B)   //查找后面不是B的A
// 负后顾：
(?<!B)A   //查找前面不是B的A

回看formatSum表达式，将 (?:\d{3})+(?!\d) 视为一个整体表达式 A，即

formatSum = /\B(?=A)/g  //此处A为表示式并非真正字母A，只为方便理解

其意思是匹配表达式A前面的 \B ,而 \B 匹配的是非字母边界，所以可以看出该表达式整体的作用是用来匹配并替换表达式 A 前边的边界的。

与 \B 对应的还有 \b ，其匹配字母边界。对于初学者来说，边界的概念比较难以理解，你可以把它看作是无形的 | ,任何长度大于等于2的字符串中都存在边界。如 ‘ab’，它可以看作是’a|b’，只是此处 | 是无形的，当然它也就不计入字符串长度。

'ab'.replace(/\B/, ',')
//  a,b

接下来为了看表达式 A 部分： (?:\d{3})+(?!\d) 。

首先 ?: 表示非捕获分组，\d{3} 表示3位数字，则 (?:\d{3})+ 表示3、6、9、12…位数字；

(?!\d) 为负前瞻，表示匹配后面不是数字的 (?:\d{3})+ 。综上：

(?:\d{3})+(?!\d)  

匹配'12345678'中后面不是数字的3*n(n=1递增)位数字，即'678', '345678'

所以，得出结果：

formatSum = '12345678'.replace(/\B(?=(?:\d{3})+(?!\d))/g, ',')

匹配'12345678'中后面不是数字的3*n(n=1，n++)位数字前面的非字母边界，
即'678', '345678'前面的非字母边界，最终将这两个边界替换为逗号，
即 '3' 与 '6' 前加逗号

即

'12345678'.replace(/\B(?=(?:\d{3})+(?!\d))/g, ',')  === '12,345,678'
// true

总结

到此这篇关于js正则表达式之前瞻后顾与非捕获分组的文章就介绍到这了,更多相关js正则前瞻后顾与非捕获分组内容请搜索NICE源码以前的文章或继续浏览下面的相关文章希望大家以后多多支持NICE源码！

目录

前瞻后顾与捕获分组的结合使用

捕获分组与非捕获分组

前瞻、后顾与负前瞻、负后顾

总结

微信