我要投稿

python 正则表达式反斜杠(/)的麻烦和陷阱

Nice 正则表达式

2022-05-13 0 237

要匹配字符串中1个反斜杠应该怎么写正则表达式？”\\”，这样行吗？试试就知道了，re模块抛异常了，因为”\\”就是一个反斜杠，对于正则表达式解析器来说，是一个转义字符，但是后面啥也没有，自然就报错了，”\\\”三个肯定是不行的，试试四个”\\\\”，完美匹配。

复制代码代码如下:

import re

re_str_patt = “\\\\”

reObj = re.compile(re_str_patt)

str_test = “abc\\cd\\hh”

print reObj.findall(str_test)

输出：[‘\\’, ‘\\’]

这里要这么理解，首先第一重转换是字符串自身的转义，那么”\\\\”，实际上就是表示两个反斜杠（两个字符），然后传入正则表达式解析器，因为反斜杠依然是转义字符，那么进行第二重转换，两个反斜杠就代表一个反斜杠，所以就能和一个反斜杠进行匹配了，那么匹配连续的两个反斜杠，写正则表达式时就要写8次”\”了，相当壮观，要匹配/d+(这个在正则表达式里面表示连续1一个以上的数字字符)这个字符串怎么写呢？

复制代码代码如下:

import re

re_str_patt = “\\\\d\\+”

print re_str_patt

reObj = re.compile(re_str_patt)

print reObj.findall(“\\d+”)

写成re_str_patt = “\\\\d\+”也行，因为\+对于字符串来说，没有转义意义，所以就当成一个反斜杠了。

在python中写正则表达式时用得最多的是raw字符串，原生字符串，什么意思？就是只有一重转换了，没有字符串转换了，只在正则表达式内部进行转换了，这样匹配一个反斜杠的正则表达式可以这样写，re_str_patt = r”\\”，有人会想，以后写windows的文件路径什么的方便了，呵呵直接 path = r”c:\myforder\xx” 搞定，是的，这句没有问题，但是如果你写成 path = r”c:\myforder\xx\”，直接报错了，为什么？因为反斜杠虽然不作为转义字符了，但是还是对它后面的引号（包括单引号）有影响，使这个引号不被视为字符串的终止，以为它后面还有字符，但是实际没有，因此会报错。其实可以反过来想raw字符串里面要表示引号怎么办呢？，可以发现 path = r”\\123\”xxx” 是可以的，那用raw字符串岂不是有局限性？不过raw在设计之初就是用来支持正则表达式的，而在正则里面反斜杠是转义字符，所以不可能出现在字符串的末尾的，所以建议不要图方便在其他的地方使用raw。

收藏 (0) 点赞 (0)

免责声明：
1、本网站所有发布的源码、软件和资料均为收集各大资源网站整理而来;仅限用于学习和研究目的,您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。不得使用于非法商业用途，不得违反国家法律。否则后果自负！

2、本站信息来自网络，版权争议与本站无关。一切关于该资源商业行为与www.niceym.com无关。
如果您喜欢该程序，请支持正版源码、软件，购买注册，得到更好的正版服务。
如有侵犯你版权的，请邮件与我们联系处理（邮箱:skknet@qq.com），本站将立即改正。

NICE源码网正则表达式 python 正则表达式反斜杠(/)的麻烦和陷阱 https://www.niceym.com/34725.html