分享人:常雷雷
1.背景介绍
2.知识剖析
3.常见问题
4.解决方案
5.编码实战
6.扩展思考
7.参考文献
8.更多讨论
正则表达式一开始是研究人类神经系统工作原理的专家提出的概念,后来正则表达式被引入到计算搜索算法的早期研究中,然后又经过几十年的发展, 到现在正则表达式已经成为程序语言中不可分割的一部分。
如果你是一位接触计算机语言的工作者,那么你会在主流操作系统(*nix[Linux, Unix等]、Windows、HP、BeOS等)、主流的开发语言(delphi、Scala、PHP、C#、Java、C++、Objective-c、Swift、VB、Javascript、Ruby以及Python等)、数以亿万计的各种应用软件中,都可以看到正则表达式优美的舞姿。我们甚至可以说,现在几乎所有的编程语言都支持正则表达式,只是因为语言的不同而略有差异。
正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE).
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
通俗的讲就是按照某种规则去匹配符合条件的字符串,而正则表达式定义的就是匹配规则。
元字符
(* + ? $ ^ . | \ ( ) { } [ ])
字符类
\w 匹配任何单字符 [a-zA-Z0-9]
\W 匹配任何单字符以外的字符
\d 匹配任何单数字[0-9]
\D 匹配所有数字之外的字符
\s 匹配任何Unicode空白符
\S 匹配任何Unicode空白符之外的字符
[...] 匹配任何方括号之内的字符
[^...] 匹配任何方括号之外的字符
修饰符
1、g:global全文搜索,不添加,搜索到第一个匹配停止;
2、i:ignore case忽略大小写,默认大小写敏感;
3、m:multiple lines多行搜索。
重复:量词
?:出现零次或一次(最多出现一次);
+:出现一次或多次(至少出现一次);
*:出现零次或多次(任意次);
{n}:出现n次;
{n,m}:出现n到m次;
{n,}:至少出现n次。
反义 :[^]
分组:使用()可以达到分组的功能,使用量词作用于分组
字符转义:使用\可以达到字符转义的功能
分枝条件:使用|可以达到分支的功能,约等于java里面的或者
贪婪与懒惰:在量词后面加上?会变成非贪婪模式.
后向引用
零宽断言
负向零宽断言
处理选项
平衡组/递归匹配
1.读不懂正则表达式怎么办?
2.正则表达式在java中如何运用。
1.读不懂正则表达式怎么办?正则表达式可视化工具:http://regexper.com
正则表达式可视化工具:http://regexper.com
一般来说,正则表达式只是用来写的,基本上写完,完成预期的功能后,作者就已经不知道该怎么读自己写的正则表达式了。
2.正则表达式在java中如何运用。
java.util.regex 包主要包括以下三个类:
Pattern 类:
pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。
Matcher 类:
Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。
PatternSyntaxException:
PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。
让我们来看看这个例子的代码。
正则表达式这么强,我们应该怎么用? 数学的归数学,正则的归正则,分工明确。
链接:http://deerchao.net/tutorials/regex/regex.htm
作者:deerchao
链接:https://juejin.im/post/582dfcfda22b9d006b726d11
作者:水墨寒湘
感谢观看,如有出错,恳请指正
BY : 深圳分院 常雷雷