【js-5】如何使用正则表达式?

分享人:杨星

目录

1.背景介绍

2.知识剖析

3.常见问题

4.解决方案

5.编码实战

6.扩展思考

7.参考文献

8.更多讨论

1.背景介绍

什么是正则表达式?

正则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE)使用单个字符串来描述、匹配一系列符合某个句法规则的字符串搜索模式。搜索模式可用于文本搜索和文本替换。

正则表达式是由一个字符序列形成的搜索模式。当你在文本中搜索数据时,你可以用搜索模式来描述你要查询的内容。正则表达式可以是一个简单的字符,或一个更复杂的模式。正则表达式可用于所有文本搜索和文本替换的操作。

正则表达式中包含三种元素分别为:量词、元字符、修饰符。

2.知识剖析

如何使用正则表达式

            
                语法
                /正则表达式主体/修饰符(可选)
                其中修饰符是可选的。

                举例:
                方式一:直接量语法
                var test = /jnshu/;
                var test = /jnshu/i;
                方式二:创建 RegExp 对象的语法
                var test = new RegExp("jnshu");
                var test = new RegExp("jnshu","i");
            
        

test()方法

test() 方法是一个正则表达式方法。
test() 方法用于检测一个字符串是否匹配某个模式,如果字符串中含有匹配的文本,则返回 true,否则返回 false。
                
/123456/.test("12345");            // false
/123456/.test("123456");           // true
/123456/.test("x123456y");         // true        只要包含了指定的字符串,则为true
                
            

修饰符

修饰符是影响整个正则规则的特殊符号,会对匹配结果和部分内置函数行为产生不同的效果。
                
        i   执行对大小写不敏感的匹配。
        g   执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。
        m   执行多行匹配。
        y   执行“粘性”搜索,匹配从目标字符串的当前位置开始,可以使用y标志。
                
            

元字符

元字符是使用正则表达式不同于普通字符的地方,也是正则表达式能够发挥强大作用、具有强大表达能力的法宝。

那么什么是元字符呢?

元字符是一些在正则表达式中有特殊用途、不代表它本身字符意义的一组字符。利用元字符,我们可以控制字符串匹配的方式,例如:只在每一行的开始或结束位置匹配指定的模式,匹配固定距离的子串,匹配不出现的字符等等。

常用元字符

                    
\d : 匹配数字      等价于[0-9]
\D : 匹配非数字    等价于[^\d]
\s : 匹配空白符
\S : 匹配非空白符  等价于[^\s]
\w : 用于匹配字母,数字或下划线字符(例如程序中的变量字符)  等价于[A-Za-z0-9_]
\W : 用于匹配所有与\w不匹配的字符   等价于[^\w]
举例:
/\d/.test("123");              // true
/\d/.test("1ab");              // true
/\D/.test("1ab");              // true
/\D/.test("112");              // false

字符类
匹配一类字符中的一个
[abc]: a或b或c
[0-9]: 一个数字
[^0-9]: 非数字的一个字符
[a-z]: 一个字母
.    : 任一字符(换行除外)

多选分支
或
/thi(c|n)k/    ===    /thi[cn]k/        // thick或think

锚点
匹配一个位置
^ :起始位置
$ :结尾位置
\b :单词边界
举例:
/^http:/       /^http:/.test("http://www.jnshu.com")   //true
/\.jpg$/       /\.jpg$/.test("1.jpg")                  // true
/\bis\b/       /\bis\b/.test("this is tom")            // true


                    
                

如果要在正则表达式中使用元字符本身的话该怎么办?

转义符

使用的方法是把一个反斜杠(\)放在元字符前面,这样元字符就失去了特殊的意义,还原会它本身代表的字符意义。
                    
举例:
/http:\/\//     /http:\/\//.test("http://www.jnshu.com")        // true
                    
                

量词

    正则表达式的量词分别是贪婪,惰性,支配性:
  1. 贪婪量词:先看整个字符串是不是一个匹配。如果没有发现匹配, 它去掉最后字符串中的最后一个字符,并再次尝试。
  2. 惰性量词: 先看字符串中的第一个字母是不是一个匹配。如果单独 这一个字符还不够,就读入下一个字符,组成两个字符的字符串。 如果还是没有发现匹配,惰性量词继续从字符串添加字符 直到发现一个匹配或者整个字符串都检查过也没有匹配。
  3. 支配量词:只尝试匹配整个字符串。如果整个字符串不能产生匹配,不做 进一步尝试,支配量词其实简单的说,就是一刀切。
惰性量词和贪婪量词的工作方式正好是相反的。
表示这3种量词:
                    
 贪   婪        惰   性       支   配               描   述
    ?           ??           ?+               零次或一次出现
    *            *?            *+                零次或多次出现
    +            +?            ++                一次或多次出现
    {n}          {n}?          {n}+              恰好n次出现
    {n,m}       {n,m}?       {n,m}+           至少n次,最多m次出现
    {n,}        {n,}?        {n,}+            至少n次出现

举例:
/\d*/.test("abc")       // true     数字可以出现0次到无穷次,所以是对的
/\d+/.test("abc")       // false    数字至少出现1次到无穷次,所以是错的
/\d+/.test("1abc")      // true     数字至少出现1次到无穷次,所以是对的
/https?:/.test("http://www.jnshu.com")       // true     s可以出现0次到1次,所以是对的
/https?:/.test("https://www.jnshu.com")      // true
/https?:/.test("httpss://www.jnshu.com")     // false    s后面是:所以是错的
                    
                

贪婪匹配原则

在JavaScript中,正则表达式进行匹配时默认使用的是贪婪匹配原则,即尽可能多的匹配字符串。例如,使用正则表达式/1{3,4}/来匹配字符串1111111,得到的结果为:1111和111。即先匹配4个字符,然后才匹配3个字符。

3.常见问题

如何利用正则表达式获取URL中各部分的值?

4.解决方案

                    
            http://www.jnshu.com:8080/index.html?user=chenapo&age=99#home
              |          |         |       |             |            |
            protocol     |         |       |             |            |
                      hostname    port     |             |            |
                          \        /    pathname        search        hash
                             host
                    
                

捕获

保存匹配到的字符串,日后再用
                    
            ()   :捕获           /(jnshu)/
            (?:) :不捕获         /(?:jnshu)/
                    
                
Demo

5.编码实战

6.扩展思考

常用正则表达式有哪些?

链接

7.参考文献

参考文献:

菜鸟教程
正则表达式的量词解释

8.更多讨论

感谢观看

by 杨星