-
正则表达式基础(2)
上一节记录了主要的一些元字符集,算是刚刚入了门。这一节主要介绍一些稍微需要动脑筋的东西。 分组捕获与后向引用 分组实际上就是个对括号,用处就是将一个匹配串当成一个整体来看,用于改变匹配的优先级。比如我们要匹配“abcabcabcabc”,就可以这样匹配:(abc){4} 。 在分组的基础上,我们就可以进行后向引用。所谓后向引用,就是将之前匹配到的字符串记录下来,供后来继续用,提高表达式的效率。 具体用法是,系统会给表达式中所有的分组标上序号,从1开始。接下来每当希望用到之前分组的内容时…
-
正则表达式基础(1)
正则表达式这东西真的特别常用,在搜索文本啊,写爬虫什么的都得用到。而且现如今各种语言,都会支持正则表达式。之前也零零碎碎的看过,但是很多细节都记不清,这里姑且把一些知识要点记录下来,供日后查找使用。 通用的正则表达式 由于正则表达式有很多种实现方式,所以各种方式之间有一些区别。但是以下的一些条件,则是在任何语言的正则中都适用的规律: 符号 匹配 ^ 匹配输入字符串开始的位置。 $ 匹配输入字符串结尾的位置。 * 零次或多次匹配前面的字符或子表达式。例如,zo* 匹配…