最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

正则的回溯引用backreference如何使用

来源:动视网 责编:小采 时间:2020-11-27 19:57:44
文档

正则的回溯引用backreference如何使用

正则的回溯引用backreference如何使用:这次给大家带来正则的回溯引用backreference如何使用,正则回溯引用backreference使用的注意事项有哪些,下面就是实战案例,一起来看一下。在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达
推荐度:
导读正则的回溯引用backreference如何使用:这次给大家带来正则的回溯引用backreference如何使用,正则回溯引用backreference使用的注意事项有哪些,下面就是实战案例,一起来看一下。在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达


这次给大家带来正则的回溯引用backreference如何使用,正则回溯引用backreference使用的注意事项有哪些,下面就是实战案例,一起来看一下。

在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。

一、问题引入

一个在HTML页面中匹配标题标签(H1—H6)的问题:

文本:

<body>
<h1>Welcome to my page</H1>
Content is pided into twosections:<br>
<h2>Introduction</h2>
Information about me.
<H2>Hobby</H2>
Information about my hobby.
<h2>This is invalid HTML</h3>
</body>

正则表达式:<[hH][1-6]>.*?</[hH][1-6]>

结果:

<body>
【<h1>Welcome to my page</H1>】Content is pided into twosections:<br>
【<h2>Introduction</h2>】Information about me.
【<H2>Hobby</H2>】Information about my hobby.
【<h2>This is invalid HTML</h3>】</body>

分析:模式<[hH][1-6]>匹配任何一级标题的开始标签,而且不区分大小写,在这个例子中它匹配到了<h1>、<h2>,</[hH][1-6]>匹配到了</h1>、</h2>、</h3>;这里使用了懒惰型元字符来匹配标签中的文本,否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出,有一个无效的标签也匹配上了,即<h2></h3>,它们根本不能配对。要解决这个问题,就需要使用到回溯引用(backreference)。

二、回溯引用匹配

回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用,在前面已经介绍过了。现在来解决前面的例子:

文本:

<body>
<h1>Welcome to my page</H1>
Content is pided into twosections:<br>
<h2>Introduction</h2>
Information about me.
<H2>Hobby</H2>
Information about my hobby.
<h2>This is invalid HTML</h3>
</body>

正则表达式:<[hH]([1-6])>.*?</[hH]\1>

结果:

<body>
【<h1>Welcome to my page</H1>】Content is pided into twosections:<br>
【<h2>Introduction</h2>】Information about me.
【<H2>Hobby</H2>】Information about my hobby.
<h2>This is invalid HTML</h3>

分析:首先匹配开始标题标签的模式<[hH]([1-6])>,使用括号把[1-6]做为子表达式,而匹配结束标题标签模式为</[hH]\1>,其中\1表示引用第一个子表达式,即([1-6]),如果([1-6])匹配到的是1,那\1也匹配到1,如果匹配到2,那\1也匹配到2,所以最后一个无效的标题标签就不会被匹配到了。

相信看了本文案例你已经掌握了方法,更多精彩请关注Gxl网其它相关文章!

推荐阅读:

正则怎样写才能匹配一组字符

正则的位置匹配使用详解

文档

正则的回溯引用backreference如何使用

正则的回溯引用backreference如何使用:这次给大家带来正则的回溯引用backreference如何使用,正则回溯引用backreference使用的注意事项有哪些,下面就是实战案例,一起来看一下。在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top