首页>建站相关>利用dreamweaver正则批量清理网页中的多余信息

利用dreamweaver正则批量清理网页中的多余信息

起因是fontawesome站点改版,站点的图标一览里面带上了多余的信息,就想干脆整个页面复制下来,清理一下无用的信息,然后做成一个本地文件。

源文件节选

<ul data-v-06292f57="" class="list mt-8 grid py-4 grid-cols-4">
<li data-v-06292f57="">
  <a data-v-06292f57="" href="/v4/icons/500px" class="">
    <i data-v-06292f57="" class="fa fa-fw fa-500px"></i><span data-v-06292f57="">500px</span>
  </a>
</li>
<li data-v-06292f57="">
  <a data-v-06292f57="" href="/v4/icons/address-book" class="">
    <i data-v-06292f57="" class="fa fa-fw fa-address-book"></i><span data-v-06292f57="">address-book</span>
  </a>
</li>
<li data-v-06292f57="">
  <a data-v-06292f57="" href="/v4/icons/address-book-o" class="">
    <i data-v-06292f57="" class="fa fa-fw fa-address-book-o"></i><span data-v-06292f57="">address-book-o</span>
  </a>
</li>

替换为空值

“data-v-06292f57”这一行都是一致的,可以直接查找并替换为空值,顺手删除掉ul的类名,初步成果如下;

<ul><li><a href="/v4/icons/500px" class=""><i class="fa fa-fw fa-500px"></i><span>500px</span></a></li><li><a href="/v4/icons/address-book" class=""><i class="fa fa-fw fa-address-book"></i><span>address-book</span></a></li><li><a href="/v4/icons/address-book-o" class=""><i class="fa fa-fw fa-address-book-o"></i><span>address-book-o</span></a></li>

替换链接

dreamweaver_regular_matching_html_p1

这里用“.*?”来匹配href的链接,链接内部的元素也可以用这个语法,所以查找一个完整的链接的语法如下:

<a href=".*?" class="">.*?</a>

但这样只是查找,我们准备替换成为第二个“.*?”匹配到的内容,这个时候我们需要用小括号把这个内容括起来,第一个被小括号括起来的内容后面以“$1”代替,多个小括号的情况“$2,$3”以此类推,查找的内容填写如下:

<a href=".*?" class="">(.*?)</a>

替换的内容填写“$1”,记得勾选搜索替换框底部的“使用正则表达式”选项。处理好后的html:

<ul><li><i class="fa fa-fw fa-500px"></i><span>500px</span></li><li><i class="fa fa-fw fa-address-book"></i><span>address-book</span></li><li><i class="fa fa-fw fa-address-book-o"></i><span>address-book-o</span></li><li><i class="fa fa-fw fa-address-card"></i><span>address-card</span></li><li><i class="fa fa-fw fa-address-card-o"></i><span>address-card-o</span></li>

展示一下最终的成果:

dreamweaver_regular_matching_html_p2

标签: html

移动端可扫我直达哦~

推荐阅读

html 2022-10-28

html元素中的data-*属性

data-全局属性是一类被称为自定义数据属性的属性,它赋予我们在所有HTML元素上嵌入自定义数据属性的能力,并可以通过脚本在HTML与DOM表现之间进行专有数据的交换。通过添加 data- 属性,即使是普通的 HTML 元素也能变成相...

建站相关 html

html 2022-10-13

html元素中的“no-js”类有什么用

学习看typecho的默认主题,在html元素中规定了“no-js”这样一个类,搜索了一下,该类的主要目的是允许使用 CSS 来设置无 JavaScript 页面的样式,即为启用 JavaScript 的浏览器和禁用 JavaScri...

建站相关 html

html 2022-10-13

浏览器内核控制标签renderer说明

背景介绍由于众所周知的原因,国内的主流浏览器都是双核浏览器:基于Webkit的内核用于常用网站的高速浏览,基于IE的内核主要用于部分网银、政府、办公系统等网站的正常使用。以360浏览器为例,我们优先通过Webkit内核渲染主流网站,只...

建站相关 html

html 2022-10-13

html中meta标签的http-equiv属性

学习typecho的默认主题,才看到header.php文件的第六行代码,就被这样一句代码弄懵了。http-equiv属性提供了content属性的信息/值的HTTP头,也就是说,这东西是成对使用的,使用http-equiv属性可用于...

建站相关 html