0

我有 html 之类的

    ...<button type="submit" name="ctl00$ctl16$ctl00$ctl00$searchButton" value=""
 id="ctl00_ctl16_ctl00_ctl00_searchButton" type="submit" class="search-submit" value="Search">...

并且需要以编程方式删除重复的标签,例如 type="submit" 。是否可以不使用 HTMLAgilityPack 之类的库?例如,正则表达式。

4

1 回答 1

0

假设您正在尝试删除同一标签中的重复属性,那么这很棘手,因为如果不解析每个标签就无法做到这一点。解析出每个标签需要解析其他所有内容,包括注释、文本、引用文本等。

因此,不使用库就可以做到这一点的唯一方法是编写自己的 HTML 解析器。这就是为什么使用 HTML Agility Pack 或我自己的HTML Monkey会更容易的原因。

于 2018-12-03T21:38:14.303 回答