2

只是要清楚这不是一个刮问题。

我正在尝试自动编辑类似的 HTML 文件。这涉及删除标签之间的内容。

在本地编辑 HTML 文件时,是否更容易 open() 文件然后将内容逐行转储到字符串中,以便更容易应用正则表达式?

谢谢

4

2 回答 2

1

对于像 HTML 这样的结构化标记,最好使用像BeautifulSoup这样的解析器而不是正则表达式。造成这种情况的一些原因包括对格式错误的 HTML 的更好结果和降低的复杂性(您不需要重新发明轮子)。

不过考虑到这个问题的表面价值,使用readlines将 HTML 分成几行似乎更容易,这样在应用正则表达式时一次只处理一行。

于 2013-09-24T15:53:53.280 回答
0

我建议不要创建自己的模板语言(这就是这项任务的内容),而是使用已经存在的众多模板语言中的一种,并使用它来执行必要的操作。试试 Jinja2、Django 模板或 Cheetah,看看你喜欢什么。还有很多其他的。

于 2013-09-24T17:20:27.973 回答