只是要清楚这不是一个刮问题。
我正在尝试自动编辑类似的 HTML 文件。这涉及删除标签之间的内容。
在本地编辑 HTML 文件时,是否更容易 open() 文件然后将内容逐行转储到字符串中,以便更容易应用正则表达式?
谢谢
对于像 HTML 这样的结构化标记,最好使用像BeautifulSoup这样的解析器而不是正则表达式。造成这种情况的一些原因包括对格式错误的 HTML 的更好结果和降低的复杂性(您不需要重新发明轮子)。
不过考虑到这个问题的表面价值,使用readlines将 HTML 分成几行似乎更容易,这样在应用正则表达式时一次只处理一行。
我建议不要创建自己的模板语言(这就是这项任务的内容),而是使用已经存在的众多模板语言中的一种,并使用它来执行必要的操作。试试 Jinja2、Django 模板或 Cheetah,看看你喜欢什么。还有很多其他的。