0

我正在尝试找出一种清理/重新格式化以 Markdown 格式编写的用户生成内容的好方法。我想“纠正”不当内容(尽可能)。

现在我坚持使用 HTML 注释(尽管我很欣赏任何嵌入的 HTML)。

降价格式要求任何嵌入的 HTML 都出现在它自己的行中。

坏(输入):

one
<!-- two -->
three
four
five <!-- five.point.five -->
six

好(输出):

one

<!-- two -->

three
four
five

<!-- five.point.five -->

six
4

2 回答 2

1

你可以使用这个:

re.sub(r'\s*(<!--(?:[^-]+|-(?!->))*-->)\s*', '\\n\\n\\1\\n\\n', yourstring)
于 2013-06-15T01:44:28.960 回答
0

要将第一个输出转换为第二个输出,您可以<!--\r\n<!---->替换-->\r\n,或者任何换行符或常量,等效于\r\n. 您可以使用 来执行此操作replace(),可能不需要正则表达式。[\r其实没必要。]

您似乎暗示您已经这样做了,所以您的问题可能还有更多。

于 2013-06-15T01:39:35.897 回答