我目前正在处理这个片段
@register_snippet
class Foo(models.Model):
body = RichTextField()
不知何故,我决定我需要定义__str__
,以便我可以区分多个片段。我相信使用body
内容作为字符串表示可能是一个好主意。虽然,身体可以变得非常大,所以前 20 个字符应该可以。
认为这个任务是小菜一碟,我写了这段代码:
@register_snippet
class Foo(models.Model):
body = RichTextField()
def __str__(self):
return self.body[:20]
...这导致了丑陋的表示,例如<p>Quequeueueueue?</
和<p>FOO<br/></p>
。
我检查了数据库,发现标记存储在数据库中,这看起来很明显。虽然,我仍然想知道。
在不使用 CPU 繁重的 HTML 解析器和解析整体的情况下删除 HTML 标记的方法是什么body
?
我相信正则表达式可以删除一些标签,但是我该如何处理诸如</a
, </blockqu
, <
,之类的情况</
呢?