我收到以下错误消息
HTMLParseError: unknown status keyword u'cadta' in marked section, at line 1, column 54
当我尝试使用以下代码删除 HTML 标记时:
from HTMLParser import HTMLParser
class MLStripper(HTMLParser):
def __init__(self):
self.reset()
self.fed = []
def handle_data(self, d):
self.fed.append(d)
def get_data(self):
return ''.join(self.fed)
def strip_tags(html):
s = MLStripper()
s.feed(html )
return s.get_data()
通过调用来获取这段文本strip_tags()
:
how to Fetch data from an XML file with tags <title> <![CADTA[text here]]> </title>?
这里发生了什么,我该如何解决这个问题?
谢谢你。