0

我对 lxml 库非常陌生,并且发现目前解析除了链接之外的任何内容都非常令人困惑。

我阅读了文档,但我很难xml:lang=".."从顶部<html ..>标签中获取属性值。

我怎样才能读取该值?

例子:<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en">

4

1 回答 1

1
>>> import lxml.html
>>> s = '''<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en"></html>'''
>>> root = lxml.html.fromstring(s)
>>> root.get('xml:lang')
'en-GB'
于 2013-07-27T09:00:51.633 回答