1

这是我的程序

from bs4 import BeautifulSoup
import urllib2
url="http://www.moneycontrol.com/commodity/gold-price.html#05oct2013"
content = urllib2.urlopen(url).read()
soup = BeautifulSoup(content)

它给出以下错误

Traceback (most recent call last):
  File "<interactive input>", line 1, in <module>
  File "C:\Python27\lib\bs4\__init__.py", line 183, in __init__
    self._feed()
  File "C:\Python27\lib\bs4\__init__.py", line 197, in _feed
    self.builder.feed(self.markup)
  File "C:\Python27\lib\bs4\builder\_htmlparser.py", line 156, in feed
    raise e
HTMLParseError: malformed start tag, at line 102, column 168

尽管

url="http://www.moneycontrol.com/commodity/" 

没有给出任何错误

4

1 回答 1

0

两个站点都使用您的代码为我解析(使用 html.parser 或 lxml 作为解析器)。您使用的是哪个版本的 Python 和 BeautifulSoup?您可以尝试使用不同的 parser进行解析。

于 2013-09-10T13:37:26.300 回答