我最近开始在 python 中开发一个程序,它允许用户轻松地结合任何动词。为此,我使用 urllib 模块打开相应的共轭网页。例如,动词“beber”会有网页:
要打开页面,我使用以下 python 代码:
source = urllib.urlopen("http://wwww.spanishdict.com/conjugate/beber").read()
此来源确实包含我要解析的信息。但是,当我像这样用它制作一个 BeautifulSoup 对象时:
soup = BeautifulSoup(source)
我似乎丢失了我想要解析的所有信息。制作 BeautifulSoup 对象时丢失的信息通常如下所示:
<tr>
<td class="verb-pronoun-row">
yo </td>
<td class="">
bebo </td>
<td class="">
bebí </td>
<td class="">
bebía </td>
<td class="">
bebería </td>
<td class="">
beberé </td>
</tr>
我究竟做错了什么?一般来说,我不是 Python 或 Web Parsing 的专业人士,所以这可能是一个简单的问题。
这是我的完整代码(我使用“++++++”来区分两者):
import urllib
from bs4 import BeautifulSoup
source = urllib.urlopen("http://www.spanishdict.com/conjugate/beber").read()
soup = BeautifulSoup(source)
print source
print "+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++"
print str(soup)