1

我正在尝试编写一个代码来读取电影的名称,并尝试使用 python 3.0 从 IMDB 获取它的详细信息。我正在使用mechanicalsoup,但打开浏览器后无法获取电影的链接。在mechanize 中有一个名为get_link 和follow_link 的方法。在mechanicalsoup 中是否有任何等价物。代码如下。

import mechanicalsoup
import re
def main():
    movie='The Incredibles';
    base_url='http://www.imdb.com/find?q=';
    movie_search='+'.join(movie.split());
    final_url=base_url+movie_search+'&s=all';
    br=mechanicalsoup.Browser();
    br.get(final_url);
    link=br.find_link(url_regex=re.compile(r'/title/tt.*'));
    res=br.follow_link(link);
    soup=mechanicalsoup(res.read());
    print(soup.prettify());

if __name__=="__main__":main()

在这里我得到了错误

"AttributeError: 'Browser' object has no attribute 'find_link'"

请帮帮我。还建议在 python 中是否有更好的 html 解析器和更新的文档。

4

0 回答 0