我进行了广泛的研究,发现我找不到 API。是否有任何可用的 API 来获取 TOP 250 列表?
或者另一种访问列表的方法?
我尝试访问页面 HTML 并在我的 JSP 后端进行解析。但这里的问题是我只得到一个骨架,列表作为 AJAX 加载。
有什么方法可以抓取它吗?
任何使用想法将不胜感激......
我进行了广泛的研究,发现我找不到 API。是否有任何可用的 API 来获取 TOP 250 列表?
或者另一种访问列表的方法?
我尝试访问页面 HTML 并在我的 JSP 后端进行解析。但这里的问题是我只得到一个骨架,列表作为 AJAX 加载。
有什么方法可以抓取它吗?
任何使用想法将不胜感激......
最简单的方法是从IMDb 备用接口下载数据。
您想要的文件是ratings.list.gz。排名前 250 的电影列在第一部分。
是的,现在有一个名为 omdbapi 的 API
http://www.omdbapi.com/
我也遇到了这个问题,我通过一些刮擦解决了它。这是Python代码:
import requests
import re
top250_url = "http://akas.imdb.com/chart/top"
def get_top250():
r = requests.get(top250_url)
html = r.text.split("\n")
result = []
for line in html:
line = line.rstrip("\n")
m = re.search(r'data-titleid="tt(\d+?)">', line)
if m:
_id = m.group(1)
result.append(_id)
#
return result
它返回前 250 部电影的 IMDb ID。然后,使用imdbpy包,您可以询问有关电影的所有信息,因为您有电影 ID。
可从那里获得:
http://api.myapifilms.com/imdb.do
获取它的网址:(您需要一个免费令牌)
http://api.myapifilms.com/imdb/top?token=GET A FREE API KEY&format=json&data=0
(不是我的网站)
https://www.theimdbapi.com/ 这个很棒,我从现在开始使用