是否可以获得符合搜索条件(例如投票数、语言、发行年份等)的标题的所有 IMDb ID?
我的首要任务是编制一份所有 IMDb ID 的列表,这些 ID 被归类为故事片,并有超过 25,000 票(也就是那些符合条件的人出现在前 250 名名单上),就像它出现在这里一样。在此发布时,有 4,296 部电影符合该标准。
(如果您不熟悉 IMDb ID:它是与数据库中的每部电影/人物/角色/等相关联的唯一 7 位代码。例如,对于电影“Drive”(2011),IMDb ID 是“ 0780504
” .)
但是,在将来,设置我认为合适的搜索条件会很有帮助,就像我在输入 url 地址时一样(使用 &num_votes=##, &year=##, &title_type=##, ...)
我一直在使用 IMDBpy 来获取有关单个电影标题的信息并取得了巨大成功,如果我描述的这个搜索功能可以通过该库访问,我会很高兴。
到现在为止,我一直在生成随机的 7 位字符串并测试它们是否符合我的标准,但这将是低效的,因为我将处理时间浪费在多余的 ID 上。
from imdb import IMDb, IMDbError
import random
i = IMDb(accessSystem='http')
movies = []
for _ in range(11000):
randID = str(random.randint(0, 7221897)).zfill(7)
movies.append(randID)
for m in movies:
try:
movie = i.get_movie(m)
except IMDbError as err:
print(err)`
if str(movie)=='':
continue
kind = movie.get('kind')
if kind != 'movie':
continue
votes=movie.get('votes')
if votes == None:
continue
if votes>=25000: