我正在将 imdb 导入 MySQL。可下载的纯文本 imdb 数据文件的描述表明它们包含 imdb 数据的子集。有谁知道可下载数据(范围)的限制是什么?例如,是否存在可下载数据中未包含的电影?
问问题
1026 次
1 回答
3
一旦 IMDb 成为一家公司,在纯文本数据文件中您将找不到后来添加的信息。
主要限制是您将没有imdbID(用于识别电影、人物、角色和公司的 ID),因此您无法轻松地将纯文本数据文件中的信息与网络上的信息进行匹配地点。
除此之外,值得注意的缺失数据类别是:主页上的简短情节、奖项、外部评论、家长指南、概要、常见问题解答、新闻。
显然,所有的留言板、海报等都不见了。
您可以将您的数据与他们的统计数据进行一些比较:http ://www.imdb.com/stats ,但他们在网站上对电影进行分类的方式可能与您在文件中找到的不同,所以这并不容易比较。
一个值得注意的例外,严格来说是数据量,据我所知,“开发中”的标题不包含在文件中(当电影处于制作的早期阶段时,信息仅对订阅者可用IMDb 专业版)。
于 2013-02-08T10:27:37.370 回答