0

我正在尝试查看两页之间的电影是否相同,为此我想将演员作为标准之一进行比较。但是,演员通常在不同页面上以不同的方式列出。例如:

以前,我在以下方面进行了非常粗略的比赛:

if actors_from_site_1[0] == actors_from_site_2[0]

但是,从上面的案例可以看出,这不是一个好的技术。什么是更好的技术来查看一部电影中的演员是否与其他演员相匹配?

4

3 回答 3

2

您可以检查两组演员的一组交集的长度。

if len(set(actors_from_site_1).intersection(set(actors_from_site_2))):

或者您可以执行以下操作:

if any(actor in actors_from_site_1 for actor in actors_from_site_2):
于 2015-04-01T01:45:30.170 回答
1

If all the lists are comma separated actor names, split them on the commas, lowercase the names, and get the intersection:

actors_from_site_1 = set(actors_from_site_1.lower().split(','))
actors_from_site_2 = set(actors_from_site_2.lower().split(','))

common_actors = actors_from_site_1 & actors_from_site_2
于 2015-04-01T01:42:16.430 回答
1

尝试:

similaractors = []
for actor in actors_from_site_1:
    if actor in actors_from_site_2:
        similaractors.append(actor)

然后,您将获得similaractors他们共享的所有演员的列表。调用len(similaractors)以获取类似演员的数量,然后您可以print(similaractors)并执行您可能对列表执行的所有其他操作。

于 2015-04-01T02:09:10.097 回答