我正在通过 Expedia API 提取酒店名称,并与另一家旅行服务提供商交叉引用结果。
我遇到的问题是,许多酒店名称在 Expedia API 上的显示方式与在其他提供商中的显示方式不同,我无法找到匹配它们的好方法。
我将两者的结果与房价一起存储在单独的字典中。因此,例如,Expedia 在立陶宛搜索维尔纽斯的结果可能如下所示:
expediadict = {'Ramada Hotel & Suites Vilnius': 120, 'Hotel Rinno': 100,
'Vilnius Comfort Hotel': 110}
但来自其他提供者的结果可能如下所示:
altproviderdict = {'Ramada Vilnius': 120, 'Rinno Hotel': 100,
'Comfort Hotel LT': 110}
我能想到的唯一一件事就是去掉“Hotel”、“Vilnius”、“LT”和“Lithuania”的所有实例,然后测试 expediadict 键的一部分是否与 altprovderdict 键的一部分匹配。这看起来很乱,而且不是很 Pythonic,所以我想知道你们中是否有人有更清晰的想法?