我的公司名称如下:
1.Apple Inc. 2.Apple computer Inc. 3.Apple 4.IBM 5.International business machines 4.international business machines company 5.International business machines corp 6.Ibm corp..
我需要将文本与正确的公司名称匹配,并用正确的公司名称替换所有其他类似的内容......有什么办法吗???
也许这可能会有所帮助?这是一个 python 差异库。
您可以计算每个字符串之间的差异,如果两个字符串高度相似,那么您可能(可能注意)假设由于它们有很多共同点,它们可能是同一家公司。
有一个python 库可以进行名称匹配。
> choices = ["Atlanta Falcons", "New York Jets", "New York Giants", "Dallas Cowboys"]
> process.extract("new york jets", choices, limit=2)
[('New York Jets', 100), ('New York Giants', 78)]
> process.extractOne("cowboys", choices)
("Dallas Cowboys", 90)