0

我的公司名称如下:

1.Apple Inc. 2.Apple computer Inc. 3.Apple 4.IBM 5.International business machines 4.international business machines company 5.International business machines corp 6.Ibm corp..

我需要将文本与正确的公司名称匹配,并用正确的公司名称替换​​所有其他类似的内容......有什么办法吗???

4

2 回答 2

0

也许这可能会有所帮助?这是一个 python 差异库。

您可以计算每个字符串之间的差异,如果两个字符串高度相似,那么您可能(可能注意)假设由于它们有很多共同点,它们可能是同一家公司。

于 2013-07-07T05:17:43.157 回答
0

有一个python 库可以进行名称匹配。

> choices = ["Atlanta Falcons", "New York Jets", "New York Giants", "Dallas Cowboys"]
> process.extract("new york jets", choices, limit=2)
  [('New York Jets', 100), ('New York Giants', 78)]
> process.extractOne("cowboys", choices)
  ("Dallas Cowboys", 90)
于 2013-08-24T18:00:28.877 回答