我有一个非结构化邮政地址字符串和结构化邮政地址字符串的列表。我应该用什么来比较这些?
示例地址:
Unstructured: john appartments 7 koramangala bangalore india 560066
structured: 7, john appartments, koramangala, bangalore-560066, india
我有一个非结构化邮政地址字符串和结构化邮政地址字符串的列表。我应该用什么来比较这些?
示例地址:
Unstructured: john appartments 7 koramangala bangalore india 560066
structured: 7, john appartments, koramangala, bangalore-560066, india
如果您仅限于查找这些字符串相似的可能性,那么您需要研究此处提到的技术在大量字符串中查找相似字符串组
另一种方法 - 如果您可以访问地图/字典,那么您可以“结构化”任何地址(通过查找国家名称、邮政编码、街道名称等)然后进行比较。
祝你好运