是否有模式识别算法可以指定匹配或丢失某些参数的权重?例如,假设我有 3 个字符串:
str1 = Samsung 11.6" 64GB Slate PC Tablet with Wi-Fi - Black
str2 = Samsung Series 7 XE700T1A-A05US 11.6-Inch Slate (64 GB, Win 7 Pro)
str3 = Samsung Series 7 XE700T1A-A03US 11.6-Inch Slate (128 GB SSD, Win 7 HP)
我想将 str2 与 str1 匹配,因为它们的 GB 相等,即使传统的字符串距离会说 str2 更接近 str3。实际上,我希望任何东西都可以处理大量不同权重的参数。
任何指向正确方向的指针将不胜感激。