我有一个“实体解析”类型的用例,其中我有几个(< 100 个)设备功能可用于许多(几百万个)设备。我的目标是为这些设备生成 id。挑战在于同一个设备可能有两个或多个略有不同的表示,但我仍然想为所有设备分配相同的设备 ID。
我想要你在这方面的建议:
- 我应该应用什么样的特征预处理?
- 哪种算法最适合我的目的?
- 请提及是否有此类算法的标准实现。
谢谢并恭祝安康,
我有一个“实体解析”类型的用例,其中我有几个(< 100 个)设备功能可用于许多(几百万个)设备。我的目标是为这些设备生成 id。挑战在于同一个设备可能有两个或多个略有不同的表示,但我仍然想为所有设备分配相同的设备 ID。
我想要你在这方面的建议:
谢谢并恭祝安康,