我正在开发一个基于 PHP 的购物应用程序。我有我知道代表相同产品的字符串列表。这些字符串可能包含完整的产品名称或其中的一部分(完整的产品名称通常是品牌 + 型号)。
我想知道执行此产品名称提取的最佳方法是什么。
例如,这里有一个代表相同产品的字符串列表:
- Tkg BOUILLOIRE TKG - JK 1008 RWD
- Tkg Jk 1008 Rwd
- Tkg Kalorik - JK 1008 RWD - Bouilloire Électrique sans Fil 360°
- TKG Bouilloire électrique sans fil 1,7 升 2000 瓦 Pois TKG Rouge et blanc
- Tkg Kalorik - JK 1008 RWD - Bouilloire Électrique sans Fil 360°
- Tkg JK 1008 RWD 肉汁
我希望提取产品名称“Tkg JK 1008 RWD”。请注意,字符串 4 仅包含部分信息。
当我计算所有字符串中的重复单词时,我尝试了一种方法;但从那里,很难走得更远。
你有什么线索吗?
干杯尼古拉斯