我从 6 个实时提要中提取数据,这些提要有时格式略有不同,即。我可能有
- “阿森纳”和“阿森纳足球俱乐部”
- 'T沃尔科特'和'西奥沃尔科特'和'T。沃尔科特
我一直在徘徊的是,是否有一种简单的方法来检查字符串是否相互匹配,基于它们是否具有一定百分比的字母以相同的顺序,它们将被认为是相同的。
我想我可以设置一个相关单词和术语的列表,但这意味着必须提前设置它,但如果有更简单的自动方式,我会徘徊,因为我无法编译完整的列表需很长时间。
我从 6 个实时提要中提取数据,这些提要有时格式略有不同,即。我可能有
我一直在徘徊的是,是否有一种简单的方法来检查字符串是否相互匹配,基于它们是否具有一定百分比的字母以相同的顺序,它们将被认为是相同的。
我想我可以设置一个相关单词和术语的列表,但这意味着必须提前设置它,但如果有更简单的自动方式,我会徘徊,因为我无法编译完整的列表需很长时间。
有一个功能就是:
similar_text('Theo Walcott', 'T. Walcott', $similarity);
echo $similarity;
查看 soundex 函数http://php.net/soundex和similar_text 函数以获得相似度百分比。