1

我正在制作一个供个人使用的小型系统,用于处理文件。在这个系统中,我想根据名称对文件进行分类并尽可能自动化。这导致我遇到匹配字符串的问题。

假设我有一个名为的类别A category和一个名为的两个文件:

  1. a.category.file
  2. lotsofgarbage.a-big-kateory.file

我需要将这些文件名与类别匹配。我想这更像是一个“他们有多相似”的分数,因为没有很好的方法来进行精确匹配。

谁能给我一个简单的好算法来解决这个问题?或者指出我的方向?

4

2 回答 2

1

解决这个问题的最好方法可能是计算文件名与类别名称的编辑距离,如果它们在某个阈值之下,那么它们应该匹配。

查看此链接,显然 php 可以为您做到这一点。

于 2012-06-12T11:58:55.257 回答
0

您可以尝试使用这个(更容易):http ://www.php.net/manual/en/function.similar-text.php

或者这个:http ://www.php.net/manual/en/function.levenshtein.php

于 2012-06-12T12:01:28.697 回答