所以我正在搜索大量文本并提取常用短语,然后我最终得到一个这样的数组:
Array(
[past due] => 21
[past due notice] => 7
[past due 60 day] => 17
[60 day notice] => 32
)
键是短语,值是短语在给定文本中出现的次数。在上面的示例中,我想组合这些键并对值求和,因为它们对我来说都意味着同样的事情。所以我最终会得到一个这样的数组:
Array(
[past due] => 77
)
这只是一个例子,键、值等会不断变化。我刚刚开始这个项目,所以还没有代码可以发布。我只是在寻找想法、方向等,所以如果有人做了类似的事情或作为想法,我不必重新发明轮子。一如既往,提前致谢!
更新:
有了这里的所有贡献以及阅读其他问题,我想我将在构建数组之前尝试使用正则表达式对它们进行分组。