0

从字符串+分类中检测英文单词我有一个庞大的 url 数据库,我想从这些数据中提取英文单词,然后对 URL 中包含的单词进行分类

例如 apple.com -> apple:fruit 和 app:computer

还有其他 PHP 脚本可以为每个字符串添加单词,但我需要帮助的是一个开放数据源,用于对英语单词进行分类

例如忍者=武术

PHP 部分只是简单地进行查找。我见过用于对页面内容进行分类的贝叶斯脚本,但这更多的是几个词……而且它可能比需要的更复杂。

提前喝彩,

4

1 回答 1

0

你应该看看Wordnet。这是一种词汇资源,通过将单词与其同义词集(同义词集)进行分组来对它们进行分类。它应该可以帮助您获得有意义的分类。

于 2014-09-22T18:43:13.913 回答