0

在处理存储为文本文件的电子邮件时,我正在研究实施词袋方法。我想使用可能表明电子邮件需要回复的关键字,用二进制分析电子邮件(类似于 1|0|1|0|0 等,具体取决于是否使用该词),然后获得我可以使用的特征向量不同的机器学习算法。

我正在考虑使用 PHP 来获取特征向量,但我找不到任何现有的实现。甚至可以在 PHP 中做类似的事情吗?

4

1 回答 1

1

是的,词袋对于制作分类器很有意义。我也在做关于文本分类的论文,我正在使用 php 和 mysql。我对创建词袋有点困惑。但一段时间后,它可以完成。

于 2013-01-25T09:48:28.163 回答