在处理存储为文本文件的电子邮件时,我正在研究实施词袋方法。我想使用可能表明电子邮件需要回复的关键字,用二进制分析电子邮件(类似于 1|0|1|0|0 等,具体取决于是否使用该词),然后获得我可以使用的特征向量不同的机器学习算法。
我正在考虑使用 PHP 来获取特征向量,但我找不到任何现有的实现。甚至可以在 PHP 中做类似的事情吗?
在处理存储为文本文件的电子邮件时,我正在研究实施词袋方法。我想使用可能表明电子邮件需要回复的关键字,用二进制分析电子邮件(类似于 1|0|1|0|0 等,具体取决于是否使用该词),然后获得我可以使用的特征向量不同的机器学习算法。
我正在考虑使用 PHP 来获取特征向量,但我找不到任何现有的实现。甚至可以在 PHP 中做类似的事情吗?