我正在对大型数据集进行文本挖掘。我能够创建 TDM 和 DTM,并能够使用 TDF 和 IDF 执行我的分析。但是我们可以在 R 中为 Bi Grams 创建一个术语文档矩阵或文档术语矩阵吗?我知道 Mahout 中提供了类似的设施,但我正在寻找一种在 R 中执行此操作的方法?
问问题
356 次
我正在对大型数据集进行文本挖掘。我能够创建 TDM 和 DTM,并能够使用 TDF 和 IDF 执行我的分析。但是我们可以在 R 中为 Bi Grams 创建一个术语文档矩阵或文档术语矩阵吗?我知道 Mahout 中提供了类似的设施,但我正在寻找一种在 R 中执行此操作的方法?