5

我正在尝试使用 tm 包在术语文档矩阵中查找与特定单词相关的单词。

findAssocs用来做这个。的论据findAssocs是:

  • x:术语文档矩阵。
  • 术语:持有术语的字符。
  • corlimit:相关下限的数字。

我一直得到numeric(0)我的结果

例子:

findAssocs(test.dtm, "investment", 0.90)
>numeric(0)

有谁熟悉findAssocs并知道我做错了什么?或者有谁更广泛地知道numeric(0)结果可能意味着什么?

非常感谢您的任何帮助。

4

4 回答 4

2

该结果表明,在 0.90 个文档中没有与“投资”一词相关联的词。尝试一个较低的阈值,例如 0.05,然后逐步达到产生更少术语的阈值。

于 2012-09-28T05:33:01.707 回答
2

我也一样numeric(0),我认为这是因为我的文档中只有一个文档Corpus,所以document term matrix只有一列。您可能想测试一下TermDocumentMatrix(),看看您是否有multi-column matrix. 也就是说,我如何在一个文档中找到关联?

于 2012-10-06T19:38:04.927 回答
0

看来此功能仅在分析多个文本文档时才有效。我想出的唯一可行的解​​决方案是创建文本文档的副本,然后运行分析。但是,不确定这是否会以任何方式改变结果。任何额外的反馈将不胜感激。

于 2015-08-10T21:09:03.710 回答
0

我认为这也与您的数据文件有关。一个文本文件应该可以工作,但如果它是一个只有一列的 .csv,你会得到 (0)

于 2021-01-08T05:20:45.153 回答