r - 埃德加包 | .txt 文件的问题

Question

预先感谢您的意见。

我的问题是getSentimentCount(word.frq, words.list)edgar 包的功能。该函数应该读取word.list哪个是 .txt 文件并比较另一个现有列表的内容(word.frq)，也是一个 .txt 文件。

这适用于一个单词之间没有空格的 .txt 文件，但 R 仍然可以像有（计数 > 1）一样读取该文件。如果每个单词后有一个新行，则可以读取另一个文件（计数> 1），但会导致getSentimentCount(word.frq, words.list)函数错误。如果 .txt 文件中删除了新行并将所有单词放在一行中（与其他文件一样），则 R 只能读取一个单词（基本上是一行中的所有单词）并且 count = 1。

R 区分不同类型的 .txt 文件吗？

链接到两个 .txt 文件。negwords.txt工作，litwords.txt导致错误。

我很感激任何意见。

score 0 · Accepted Answer

R 只读取 txt 中的一个单词这一事实nospace是正常的：就 R 而言，这只是一个没有任何分隔符的字符串。

我在阅读其他文档时没有任何问题：

library(edgar)
wf <- getWordfrquency("R/litwords_space.txt")
neg <- readLines("R/negwords.txt")
wgs <- getSentimentCount(word.frq = wf, words.list = neg)

目前，您的单词列表只包含出现一次的单词，因此频率表将始终为一个。

如果您喜欢文本挖掘和情感分析，我强烈建议您切换到该tidytext软件包。

科林

score 0 · Accepted Answer

0

已解决：该函数getSentimentCount(word.frq, words.list)仅读取.txt (MS-DOS).

于 2017-08-31T11:44:00.340 回答

r - 埃德加包 | .txt 文件的问题

2 回答 2

Related

Reference