我已经为我在 Quanteda 中的 DFM 计算了词汇多样性,并希望随着时间的推移绘制它。对于每个文档,我的语料库中都有年、月和日期的变量作为 docvar。有什么方法可以结合这些数据并随着时间的推移生成词汇多样性图?
问问题
173 次
1 回答
0
要绘制随时间变化的词汇多样性,您需要计算随时间变化的词汇多样性,即按时间(月或年 - 取决于您)对数据进行分组,然后计算每个组的词汇多样性。一旦你有了这个,你将每组有一个值,然后可以用来绘制。
例子:
lex_div <- doc1_final %>%
group_by(Page) %>%
summarise(lex_div = length(unique(word))/length(word))
我附上了 doc1_final 对象的图片。它基本上是一个分解成单词的数据框,即每行一个单词。然后我将 doc1_final 对象传递给 group_by 函数,然后对分组数据执行计算。
您需要安装“dplyr”包才能运行上述代码。在此处输入图像描述
于 2017-09-20T12:45:50.123 回答