r - 使用 doc_id 将 doc_topic_distr 与 DTM 原始数据连接起来

Question

我认为我将不得不使用 doc_id 作为唯一标识符将我的原始数据与 topic_doc_distr 表合并，但我实际上不知道如何。

/edit：doc_id 是持久的还是在语料库创建/数据框转换后变得过时？

我已经尝试了以下 R-Code，但我不知道如何在其中添加 doc_id。

test <- doc_topic_distr

有什么线索吗？

score 0 · Accepted Answer

像这样解决它：

newDF <- merge(x=df_old, y=df_additions, by="doc_id",all=TRUE)

使用 df_old: 原始文件 df_additions: doc-topic-distr 作为数据框

1 回答 1