0

R我正在使用包创建基于推文的主题模型topicmodels

我想创建一个包含来自主题模型的所有结果的数据框,以便我可以将其插入数据库。我就是这样做的:

# create dataframe with relevant results
topics <- as.data.frame(ldaTopics@gamma)
topics$id <- as.character(ldaTopics@documents)
topics$topic <- topics(ldaTopics)

# reorder columns to match table structure in database
reordered_topics <- topics[,c(6, 1, 2, 3, 4, 5, 7)]

# write results to db
dbWriteTable(con, "topics",  value = reordered_topics, append = TRUE, row.names = FALSE)

现在我的问题:当我将我的数据框写入数据库时​​,我收到错误,即有重复的 id:

RS-DBI 驱动程序:(无法检索结果:错误:重复键值违反唯一约束“topics_pkey”详细信息:键(id)=(1)已存在。上下文:复制主题,第 1 行

这很奇怪,因为我已经检查了 id 确实在多大程度上与 `SELECT COUNT(DISTINCT id) FROM tweets;。返回的数字与选择整个表中的所有 id 相同。

我认为我将结果组合到数据框的方式出了点问题topicmodels。但我无法弄清楚发生了什么。有谁知道这里发生了什么?

4

0 回答 0