我也在学习使用 topicmodels 包和 R,并通过使用探索了它的示例数据集之一
str(测试数据)
'data.frame':3104 obs。5个变量:
$ Article_ID: int 41246 41257 41268 41279 41290 41302 41314 41333 41344 41355 ...
$ 日期 : chr "1-Jan-96" "2-Jan-96" "3-Jan-96" "4-Jan-96" ...
$ Title : chr “国家较小的监狱努力应对囚犯人数的激增” “联邦陷入困境,犹豫不决” “漫长而代价高昂的前奏对改变总统竞选的情节几乎没有影响” “波斯尼亚塞族的最高领导人现在受到来自内部的攻击“……
$ 主题 : chr “监狱被顽固的罪犯压得喘不过气来” “联邦预算僵局对各州的影响” “1996 年总统选举的竞争者” “从内部批评的波斯尼亚塞族领导人” ...
$主题代码:int 12 20 20 19 1 19 1 1 20 15 ...
如果我想在 R 中按照上述格式创建数据集,该怎么做?