0

我希望有人可以帮助我,或者至少给我一个好的建议。我有一个大型数据框来存储科学论文(按作者/年份/期刊分类)。大多数科学论文给了我更多的记录,所以我正在尝试编写一个函数(直到现在还没有成功),它返回一个唯一值(命名为 n),用于标识记录所属的论文。

4

1 回答 1

2

要计算唯一值,您可以使用包中的digest函数digest。例如,

library(digest)
digest(c("Granger", "1987", "Econometrica"))

返回发布的唯一 MD5 字符串。digest不能向量化,即您必须使用sapply或类似方法来计算数据框每一行的 id。

于 2012-12-28T17:57:07.597 回答