Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我希望有人可以帮助我,或者至少给我一个好的建议。我有一个大型数据框来存储科学论文(按作者/年份/期刊分类)。大多数科学论文给了我更多的记录,所以我正在尝试编写一个函数(直到现在还没有成功),它返回一个唯一值(命名为 n),用于标识记录所属的论文。
要计算唯一值,您可以使用包中的digest函数digest。例如,
digest
library(digest) digest(c("Granger", "1987", "Econometrica"))
返回发布的唯一 MD5 字符串。digest不能向量化,即您必须使用sapply或类似方法来计算数据框每一行的 id。
sapply