为了保护研究对象在数据集中不被识别,我对在 R 中匿名化向量很感兴趣。但是,我也希望在编写研究时能够参考输出(例如“主题 [随机 id]显示...”)。我发现我可以使用 anonymizer 包轻松生成短散列,但是虽然以书面形式引用短散列是可行的,但它并不完全理想(例如“主题 f4d35fab 显示......”很难记住,有点满嘴,并且很难区分其他散列数据,例如“来自 8b3bd334 的主题 f4d35fab 显示......”)。
有没有办法将哈希转换为随机的人类可读字符串,或者以非以加密为中心的方式匿名数据?