我使用 ffbase 包将一个大数据集(约 600 万行)导入到 R 中,该包列出了在巴西就读高中的人。原则上,我有 2 列:Id(学生 ID 号)和 University(机构名称)。
我想创建一个列 - 在我的示例中名为 Group - 将每所大学与其教育组相关联:
Id University Group
000001 Anhanguera Kroton
000002 Unopar Kroton
000003 Anhembi Laureate
000004 FMU Laureate
PS:我的数据集中没有关于教育群体的信息,但是,我有我需要的关于哪个群体对应于每所大学的信息。这样,我需要将此详细信息附加到我的数据中。
PS2:大学列的类是ff_vector。
我感谢您可能做出的任何贡献。