我已将此文件读入 R 中的 data.frame,如您所见,第 5 列包含一些用“;”分隔的值。是否可以将此 data.frame 转换为更大的 data.frame 并将第 5 列扩展为二进制向量?
> head(uinfo)
V1 V2 V3 V4 V5
1 100044 1899 1 5 831;55;198;8;450;7;39;5;111
2 100054 1987 2 6 0
3 100065 1989 1 57 0
4 100080 1986 1 31 113;41;44;48;91;96;42;79;92;35
5 100086 1986 1 129 0
6 100097 1981 1 75 0
所以,作为一个更简单的例子,如果我的前两行是:
1 100044 1899 1 5 1;2;4;7
2 100054 1987 2 6 3;8
我想得到:
1 100044 1899 1 5 1 1 0 1 0 0 1 0 0 0
2 100054 1987 2 6 0 0 1 0 0 0 0 1 0 0
我是否必须使用其他程序(例如 python)来预处理数据,或者是否可以通过某些应用函数来这样做?
谢谢