我在一个名为 plugins_Apache_module 的数据框中有一个字段,它包含如下字符串:
c("mod_perl/1.99_16,mod_python/3.1.3,mod_ssl/2.0.52",
"mod_auth_passthrough/2.1,mod_bwlimited/1.4,mod_ssl/2.2.23",
"mod_ssl/2.2.9")
我需要一个关于模块的频率表,以及它们的版本。
在 R 中执行此操作的最佳方法是什么?由于在 R 中相当新,我见过 strsplit、gsub,一些聊天室还建议我使用qdap 包。
理想情况下,我希望将字符串转换为每个模块都有一列的数据框,如果模块在那里,那么版本将进入该特定字段。我将如何完成这样的转变?
如果我想要顶级频率,建议使用哪种数据帧格式 - 比如说 mod_ssl(所有版本)以及关系选项(mod_perl 经常与 mod_ssl 一起使用)。
在推入数据帧进行处理时,我不太确定如何处理这种可变长度的数据。欢迎任何建议。
我认为正确的答案看起来像:
mod_perl mod_python mod_ssl mod_auth_passthrough mod_bwlimited
1.99_16 3.1.3 2.0.52
2.2.23 2.1 1.4
2.2.9
所以基本上第一位变成一列,后面的版本变成行条目