这可能已经被问过了,但我找不到它。我有一个数据集,其中列名是数字,行名是样本名(见下文)。
"599.773" "599.781" "599.789" "599.797" "599.804" "599.812" "599.82" "599.828"
"A" 0 0 0 0 0 2 1 4
"B" 0 0 0 0 0 1 0 3
"C" 0 0 0 0 2 1 0 1
"D" 3 0 0 0 3 1 0 0
我想按总和对列进行分箱,例如每 4 列,然后用分箱列的平均值命名新列。对于上表,我最终会得到:
"599.785" "599.816"
"A" 0 7
"B" 0 4
"C" 0 4
"D" 3 4
新列名 599.785 和 599.816 是已分箱的列名的平均值。我认为像 cut 这样的东西适用于数字向量,但我不确定如何为大型数据帧实现它。谢谢你的帮助!