我正在尝试将单个目录中的 115 个文件组合在一起。以下是文件外观的示例:
文件一
表型标记 值 1 值 2 值 3 P1 1:54390 0.2948 0.4837 0.2198 P2 1:54390 0.3482 0.6583 0.1937 P3 1:54390 0.1983 0.1837 0.4177 P4 1:54390 0.9128 0.9930 0.0043 P5 1:54390 0.1938 0.0109 0.6573 P1 1:69402 0.2039 0.2340 0.2346 P2 1:69402 0.0239 0.3545 0.1987 P3 1:69402 0.8239 0.8677 0.4177 P4 1:69402 0.2498 0.3099 0.0765 P5 1:69402 0.0982 0.0198 0.0123
文件二
表型标记 值 1 值 2 值 3 P1 9:21048 0.8568 0.1231 0.1654 P2 9:21048 0.1244 0.3213 0.1223 P3 9:21048 0.9869 0.1231 0.4776 P4 9:21048 0.3543 0.7657 0.0033 P5 9:21048 0.1231 0.3213 0.8578 P1 9:87758 0.1231 0.8768 0.4653 P2 9:87758 0.7657 0.5435 0.8845 P3 9:87758 0.9879 0.8437 0.7464 P4 9:87758 0.1231 0.9879 0.5523 P5 9:87758 0.9879 0.9868 0.0006
所以基本上每个文件都有一组独特的标记,其中所有 5 个表型(P1、P2、P3、P4、P5)都与它们匹配。
几件事:
A. 我希望一个文件看起来像这样(下图),其中数据按表型组织
表型标记 值 1 值 2 值 3 P1 1:54390 0.2948 0.4837 0.2198 P1 1:69402 0.2039 0.2340 0.2346 P1 9:21048 0.8568 0.1231 0.1654 P1 9:87758 0.1231 0.8768 0.4653 P2 1:54390 0.3482 0.6583 0.1937 P2 1:69402 0.0239 0.3545 0.1987 P2 9:21048 0.1244 0.3213 0.1223 P3 1:54390 0.1983 0.1837 0.4177 P3 1:69402 0.8239 0.8677 0.4177 P3 9:21048 0.9869 0.1231 0.4776 P3 9:87758 0.9879 0.8437 0.7464 P4 1:54390 0.9128 0.9930 0.0043 P4 1:69402 0.2498 0.3099 0.0765 P4 9:21048 0.3543 0.7657 0.0033 P4 9:87758 0.1231 0.9879 0.5523 P5 1:54390 0.1938 0.0109 0.6573 P5 1:69402 0.0982 0.0198 0.0123 P5 9:21048 0.1231 0.3213 0.8578 P5 9:87758 0.9879 0.9868 0.0006
我想在bash中执行此操作。谁能给我一些见解?我对这种语言很陌生!
B. 一旦我有了这个巨大的文件,我还想根据表型保存单独的文件(我计划在中间做一些质量控制步骤),所以我会有 5 个文件用于 P1、P2、P3、P4 , 和 P5 以及其他列中的各自数据)