我正在从一个看起来像这样的文件中读取一个稀疏表:
1 0 7 0 0 1 0 0 0 5 0 0 0 0 2 0 0 0 0 1 0 0 0 1
1 0 0 1 0 0 0 3 0 0 0 0 1 0 0 0 1
0 0 0 1 0 0 0 2 0 0 0 0 1 0 0 0 1 0 1 0 0 1
1 0 0 1 0 3 0 0 0 0 1 0 0 0 1
0 0 0 1 0 0 0 2 0 0 0 0 1 0 0 0 1 0 1 0 0 1 1 2 1 0 1 0 1
注意行长不同。
每行代表一个模拟。每行中第 i 列中的值表示在此模拟中观察到值 i-1 的次数。例如,在第一个模拟中(第一行),我们得到一个值为“0”(第一列)的结果,7 个值为“2”的结果(第三列)等等。
我希望为所有模拟结果创建一个平均累积分布函数 (CDF),以便以后可以使用它来计算真实结果的经验 p 值。
为此,我可以先总结每一列,但我需要为 undef 列取零。
如何读取具有不同行长的表格?如何总结用 0 替换“undef”值的列?最后,如何创建 CDF?(我可以手动执行此操作,但我想有一些包可以执行此操作)。