我有看起来像这样的数据,比如说制表符分隔的格式:
Sample Dog Cat Tarsier
A47 1 7 2
A48 3 3 4
A51 2 1 8
A53 0 0 0
A54 1 7 2
A57 0 0 10
虽然这里可能不清楚,但样本名称在第一列,值对应于 Dog、cat 或 Tarsier。我想保留,比如说每个样本的 90% 的数据,并在 PYTHON 中删除其余的数据。例如,对于示例 A47,我想检索如下内容:
Cat Tarsier
A47 7 2
这对我来说很难,因为每个样本我需要 3 条信息:样本名称、动物和数量。有什么想法吗?提前致谢
根据下面的评论,第二行可能包括所有数字,但排除可能存在的所有其他数字(未显示)。这是因为在这种情况下,如果没有第二个 3,则只有不到 90% 的数据,这可能比拥有 >90% 的数据更糟糕。如何做到这一点超出了我的 PYTHON 编程技能。