我有一个 300 GB 的文本文件,其中包含超过 25 万条记录的基因组数据。有一些记录包含不良数据,我们的基因组学程序“Popoolution”允许我们用星号注释掉“不良”记录。我们的问题是我们找不到可以加载数据的文本编辑器,以便我们可以注释掉不良记录。有什么建议么?我们有 Windows 和 Linux 机器。
更新:更多信息
程序 Popoolution ( https://code.google.com/p/popoolation/ ) 在到达“坏”记录时崩溃,为我们提供了行号,然后我们可以将其注释掉。具体来说,我们从 Perl 收到一条消息,上面写着“F#€%& Scaffolding”。该手册建议我们可以使用星号来注释掉坏行。可悲的是,我们将不得不多次重复这个过程......
再想一想……有没有一种方法可以让我们在不打开整个文本文件的情况下将星号添加到行中。考虑到我们将不得不重复该过程未知次数,这可能非常有用。