我现在要在 Ruby 中操作大文件。
我要做的是将标题行添加到一个千兆字节大小的文件中,该文件包含一系列没有换行符的字符,并将结果输出到一个新文件中。(如下示例所示)。序列中的每个位置都可以有四个字符之一(a、c、g、t)
我的问题是
我应该以二进制文件还是文本文件的形式打开千兆字节大小的文件和输出文件?
我想知道一个示例代码。(如果可能的话,我不想一次将千兆字节大小的文件的所有数据加载到我的计算机内存中。)
谢谢。
示例 假设程序名称为 add-header-giga(第一个参数是 header-line,第二个参数指定输入文件名。输出文件名是 output-file)
>cat 千兆字节大小文件.txt cctgcaggagcagagcaaagaggtggccatccgcatctttcgggctgccagtttcgctcctggaggctgtgcag.... >add-header-giga DNA-sequence-from-Homo-Sapiens giga-byte-size-file.txt >cat 输出文件 来自智人的 DNA 序列 cctgcaggagcagagcaaagaggtggccatccgcatctttcgggctgccagtttcgctcctggaggctgtgcag....