text-files - 如何从庞大的数据文件中提取特定行？

Question

我有一个非常大的数据文件，大约 32GB。该文件由大约 130k 行组成，每行主要包含数字，但也很少有字符。

我需要执行的任务非常明确：我必须提取 20 行并将它们写入一个新的文本文件。

我知道要复制的 20 行中每一行的确切行号。

所以问题是：如何从大文件中提取特定行号的内容？我在 Windows 上。是否有可以执行此类操作的工具，或者我需要编写一些代码？

如果没有直接的方法，我认为一种可能的方法是首先提取原始文件的小块（以便每个块包含一个或多个要提取的行），然后使用标准编辑器查找这些行每个区块内。在这种情况下，问题是：如何在 Windows 上逐行拆分大文件？我使用了一个名为HJ-Split的工具，它非常适用于大文件，但它只能按大小拆分，不能按行拆分。

score 0 · Accepted Answer

安装[1] Babun Shell（或Cygwin，但我推荐 Babun），然后使用sed此处描述的命令：如何在 Unix 上从文本文件中提取预定范围的行？

[1] 安装 Babun 意味着实际上只是将其解压缩到某个地方，因此您不必在服务器上拥有管理员权限。

text-files - 如何从庞大的数据文件中提取特定行？

1 回答 1

Related

Reference