0

我有一个非常大的数据文件,大约 32GB。该文件由大约 130k 行组成,每行主要包含数字,但也很少有字符。

我需要执行的任务非常明确:我必须提取 20 行并将它们写入一个新的文本文件。

我知道要复制的 20 行中每一行的确切行号。

所以问题是:如何从大文件中提取特定行号的内容?我在 Windows 上。是否有可以执行此类操作的工具,或者我需要编写一些代码?

如果没有直接的方法,我认为一种可能的方法是首先提取原始文件的小块(以便每个块包含一个或多个要提取的行),然后使用标准编辑器查找这些行每个区块内。在这种情况下,问题是:如何在 Windows 上逐行拆分大文件?我使用了一个名为HJ-Split的工具,它非常适用于大文件,但它只能按大小拆分,不能按行拆分。

4

1 回答 1

0

安装[1] Babun Shell(或Cygwin,但我推荐 Babun),然后使用sed此处描述的命令:如何在 Unix 上从文本文件中提取预定范围的行?

[1] 安装 Babun 意味着实际上只是将其解压缩到某个地方,因此您不必在服务器上拥有管理员权限。

于 2015-06-22T11:29:37.253 回答