我有一个 1GB 的文件,里面满是艺术家的名字,他们的歌曲用制表符分隔。
Artist1 Song1 Song2 Song3 ...
Artist2 Song1 Song2 Song3 ...
我想按字母顺序将大文件拆分为 26 个不同的小文件。
例如,我希望所有以 A 开头的艺术家都在一个名为 Artists_A.txt 的文件中,所有以 B 开头的艺术家都在一个名为 Artists_B.txt 的文件中,等等。
我知道 sort 和 split 命令,但是有没有办法利用 split 命令在某些条件下进行拆分?另外,如果有更简单的方法,我宁愿不要单独阅读每一行并将其放入正确的文件中。
另外,好奇是否有办法在 Python 中做到这一点。
编辑:我认为 csplit 可能是我问题的答案。
编辑: AWK 是使用空格分隔数据时要使用的程序!:)