我正在尝试删除具有 180 万条记录的文件中的相同行并创建一个新文件。使用以下命令:
sort tmp1.csv | uniq -c | sort -nr > tmp2.csv
运行脚本会创建一个sort.exe.stackdump
包含以下信息的新文件:
"Exception: STATUS_ACCESS_VIOLATION at rip=00180144805
..
..
program=C:\cygwin64\bin\sort.exe, pid 6136, thread main
cs=0033 ds=002B es=002B fs=0053 gs=002B ss=002B"
该脚本适用于 10 行的小文件。似乎sort.exe
无法处理这么多的记录。如何处理包含超过 180 万条记录的大文件?除了 ACCESS,我们没有任何数据库,我试图在 ACCESS 中手动执行此操作。