我有这个相当大的 CSV 文件(15 Gb),我需要从中读取大约 100 万行随机行。据我所见 - 并实现 - Python 中的 CSV 实用程序只允许在文件中按顺序迭代。
将所有文件读入内存以使用一些随机选择非常耗时,并且遍历所有文件并丢弃一些值并选择其他值非常耗时,所以有什么方法可以从 CSV 文件中选择一些随机行和只读那一行?
我试过没有成功:
import csv
with open('linear_e_LAN2A_F_0_435keV.csv') as file:
reader = csv.reader(file)
print reader[someRandomInteger]
CSV 文件示例:
331.093,329.735
251.188,249.994
374.468,373.782
295.643,295.159
83.9058,0
380.709,116.221
352.238,351.891
183.809,182.615
257.277,201.302
61.4598,40.7106