1

我正在尝试在数据集 (CSV) > 2 Gig 上运行张量流数据验证功能。一段时间后它崩溃了。如果数据集在 1 Gig 左右,它运行得很好。如何在不使用云数据流服务的情况下处理大型数据集。

4

1 回答 1

0

您的 PC 的 RAM 是多少?您想在 Tensorflow 数据验证中使用哪个功能?

要利用 PC 的所有核心进行处理,您可以尝试以下功能:

tfdv.generate_statistics_from_dataframe(dataframe,   stats_options=options.StatsOptions(), n_jobs= -1)

如果您设置该参数,n_jobs = -1它将使用您 PC 的所有 4 个 CPU 内核。

于 2019-06-20T07:03:55.857 回答