令我困惑的是,有一个tfdv.load_statistics()
功能,但没有相应的tfdv.write_statistics()
功能。如何保存统计信息,然后再次加载它们?
例如
import tensorflow_data_validation as tfdv
stats = tfdv.generate_statistics_from_dataframe(df)
# how do I save?
# load back for later use
saved_stats = tfdv.load_statistics('saved_stats.stats')
我可以将字符串表示形式保存到文件中,但这不是 load_statistics 期望的格式。
with open('saved_stats.stats', 'w') as o:
o.write(str(stats))
有人指点吗?