所以我想确保我的程序在最佳状态下运行,例如,如果需要 5 个小时才能完成,我应该在夜间运行它!
我知道这个程序会结束,理论上我应该能够根据大小确定长度。所以这是实际的问题:
我需要打开 16 个腌制文件,这些文件是 pandas DataFrame,总共 1.5 个演出。请注意,我还需要使用总计 20 个演出的 DataFrame 来执行此操作,因此我需要的答案是一种告诉给定总演出量以下代码需要多长时间的方法:
import pickle
import os
def pickleSave(data, pickleFile):
output = open(pickleFile, 'wb')
pickle.dump(data, output)
output.close()
print "file has been saved to %s" % (pickleFile)
def pickleLoad(pickleFile):
pkl_file = open(pickleFile, 'rb')
data = pickle.load(pkl_file)
pkl_file.close()
return data
directory = '/Users/ryansaxe/Desktop/kaggle_parkinsons/GPS/'
files = os.listdir(directory)
dfs = [pickleLoad(directory + i) for i in files]
new_file = directory + 'new_file_dataframe'
pickleSave(dfs,new_file)
所以现在我需要编写一个如下所示的函数:
def time_fun(data_size_in_gigs):
#some algorithm here
print "your code will take ___ hours to run"
我不知道如何解决这个问题,或者是否有可能。有任何想法吗?