我在 python 中创建了这个函数,用于为产品数据集生成不同的价格组合。因此,如果产品的价格是 10 美元,那么不同的可能价格将是 [10,11,12,13,14,15]。例如:
df = pd.DataFrame({'Product_id': [1, 2], 'price_per_tire': [10, 110]})
我的功能:
def price_comb(df):
K= [0,1,2,3,4,5]
final_df = pd.DataFrame()
c=0
for j in K:
c+=1
print('K count=' + str(c))
for index,i in df.iterrows():
if (i['price_per_tire']<=100):
i['price_per_tire'] = i['price_per_tire'] + 1*j
elif ((i['price_per_tire']>100) & (i['price_per_tire']<200)):
i['price_per_tire'] = i['price_per_tire'] + 2*j
elif ((i['price_per_tire']>200) & (i['price_per_tire']<300)):
i['price_per_tire'] = i['price_per_tire'] + 3*j
elif i['price_per_tire']>=300:
i['price_per_tire'] = i['price_per_tire'] + 5*j
final_df = final_df.append(i)
return final_df
当我运行这个函数时,输出是
df = pd.DataFrame({'Product_id': [1,1,1,1,1,1, 2,2,2,2,2], 'price_per_tire': [10,11,12,13,14,15, 110,112,114,116,118,120]})
545k 行数据集如何花费大量时间(最多 2 天)。我试图找到更快执行此操作的方法。任何帮助将不胜感激