4

仅在 Python 中,并使用来自 Pandas 数据框的数据,我如何使用PuLP解决线性编程问题,就像在 Excel 中一样?应该为“新预算”列下的每个渠道分配多少预算,以便我们最大化估计的成功总数?我真的在寻找一个使用来自数据框的数据的具体示例,而不是真正的高级建议。

问题数据设置

    Channel  30-day Cost  Trials  Success  Cost Min  Cost Max  New Budget
0  Channel1      1765.21    9865      812    882.61   2647.82           0
1  Channel2      2700.00   15000      900   1350.00   4050.00           0
2  Channel3      2160.00   12000      333   1080.00   3240.00           0

这是一个最大化问题。

目标函数为:

objective_function = sum((df['New Budget']/(df['30-day Cost']/df['Trials']))*(df['Success']/df['Trials']))

约束是:

  1. 的总和df['New Budget']必须等于5000
  2. New Budget给定频道Cost Min
  3. New Budget给定频道Cost Max

任何想法如何使用 PuLP 或任何其他求解器方法翻译这个熊猫数据帧求解器线性问题?最终结果将是您在下图中看到的。

期望的结果

4

1 回答 1

7

通常,您会创建一个变量字典(x在这种情况下)和一个模型变量(mod在这种情况下)。要创建使用sum变量乘以一些标量的目标,将该结果添加到mod. >=您可以通过使用、<=或再次计算变量的线性组合==并将该约束添加到 来构造约束mod。最后你mod.solve()用来得到解决方案。

import pulp

# Create variables and model
x = pulp.LpVariable.dicts("x", df.index, lowBound=0)
mod = pulp.LpProblem("Budget", pulp.LpMaximize)

# Objective function
objvals = {idx: (1.0/(df['30-day Cost'][idx]/df['Trials'][idx]))*(df['Success'][idx]/float(df['Trials'][idx])) for idx in df.index}
mod += sum([x[idx]*objvals[idx] for idx in df.index])

# Lower and upper bounds:
for idx in df.index:
    mod += x[idx] >= df['Cost Min'][idx]
    mod += x[idx] <= df['Cost Max'][idx]

# Budget sum
mod += sum([x[idx] for idx in df.index]) == 5000.0

# Solve model
mod.solve()

# Output solution
for idx in df.index:
    print idx, x[idx].value()
# 0 2570.0
# 1 1350.0
# 2 1080.0

print 'Objective', pulp.value(mod.objective)
# Objective 1798.70495012

数据:

import numpy as np
import pandas as pd
idx = [0, 1, 2]
d = {'channel': pd.Series(['Channel1', 'Channel2', 'Channel3'], index=idx),
     '30-day Cost': pd.Series([1765.21, 2700., 2160.], index=idx),
     'Trials': pd.Series([9865, 1500, 1200], index=idx),
     'Success': pd.Series([812, 900, 333], index=idx),
     'Cost Min': pd.Series([882.61, 1350.00, 1080.00], index=idx),
     'Cost Max': pd.Series([2647.82, 4050.00, 3240.00], index=idx)}
df = pd.DataFrame(d)
df
#    30-day Cost  Cost Max  Cost Min  Success  Trials   channel
# 0      1765.21   2647.82    882.61      812    9865  Channel1
# 1      2700.00   4050.00   1350.00      900    1500  Channel2
# 2      2160.00   3240.00   1080.00      333    1200  Channel3
于 2015-10-16T01:01:30.500 回答