r - 在 R 中的 ompr 包中，我如何改写我的目标/约束/变量以避免“问题太大”错误？

Question

我正在尝试使用ompr同事之前使用 CPLEX/GAMS 拟合的包（特别是此处描述的包：Haight et al. 2021）来学习在 R 中拟合线性整数规划优化模型。我正在我大学的 Linux 超级计算服务器上运行我的实现，它有 248gb 的内存，我认为这足以完成这项工作。

这是我的代码和来自服务器的故障报告的输出：

#Read in the necessary pre-generated data and packages

library(pacman); library(dplyr); library(ROI); library(ompr); library(ompr.roi)
n.ij = readRDS(file="nij1.rds") #An indexing vector.
B = 10 #Budget constraint--inspect only 10 lakes maximum

#Initialize model prior to setting the objective.
mod1 = MILPModel() %>% 
add_variable(u[i, j], type = "binary", i = 1:n.ij, j = 1:n.ij) %>%
add_variable(x[i], type = "binary", i = 1:n.ij) %>% 
add_variable(x[j], type = "binary", j = 1:n.ij) %>% 
add_constraint(x[i] + x[j] >= u[i,j], i = 1:n.ij, j = 1:n.ij) %>% 
add_constraint(sum_expr(x[i], i = 1:n.ij) <= B)
 
#Read in the relevant adjacency matrix of boat movements between every pair of lakes.
boats.n.ij = readRDS(file="boatsnij1.rds")

#Some system and object size info.
system(paste0("cat /proc/",Sys.getpid(),"/status | grep VmSize"))
VmSize: 13017708 kB
object.size(mod1)
6798778288 bytes

#Now, set objective with this specific boats.n.ij file.
mod1.full = mod1 %>% 
set_objective(sum_expr(u[i,j] * boats.n.ij[i, j], i = 1:n.ij, j = 1:n.ij))

Error in subCsp_ij(x, i, j, drop = drop) : 
  Cholmod error 'problem too large' at file ../Core/cholmod_sparse.c, line 89
Calls: %>% ... [ -> callGeneric -> eval -> eval -> [ -> [ -> subCsp_ij
Execution halted

为了创建可重现的示例，可以按如下方式生成n.ij和的模拟版本：boats.n.ij

library(Matrix)

boats = rpois(7940*7940, 2)
keep = sample(c(0,1), 7940*7940, replace=T, prob = c(0.8, 0.2))
boat.dat = boats*keep

boats.n.ij = matrix(boat.dat, nrow=7940, ncol=7940)
diag(boats.n.ij) = 0
boats.n.ij = Matrix(boats.n.ij, sparse = T)

boats.n.ij[1:10, 1:10]

n.ij = 1:7940

为什么我无法将目标添加到我的模型中？仅仅是我在暗示存在三个非常大的矩阵（决策矩阵u、boats.n.ij矩阵和它们的乘积矩阵）吗？是不是因为模型已经是6.8gb左右的文件了？RI 遇到的内存或对象大小是否有上限？这些功能是否无法考虑具有这么多决策点的目标？

我可以确认我已经能够在一个非常小的优化子集上运行模型的缩小版本boats.n.ij，所以我认为这不是我的模型规范的问题，但我可能是错的.. .我还应该明确说明我对不涉及在 R 中解决此模型的解决方案不感兴趣，因为这是这里的明确目标。但是，如果有更强大的包可用，我愿意使用其他包（尽管我喜欢这个包）。

注意：与我引用的论文不同，我不再需要b.ij我的同事确实使用的向量，所以这不是这里的问题。

编辑：请注意，@nicola 的目标改革将设置并解决，但原始约束和/或变量将不再与它具有相同的关系，因此它会拟合与我想要拟合的模型不同的模型。在原始构造中，x[i] 中最多只有 10 个值，因此决策变量 u[i,j] 中 i 的最多 10 个唯一值将被允许为 1，这要归功于涉及我们的约束。预算参数B. 在@nicola 的版本中，在 u[i,j] 中允许有超过 10 个 i 的唯一值是 1。实际上，我至少不清楚最初编写的约束如何与@nicola 的目标相互作用，如果有的话。但是，我怀疑像@nicola 这样的目标绝对可以用来利用我的boats.n.ij 矩阵的稀疏性，以避免“问题太大”错误，但它需要相应地修改变量和/约束. 我更改了问题的标题，以便更清楚地了解我在寻找什么——我想避免错误，但要适合等效模型。

第二次编辑：@nicola 的解决方案毕竟有效！ompr但是，自从我发布此问题以来，由于更新，变量和约束需要进行一些修改。请参阅以下玩具示例：

library(Matrix)
library(slam)
library(dplyr)
library(tidyr)
library(ROI)
library(ompr)
library(ompr.roi)
library(Rglpk)
library(ROI.plugin.glpk)
library(lattice)

set.seed(101)
N = 500
boats = rpois(N*N, 2)
keep = sample(c(0,1), N*N, replace=T, prob = c(0.97, 0.03))
boat.dat = boats*keep

boats.n.ij = Matrix(boat.dat, nrow=N, ncol=N, sparse =T)
diag(boats.n.ij) = 0

boats.n.ij[1:10, 1:10]

n.ij = N
B = 5

mod1 = MIPModel() %>% 
  add_variable(u[i, j], type = "binary", i = 1:n.ij, j = 1:n.ij) %>%
  add_variable(x[i], type = "binary", i = 1:n.ij) %>% 
  add_variable(y[j], type = "binary", j = 1:n.ij) %>% 
  add_constraint(x[i] == y[j], i = 1:n.ij, j = 1:n.ij, i == j) %>% 
  add_constraint(sum_over(x[i], i = 1:n.ij) <= B) %>% 
  add_constraint(u[i,j] <= x[i] + y[j], i = 1:n.ij, j = 1:n.ij)

boatsSTM = as.simple_triplet_matrix(boats.n.ij)

#setting the objective function
mod.2nd = mod1 %>% set_objective(sum_over(u[boatsSTM$i[k], boatsSTM$j[k]] * boatsSTM$v[k], k = 1:length(boatsSTM$i)))

mod.2nd.solved = mod.2nd %>% 
  solve_model(with_ROI("glpk", verbose=TRUE))


testB = get_solution(mod.2nd.solved, u[i,j])
test2B = pivot_wider(testB, names_from = j, values_from = value) %>% dplyr::select(-variable, -i)
test3B = as.matrix(test2B, nrow=100)

levelplot(test3B)

score 1 · Accepted Answer

一次尝试：

require(slam)
boatsSTM<-as.simple_triplet_matrix(boats.n.ij)
...

#setting the objective function
set_objective(sum_expr(u[boatsSTM$i[k], boatsSTM$j[k]] * boatsSTM$v[k], k = 1:length(boatsSTM$i)))

我们利用矩阵的稀疏性。在一个简单的三元组矩阵中，您只需列出不为零的值，这意味着如果未列出元素则等于零。这些值用(i, j, v)三元组表示，其中i表示行索引、j列索引和v值。因此，例如，一个(2, 4, 10.32)三元组表示m[2, 4] = 10.32.

在您的sum_expr行中，我们利用这一点并仅添加不同于零的元素。我们不会将的每个元素u与的每个元素相乘boats，因为大多数都是零且与总和无关；相反，我们只是对重要的元素执行上述操作。

该slam包实现了简单的三元组矩阵，它的根只是一个i,j和v值的列表。

r - 在 R 中的 ompr 包中，我如何改写我的目标/约束/变量以避免“问题太大”错误？

1 回答 1

Related

Reference