为整数线性规划设计目标函数

Question

我正在努力为整数线性规划模型设计目标函数。 目的是确定两个基因的拷贝数以及是否发生了基因转换事件（其中一个拷贝被另一个拷贝覆盖，看起来一个拷贝已被删除，但净拷贝数未更改）。

问题涉及两个数据向量P_A和P_B 。 这些向量包含大于零的连续值，这些连续值对应于在每个位置进行的拷贝数测量。 P_{A,i}在基因上不一定与P_{B,i} ，因为每个副本的位置都是唯一的（并且可以映射到基因组中的绝对位置）。

鉴于此，我的计划是尝试使决策变量与跨不同基因组窗口的测量数据之间的差异最小化，从而为我提供对应于同一区域的两个数据向量的不同片段。

决策变量：

A_w = copy number of A in window in {0,1,2,3,4}
B_w = copy number of B in window in {0,1,2,3,4}
C_w = gene conversion in {-2,-1,0,1,2}

然后的目标是使以下等式的左侧和右侧之间的差异最小化：

A_w - C_w ~= mean(P_{A,W})
B_w + C_w ~= mean(P_{B,W})

受少数约束，例如2 <- A_w + B_w <= 4

但是我不确定如何将其表述为最小化的函数。 我有两个方程并不是真正的函数，决策变量没有系数。

我也不确定如何处理C_w 。

我也不确定如何将结果重新组合在一起。 在每个窗口中求解完LP之后，我仍然需要将其合并为一个全基因调用（并理想地确定哪个窗口的C_w值C_w 。

Answer 1

创建LpProblem实例：

problem = LpProblem("Another LpProblem", LpMinimize)

目标（根据您上面含糊的描述）：

problem += (mean(P_{A,W}) - (A_w - C_w)) + (mean(P_{B,W}) - (B_w + C_w))

从您这个非常模糊的问题中我可以说出这一切。 您需要更明确地说明“将结果重新组合”或“处理C_w中的负值”之类的术语。 添加您当前的代码段和您所得到的错误以获取更多详细信息。