[英]Gekko: Problem with obtaining the solution (offline, Solver=1, 2, or 3) or in a reasonable time (online, remote=True)
下面的简单优化模型(支持向量机,请参阅https://www.supplychaindataanalytics.com/creating-a-support-vector-machine-using-gekko-in-python/了解更多信息)是一个带有 T= 的 NLP 86 和 U=6(为此最小工作示例生成的数据集)。
import numpy as np
import gekko as op
import itertools as it
a = np.random.rand(86, 6)
b = np.random.randint(0,6, size=(86))
C = range(len(set(b))) #Set of classes
U = range(len(a[0])) #Set of input features
T = range(len(b)) #Set of the training points
def model (C,U,T,a,b,solve="y"):
save_b = tuple(b)
alpha_c=[None for j in C]
z_c=[None for j in C]
for j in C:
for t in T:
if b[t] == j:
b[t] = +1
else:
b[t] = -1
print(b)
m = op.GEKKO(remote=False, name='SupportVectorMachine')
alpha = {t: m.Var(lb=0, ub=None) for t in T}
n_a = {(t,i): a[t][i] for t,i in it.product(T,U)}
n_b = {t: b[t] for t in T}
objs = {0: m.sum([alpha[t] for t in T]) - 0.5*m.sum([alpha[t]*alpha[tt] * n_b[t]*n_b[tt] * m.sum([n_a[(t,i)]*n_a[(tt,i)] for i in U]) for t,tt in it.product(T,T)])}
cons = {0: {0: ( m.sum([alpha[t]*n_b[t] for t in T]) == 0) for t in T}}
m.Maximize(objs[0])
for keys1 in cons:
for keys2 in cons[keys1]: m.Equation(cons[keys1][keys2])
if solve == "y":
m.options.SOLVER=1
m.solve(disp=False)
for keys in alpha:
alpha[keys] = alpha[keys].value[0]
print(f"alpha[{keys}]", alpha[keys])
x = [None for i in U]
for i in U:
x[i]=sum(alpha[t]*b[t]*n_a[(t,i)] for t in T)
for t in T:
if alpha[t]>0:
z=b[t] - sum(x[i]*n_a[(t,i)] for i in U)
break
b = list(save_b)
alpha_c[j]=alpha
z_c[j]=z
return m,z,alpha
m, z, alpha = model(C,U,T,a,b) #Model and solve the problem
使用m.options.SOLVER=1
,代码退出:
FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\USERNAME\\AppData\\Local\\Temp\\tmpj66p0g5qsupportvectormachine\\options.json'
使用m.options.SOLVER=2
,代码退出:
FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\USERNAME\\AppData\\Local\\Temp\\tmpgat29b25supportvectormachine\\options.json'
使用m.options.SOLVER=3
,代码退出:
FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\USERNAME\\AppData\\Local\\Temp\\tmpgat29b25supportvectormachine\\options.json'
使用m = op.GEKKO(remote=True, name='SupportVectorMachine')
代码似乎需要太多时间来运行并且没有报告输出。
我想知道为什么会发生这种情况以及如何对代码进行故障排除? 我们是否需要每次都为求解器的算法提供初始猜测? (我正在使用gekko (1.21.5)
。)提前致谢。
ٍ编辑:在 Google 的 Colaboratory 上,它以:
Exception: @error: Solution Not Found
尝试IMODE=2
(回归模式),其中模型仅定义一次并自动应用于每个数据点。 这大大提高了模型编译的速度。 下面是 IMODE=2 的最小示例。 对于同一示例和 非线性回归示例,还可以与 Scipy Minimize 进行比较。
import numpy as np
from gekko import GEKKO
# load data
xm = np.array([18.3447,79.86538,85.09788,10.5211,44.4556, \
69.567,8.960,86.197,66.857,16.875, \
52.2697,93.917,24.35,5.118,25.126, \
34.037,61.4445,42.704,39.531,29.988])
ym = np.array([5.072,7.1588,7.263,4.255,6.282, \
6.9118,4.044,7.2595,6.898,4.8744, \
6.5179,7.3434,5.4316,3.38,5.464, \
5.90,6.80,6.193,6.070,5.737])
# define model
m = GEKKO()
# one value across all data
a,b,c = m.Array(m.FV,3,value=0)
c.LOWER = -100; c.UPPER = 100
# load data
x = m.Param(value=xm)
ymeas = m.Param(value=ym)
# predicted value
ypred = m.Var()
a.STATUS = 1; b.STATUS = 1; c.STATUS = 1
m.Equation(ypred == a + b/x + c*m.log(x))
m.Minimize(((ypred-ymeas)/ymeas)**2)
m.options.IMODE = 2 # regression mode
m.solve() # remote=False for local solve
print('Final SSE Objective: ' + str(m.options.objfcnval))
代码中还有一些可以提高性能的东西。
目标函数中的m.sum([n_a[(t,i)]*n_a[(tt,i)] for i in U])
可以用常规求和替换为sum([n_a[(t,i)]*n_a[(tt,i)] for i in U])
。 当所有参数都是浮点数时,这允许评估值而不是求和的 Gekko 符号形式。
是否可以cons
一次(维度T
)而不是重复相同的约束(维度T*T
)?
cons = {0: m.sum([alpha[t]*n_b[t] for t in T]) == 0}
m.Maximize(objs[0])
for keys1 in cons:
m.Equation(cons[keys1])
感谢您发布 SVM 代码。 如果可以将其转换为IMODE=2
,则可以大大提高解决方案的效率。 如果不可能(保持IMODE=3
默认值),那么希望上述建议有所帮助。
我们正在 Gekko 中开发一个新模块,以将sklearn
( sklearn 示例)、 tensorflow
、 gpflow
和其他模型导入 Gekko。 潜力是使用那些特制的回归包并将模型导出到更通用的优化gekko
包。 我们发现,当只需要一阶导数时,通过提供具有稀疏一阶和二阶导数的约束和目标的自动微分,一般的基于梯度的求解器可能在拟合中做太多工作。 为每种回归方法专门设计的优化器可能会更有效,尤其是对于在 GPU 上训练的大型数据集。 预计 2022 年 9 月左右在 Gekko v1.1+
的下一个版本中会出现更多文档和结果。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.