繁体   English   中英

Gekko:获取解决方案的问题(离线,Solver=1、2 或 3)或在合理的时间(在线,远程=True)

[英]Gekko: Problem with obtaining the solution (offline, Solver=1, 2, or 3) or in a reasonable time (online, remote=True)

下面的简单优化模型(支持向量机,请参阅https://www.supplychaindataanalytics.com/creating-a-support-vector-machine-using-gekko-in-python/了解更多信息)是一个带有 T= 的 NLP 86 和 U=6(为此最小工作示例生成的数据集)。

import numpy as np
import gekko as op
import itertools as it

a = np.random.rand(86, 6)
b = np.random.randint(0,6, size=(86))

C = range(len(set(b))) #Set of classes
U = range(len(a[0]))  #Set of input features
T = range(len(b)) #Set of the training points

def model (C,U,T,a,b,solve="y"):
    save_b = tuple(b)
    alpha_c=[None for j in C]
    z_c=[None for j in C]
    for j in C:
        for t in T:
            if b[t] == j:
                b[t] = +1
            else:
                b[t] = -1
        print(b)
        m = op.GEKKO(remote=False, name='SupportVectorMachine') 
        alpha = {t: m.Var(lb=0, ub=None) for t in T}
        n_a = {(t,i): a[t][i] for t,i in it.product(T,U)}
        n_b = {t: b[t] for t in T}  
        objs = {0: m.sum([alpha[t] for t in T]) - 0.5*m.sum([alpha[t]*alpha[tt] * n_b[t]*n_b[tt] * m.sum([n_a[(t,i)]*n_a[(tt,i)] for i in U]) for t,tt in it.product(T,T)])}
        cons = {0: {0: ( m.sum([alpha[t]*n_b[t] for t in T]) == 0) for t in T}}
        m.Maximize(objs[0])
        for keys1 in cons:
            for keys2 in cons[keys1]: m.Equation(cons[keys1][keys2])   
        if solve == "y":
            m.options.SOLVER=1
            m.solve(disp=False)
            for keys in alpha: 
                alpha[keys] =  alpha[keys].value[0]
                print(f"alpha[{keys}]", alpha[keys])
        x = [None for i in U]
        for i in U:
            x[i]=sum(alpha[t]*b[t]*n_a[(t,i)] for t in T)
        for t in T:
            if alpha[t]>0: 
                z=b[t] - sum(x[i]*n_a[(t,i)] for i in U)
                break
        b = list(save_b)
        alpha_c[j]=alpha
        z_c[j]=z
    return m,z,alpha

m, z, alpha = model(C,U,T,a,b) #Model and solve the problem

使用m.options.SOLVER=1 ,代码退出:

FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\USERNAME\\AppData\\Local\\Temp\\tmpj66p0g5qsupportvectormachine\\options.json'

使用m.options.SOLVER=2 ,代码退出:

FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\USERNAME\\AppData\\Local\\Temp\\tmpgat29b25supportvectormachine\\options.json'

使用m.options.SOLVER=3 ,代码退出:

FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\USERNAME\\AppData\\Local\\Temp\\tmpgat29b25supportvectormachine\\options.json'

使用m = op.GEKKO(remote=True, name='SupportVectorMachine')代码似乎需要太多时间来运行并且没有报告输出。

我想知道为什么会发生这种情况以及如何对代码进行故障排除? 我们是否需要每次都为求解器的算法提供初始猜测? (我正在使用gekko (1.21.5) 。)提前致谢。

ٍ编辑:在 Google 的 Colaboratory 上,它以:

Exception: @error: Solution Not Found

尝试IMODE=2回归模式),其中模型仅定义一次并自动应用于每个数据点。 这大大提高了模型编译的速度。 下面是 IMODE=2 的最小示例。 对于同一示例和 非线性回归示例,还可以与 Scipy Minimize 进行比较

import numpy as np
from gekko import GEKKO
# load data
xm = np.array([18.3447,79.86538,85.09788,10.5211,44.4556, \
               69.567,8.960,86.197,66.857,16.875, \
               52.2697,93.917,24.35,5.118,25.126, \
               34.037,61.4445,42.704,39.531,29.988])
ym = np.array([5.072,7.1588,7.263,4.255,6.282, \
               6.9118,4.044,7.2595,6.898,4.8744, \
               6.5179,7.3434,5.4316,3.38,5.464, \
               5.90,6.80,6.193,6.070,5.737])
# define model
m = GEKKO()
# one value across all data
a,b,c = m.Array(m.FV,3,value=0)
c.LOWER = -100; c.UPPER = 100
# load data
x = m.Param(value=xm)
ymeas = m.Param(value=ym)
# predicted value
ypred = m.Var()
a.STATUS = 1; b.STATUS = 1; c.STATUS = 1
m.Equation(ypred == a + b/x + c*m.log(x))
m.Minimize(((ypred-ymeas)/ymeas)**2)
m.options.IMODE = 2   # regression mode
m.solve() # remote=False for local solve
print('Final SSE Objective: ' + str(m.options.objfcnval))

代码中还有一些可以提高性能的东西。

  1. 目标函数中的m.sum([n_a[(t,i)]*n_a[(tt,i)] for i in U])可以用常规求和替换为sum([n_a[(t,i)]*n_a[(tt,i)] for i in U]) 当所有参数都是浮点数时,这允许评估值而不是求和的 Gekko 符号形式。

  2. 是否可以cons一次(维度T )而不是重复相同的约束(维度T*T )?

        cons = {0: m.sum([alpha[t]*n_b[t] for t in T]) == 0}
        m.Maximize(objs[0])
        for keys1 in cons:
            m.Equation(cons[keys1])

感谢您发布 SVM 代码。 如果可以将其转换为IMODE=2 ,则可以大大提高解决方案的效率。 如果不可能(保持IMODE=3默认值),那么希望上述建议有所帮助。

我们正在 Gekko 中开发一个新模块,以将sklearnsklearn 示例)、 tensorflowgpflow和其他模型导入 Gekko。 潜力是使用那些特制的回归包并将模型导出到更通用的优化gekko包。 我们发现,当只需要一阶导数时,通过提供具有稀疏一阶和二阶导数的约束和目标的自动微分,一般的基于梯度的求解器可能在拟合中做太多工作。 为每种回归方法专门设计的优化器可能会更有效,尤其是对于在 GPU 上训练的大型数据集。 预计 2022 年 9 月左右在 Gekko v1.1+的下一个版本中会出现更多文档和结果。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM