cost 100 ms
PyTorch:计算 model 的 Hessian 矩阵 - PyTorch: Compute Hessian matrix of the model

比如说,出于某种原因,我想使用 PyTorch 拟合线性回归,如下图所示。 我如何计算 model 的Hessian 矩阵以最终计算参数估计的标准误差? 生成一些数据并使用 model 例如,在 R 中,使用相同的数据和lm() function,我恢复了相同的参数,但我也能够恢复 Hessian ...

使用 Rcpp 和 Kronecker 产品在 R 中计算 nnet::multinom 多项回归的 Hessian / Fisher 信息矩阵的更快方法 - Faster way to calculate the Hessian / Fisher Information Matrix of a nnet::multinom multinomial regression in R using Rcpp & Kronecker products

似乎对于较大的nnet::multinom多项式回归模型(具有几千个系数),计算 Hessian(负对数似然的二阶导数矩阵,也称为观察到的 Fisher 信息矩阵)变得非常慢,然后阻止我计算方差-协方差矩阵并允许我计算 model 预测的置信区间。 It seems the culprit is ...

有人知道如何使这段代码工作吗? - Does anybody understand how to make this code work?

我正在尝试使用最大似然方法估计多重线性概率 model (killer_apps 是有限因变量)。 因此,在这段代码中,我试图估计回归量和各自的标准误差。 谁能告诉我为什么我会收到这个错误,一般来说,我做错了什么? 我试图从用于简单线性概率 model 的示例中扩展代码 ...

R:LTM:当标准化失败时,如何使行为异常的 hessian 矩阵收敛? - R: LTM: How can I make an odd-behaving hessian matrix converge when standardization fails?

我尝试使用 R package ltm 拟合分级响应 model。 问题是 Hessian 矩阵不收敛,我不明白为什么。 这是我使用的代码: 这会导致错误消息:“Hessian 矩阵在收敛时包含无限或缺失值;不稳定的解决方案。” 我已经按照 grm 帮助页面中的建议添加了start.val = " ...

如何在 python 中实现负二项式损失 function 以用于轻型 GBM? - How to implement a negative binomial loss function in python to use in light GBM?

我有一个机器学习问题,我相信负二项式损失 function 很合适,但是轻 gbm package 没有它作为标准,我正在尝试实现它,但我不知道如何得到 Gradient 和 Hessian,有人知道我该怎么做吗? 我设法得到了损失 function,但我无法得到梯度和粗麻布。 现在如何获得梯度和 ...

找不到就地操作导致“RuntimeError:梯度计算所需的变量之一已被就地操作修改:” - Cannot find in-place operation causing “RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation:”

我对 PyTorch 比较陌生,并且正在尝试从使用 Hessian 矩阵近似术语的学术论文中重现算法。 我已经设置了一个玩具问题,以便我可以将完整 Hessian 的结果与近似值进行比较。 我找到了这个要点并一直在使用它来计算算法的完整 Hessian 部分。 我收到错误消息:“RuntimeEr ...

为 XGBoost.XGBRegressor 创建自定义目标函数 - Creating a Custom Objective Function in for XGBoost.XGBRegressor

所以我对 python 中的 ML/AI 游戏比较陌生,我目前正在研究围绕 XGBoost 的自定义目标函数的实现的问题。 我的微分方程知识非常生疏,所以我创建了一个带有梯度和粗麻布的自定义 obj 函数,该函数对作为 XGBRegressor 中的默认目标函数运行的均方误差函数进行建模,以确保我 ...

黑森州矩阵,如何将Ixx和Iyy结合在一起? - Hessian matrix, how to combine Ixx & Iyy together?

“在提取线之前,您需要检测它们上的潜在点。首先应用高斯滤波器,然后将Sobel滤波器用作导数运算符。对Hessian的行列式设定阈值,然后在3×3邻域中应用非最大抑制。忽略像素为此,任何滤镜甚至部分落在图像边界之外。” 我了解先对图像进行高斯消除噪声,然后分别对Sobel_x和Sobel_ ...

当solnp的Hessian矩阵为5 x 5时,如何获得4个参数的标准误差? - How can I get standard errors for my 4 parameters when the Hessian matrix from solnp is 5 by 5?

我正在R包Rsolnp中使用solnp()函数来解决具有约束的非线性回归。 它运作良好,收敛没有问题。 我想使用Hessian矩阵来计算四个参数估计值的标准误差,但是Hessian不是我所期望的4乘4,而是5乘5。粗麻布大小。 我发现印刷粗麻布的所有例子表明它们是p的由P(例如,预期的大小 ...

计算关于张量流中几个变量的粗麻布 - Compute hessian with respect to several variables in tensorflow

在 tensorflow 中计算 Hessian 非常简单: 这正确返回 在我的实际情况中,我需要将它拆分为两个变量,而不是使用单个变量x保存三个值: x (保存前两个)和y (保存最后一个)。 我尝试了一个幼稚的 但我得到: [[ 8., 20.], [20., 34.]], [[ ...

重塑numpy数组 - Reshaping numpy array

我想要做的是取一个表示 3D 图像数据的 numpy 数组并计算每个体素的 Hessian 矩阵。 我的输入是一个形状矩阵 (Z,X,Y),我可以轻松地沿 z 切取一个切片并检索单个原始图像。 我可以按如下方式访问单个体素的粗麻布: 但这很麻烦,我无法轻松切片数据。 我曾尝试使用重塑如下 ...

在展平参数张量上使用tf.gradients或tf.hessians - Use tf.gradients or tf.hessians on flattened parameter tensor

假设我想计算关于某些参数W(例如前馈神经网络的权重和偏差)的标量值函数的Hessian。 如果您考虑以下代码,则实施经过培训以最小化MSE损失的二维线性模型: 你期望session.run(tf.hessian,feed_dict={})返回一个2x2矩阵(等于W)。 事实证明,因为 ...

培训课程结束后未更新TensorFlow Hessian矩阵 - TensorFlow Hessian matrix is not updated after training session

我正在尝试使用tf.hessians函数获取黑森州矩阵。 损失值和变量在每次训练后都会更新,而Hessian矩阵值则保持不变。 而且,它们不依赖于可以手动设置的初始变量值。 实际上,我的问题与此类似,尚未收到任何答案。 这是我用于测试的代码: 下面是打印结果: 因此,cu ...

使用syms,f和hessian编写具有动态变量的函数以获取其Hessian矩阵 - Write function with dynamic variables to get its Hessian matrix using syms, f, and hessian

我的问题有60个变量( x1至x60 ),这是函数: 我想得到函数f的黑森矩阵。 但是,由于变量太多,我不想为syms和f逐一写它们。 我知道我可以手动计算函数f的Hessian矩阵,因为函数不太困难。 但是,我有时需要更改函数的形式,例如将函数更改为(增加括号中的变量数): ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM