计算 L1 和 L2 正则化的损失

Question

如何计算L1和L2正则化的损失，其中w是 Python 中线性 model 的权重向量？

正则化应在不考虑权重中的偏差项的情况下计算损失

def l1_reg(w):

    # TO-DO: Add your code here

    return None

def l2_reg(w):

    # TO-DO: Add your code here

    return None

Answer 1

为什么使用正则化

在训练 model 时，您希望尽可能获得更高的准确度。因此，您可以选择所有相关特征 [列、预测变量、向量]，但是，如果数据集不够大（即特征数量， n比m大得多），这会导致所谓的过度拟合。过拟合描述你的model在训练集中表现非常好，但是在测试集中失败（即训练精度比测试集精度好很多），你可以想到，你可以解决一个问题，你有以前解决过，但是不能解决类似的问题，因为你想多了[ Not same problem but similar ]，所以这里正则化来解决这个问题。

正则化

让我们首先解释正则化背后的逻辑术语。

正则化添加信息的过程[你可以想到，在给你另一个问题之前，我在第一个问题上添加了更多信息，你对它进行了分类，所以如果你发现类似的问题你就不要想太多了]。

这张图片显示了过度拟合的 model 和精确的 model。

L1和L2是添加到 model 方程的信息类型

L1 正则化

在 L1 中，您将信息添加到 model 方程为 theta 向量 (θ) 乘以正则化参数 (λ) 的绝对和，正则化参数 (λ) 可以是超过数据大小 (m) 的任意大数，其中 (n) 是特征数.

L2 正则化

在 L2 中，将信息添加到 model 方程中，得到向量 (θ) 平方乘以正则化参数 (λ) 的总和，该正则化参数可以是任何大于数据大小 (m) 的大数，其中 (n) 是特征。

如果使用正规方程

然后 L2 正则化将是 (n+1)x(n+1) 对角矩阵，左上角为零，其他对角线项下方的对角矩阵乘以正则化参数 (λ)。

Answer 2

我认为在回答之前澄清这一点很重要： L1和L2正则化项不是损失函数。 它们有助于控制向量中的权重，使它们不会变得太大并且可以减少过度拟合。

L1正则化项是每个元素的绝对值之和。 对于长度为 N 的向量，它将是|w[1]| + |w[2]| +... + |w[N]|. |w[1]| + |w[2]| +... + |w[N]|.

L2正则化项是每个元素的平方值之和。 对于长度为 N 的向量，它将是w[1]² + w[2]² +... + w[N]² 。 我希望这有帮助！

Answer 3

    def calculateL2(self, vector):

         return np.dot(vector, vector)

    def calculateL1(self, vector):

        vector = np.abs(vector)

        return np.sum(vector)

计算 L1 和 L2 正则化的损失

问题描述

3 个解决方案

解决方案1
1 2019-11-18 00:05:34

为什么使用正则化

正则化

L1 正则化

L2 正则化

如果使用正规方程

解决方案2
0 2019-11-17 22:29:16

解决方案3
0 2021-06-13 20:42:41

计算 L1 和 L2 正则化的损失

问题描述

3 个解决方案

解决方案1 1 2019-11-18 00:05:34

为什么使用正则化

正则化

L1 正则化

L2 正则化

如果使用正规方程

解决方案2 0 2019-11-17 22:29:16

解决方案3 0 2021-06-13 20:42:41

解决方案1
1 2019-11-18 00:05:34

解决方案2
0 2019-11-17 22:29:16

解决方案3
0 2021-06-13 20:42:41