在评估 model 时如何处理随机性？

Question

我最近正在训练和比较两种深度学习模型的性能。 目前，我仅在进行训练测试拆分时使用特定的种子。 然而，由于 model 的随机性，即使使用相同的种子，相同 model 的损失每次都不同。 是在各处设置种子以完美控制结果还是保持随机性更好？ 如果是后者，那么我应该多次测试同一种子并平均损失还是应该选择种子的最佳/最差表现？

此外，我阅读了一些会议论文，他们通常通过使用一些随机种子并对结果进行平均来评估 model，我想知道这些种子是如何选择的。 如果我想比较两个模型，我应该使用相同的种子（例如 model A 和 B 的种子 0、1、2）还是不同的种子（例如 model A 和种子 5 的种子 0、1、2 来测试它们, 6, 7 for model B) 取决于结果？ 这意味着，无论如何总是选择最好的？ 先感谢您。

Answer 1

为了拆分数据，您应该为每个 model 使用相同的种子，以便每个 model 都在相同的数据上进行训练和测试。

对于模型的训练，除了训练具有相同架构的两个模型之外，这无关紧要：如果这两个模型共享相同的种子，它们将给出相同的结果。 因此，在训练时，您应该为相同架构的模型使用不同的种子。

您可以使用numpy.random.SeedSequence来帮助获取种子，因为使用它可以跟踪单个种子，但会产生唯一的随机种子：

import numpy as np
entropy = 100
seed_sequence = np.random.SeedSequence(entropy, pool_size=5)
spawns = seed_sequence.spawn(2)
split_seeds = spawns[0].pool # for splitting train-test
# [179453401, 3816112049, 3806930416, 1196834953, 1391596624]
model_seeds = spawns[1].pool # for training models
# [2353154363,  511151844,    6211548, 1188290456, 3368787154]

请注意，您只需要跟踪entropy 。 将pool_size设置为您想要重复实验的次数。

如文档中所述：

实现可重现比特流的最佳实践是使用默认的 None 作为初始熵，然后使用 SeedSequence.entropy 记录/腌制熵以实现重现性

因此，与其在第一次运行时指定entropy = 100 ，不如在第一次运行后完全不指定它并简单地保存seed_sequence.entropy 。

在评估 model 时如何处理随机性？

问题描述

1 个解决方案

解决方案1
0 2022-08-13 17:03:29

在评估 model 时如何处理随机性？

问题描述

1 个解决方案

解决方案1 0 2022-08-13 17:03:29

解决方案1
0 2022-08-13 17:03:29