[英]ELMo - How to train trainable parameters
我是tensorflow-hub的新手,并且遇到了ELMo模型( https://www.tensorflow.org/hub/modules/google/elmo/2 )。
根据原始论文,ELMo表示是隐藏状态激活的加权平均值,并且这些权重可根据手头的任务(即任务特定的)来训练。 正如预期的那样,当我使用tf.trainable_variables()时,我可以看到4个可训练的参数。 如何在张量流中精确训练这些变量?
他们只是提到这些重量是可训练的。 但谁应该训练呢? 我或ELMo模型本身训练吗? 这篇论文似乎暗示我应该训练它。 如果是这样,我如何在tensorflow中训练它?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.