[英]How can the perplexity of a language model be between 0 and 1?
在Tensorflow中,我得到的输出为0.602129或0.663941。 似乎值越接近0意味着模型越好,但是似乎困惑应该被计算为2 ^损失,这意味着损失为负。 这没有任何意义。
这对我来说没有多大意义。 困惑度被计算为2^entropy
。 熵从0到1。因此,小于1的结果没有意义。
我建议您看一下您的模型如何计算困惑度,因为我怀疑可能存在错误。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.