繁体   English   中英

上置信界算法的感觉

[英]Sense of Upper Confidence Bound algorithm

我在 Udemy 看了一个关于 UCB 的教程,并没有看到使用该算法的意义。

例如,您有 10 个广告并且您知道 10000 个用户的行为(点击与否)。 您可以使用 UCB 了解这 10 个广告中最好的广告。但您也可以计算所有点击次数并获得相同的结果。

数据示例在此处输入图像描述

UCB的结果(第 4 个广告最好)- 教师的结果

在此处输入图像描述

点击总和的结果(第 4 个广告最好) 在此处输入图像描述


如您所见,没有区别。 你得到相同的结果,第四个广告是最好的。

也许老师举了一个不好的例子? 是否存在使用 UCB 有意义的情况? 或者我不太明白。

你能帮我解决这个问题吗? 谢谢)

我在这个网站上找到了你的例子,也许它给了你另一种看待它的方式。 从阅读和我的理解来看,上限置信度算法将非常有利于第四个广告。 仅使用直方图可能在这里有效,但您可以预见到第 7 个广告非常接近以至于它也可能是展示的最佳广告的情况,但您需要更多数据来确保您做出正确的选择。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM