[英]Architecting an Attention network
给定以下数据:
provider_name, feature A, feature B, feature C..., Label
provider_A , 0.5 , 0.3 , 0.8 , 1
provider_A , 0.5 , 0.2 , 0.1 , 1
...
provider_B , 0.9 , 0.8 , 0.1 , 0
provider_B , 0.5 , 0.3 , 1.8 , 0
...
我想构建一个Attention神经网络,该神经网络将整体处理每个提供者数据,然后预测其标签。
请注意,数据为每个提供者仅提供一个标签 。
我已经阅读了这篇文章,描述了Attention的好处,并希望使用Keras来实现它。
很想听听您对网络体系结构的想法,并且可能会获得一些代码参考。
谢谢 :)
编辑
由于每个提供者的批次大小都不同,我该如何每次以正确的批次大小训练模型?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.