繁体   English   中英

如何使用 BERT model 预测与没有 label 的数据集的句子语义相似度?

[英]How can I use BERT model to predict sentence semantic similarity to a dataset with no label?

我是使用 BERT model 的初学者。 我正在关注 Keras 网站https://keras.io/examples/nlp/semantic_similarity_with_bert/#:~:text=Introduction,sentence%20semantic%20similarity%20with.20Transformers的教程

但是他们在示例中使用的数据集具有 label 变量(“相似性”)。 是否有任何教程或指导使用 BERT model 来预测与只有文本列的数据的语义相似性?

据我所知,BERT 旨在用于受监督的问题,例如 Keras 站点中的示例。 如果您的数据集仅由文本列组成,您可以执行以下操作:使用 BERT model 提取特征并使用 Kmeans 将您的数据聚类到不同的组中。 更多关于 KMeans 的信息和这篇文章有更多关于这种方法的细节。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM