簡體   English   中英

在Watson Discovery API中,我將使用哪個結果來確定最相關的文檔:得分還是置信度?

[英]In Watson Discovery API, Which result shall i use to determine the most relevant documents: score or confidence?

我在Discovery系列上工作,我從未接受過培訓。 當我在我的集​​合上啟動自然語言查詢時,在檢索到的文檔的result_metadata中,我看到2個概念:得分和置信度:“置信度”:0.0847209066468392,“得分”:3.4830062,標記“retrieval_details”具有值“ document_retrieval_strategy“:”未經訓練“

在文檔中,首先寫出“對於訓練有素和未經訓練的私人收藏將返回置信度得分”,並進一步說“未經訓練的document_retrieval_strategy對結果的置信度得分是對文檔結果的相關性的無監督估計”。對於查詢;它不能與訓練集合返回的分數互換。訓練有素的集合可以提供比未經訓練的集合更好的自然語言查詢答案。“ 准確地說:這是什么意思? 如何計算置信度分數? 我應該使用哪種結果來獲得最相關的文件:得分還是信心?

你需要有信心。 決不應該使用分數來定義閾值,因為它是相對計算。

還建議使用“document_retrieval_strategy”作為閾值的一部分,對每個策略具有不同的閾值,或者至少一個用於訓練,一個用於未訓練,因為根據所應用的策略處理置信度的方式將不同。

這篇文章可以為您提供有關如何定義閾值的一些想法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM