簡體   English   中英

在IBM Watson Discovery Service中使用表行和列標題信息

[英]Using table row and column header information in IBM Watson Discovery service

我的團隊希望將認知搜索應用於大量非結構化的“政策”文檔(例如,汽車保險政策文檔)。 這些文檔中的某些信息被組織在格式化表格中。 普通讀者將使用行標題和列標題來解釋文檔。

例如,根據事故的性質以及涉及的車輛,我的保險范圍可能會有所不同。 在我的解決方案的上下文中,此信息在策略文檔中的一個表中可用,該表的行列出了各種類型的事件,而列列出了該策略涵蓋的不同工具。 每個表格單元格描述了特定事故/車輛組合的覆蓋范圍。

自然的做法是用與該單元格的列標題和行標題相關的關系來注釋每個表單元格。 我希望Watson Discovery已經做到或可以為我做到這一點。 但是,在我的實驗中,我沒有看到任何表明如此的結果。 Discovery或Watson Knowledge Studio中是否有便利利用表中行標題和列標題中的信息的工具?

表內容是結構化數據,不適合WKS /發現進行分析。 WKS接受自然語言文本的純文本。 盡管Discovery接受HTML / WORD / PDF文檔,但是在預處理過程中,提取的文檔將轉換為純文本,並且所有表結構都將被刪除。 因此在文本分析中不考慮表的關系。 我建議您將此類表內容數據作為結構化數據處理,並以其他方式(例如以編程方式)處理它們。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM