繁体   English   中英

在IBM Watson Discovery Service中使用表行和列标题信息

[英]Using table row and column header information in IBM Watson Discovery service

我的团队希望将认知搜索应用于大量非结构化的“政策”文档(例如,汽车保险政策文档)。 这些文档中的某些信息被组织在格式化表格中。 普通读者将使用行标题和列标题来解释文档。

例如,根据事故的性质以及涉及的车辆,我的保险范围可能会有所不同。 在我的解决方案的上下文中,此信息在策略文档中的一个表中可用,该表的行列出了各种类型的事件,而列列出了该策略涵盖的不同工具。 每个表格单元格描述了特定事故/车辆组合的覆盖范围。

自然的做法是用与该单元格的列标题和行标题相关的关系来注释每个表单元格。 我希望Watson Discovery已经做到或可以为我做到这一点。 但是,在我的实验中,我没有看到任何表明如此的结果。 Discovery或Watson Knowledge Studio中是否有便利利用表中行标题和列标题中的信息的工具?

表内容是结构化数据,不适合WKS /发现进行分析。 WKS接受自然语言文本的纯文本。 尽管Discovery接受HTML / WORD / PDF文档,但是在预处理过程中,提取的文档将转换为纯文本,并且所有表结构都将被删除。 因此在文本分析中不考虑表的关系。 我建议您将此类表内容数据作为结构化数据处理,并以其他方式(例如以编程方式)处理它们。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM