[英]Indexing external text data to lucene index in GraphDB
是否可以对 RDF 数据进行外部索引? 就像在 RDF 中一样,有一个三元组,对象是指向外部文件的链接。 这个文件的内容可以被索引而不是链接值吗?
绝对地。 Lucene 是 GraphDB 的核心部分,它提供了独立 Lucene 附带的标准功能。 数据必须被参数化为字符串文字。 <http://www.example.org/> rdfs:label "An example webpage url."@EN .
然后你可以配置一个 Lucene 索引:
PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
luc:index luc:setParam "uris" .
luc:include luc:setParam "literals" .
luc:moleculeSize luc:setParam "1" .
luc:includePredicates luc:setParam "http://www.w3.org/2000/01/rdf-schema#label" .
}
一旦你有了配置,你就可以创建索引。
PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
INSERT DATA {
luc:myTestIndex luc:createIndex "true" .
}
并且,给定索引和您的数据,您可以查询它。
PREFIX luc: <http://www.ontotext.com/owlim/lucene#>
SELECT * {
?subj luc:myTestIndex "web*"
}
由于您询问的是包含字符串 web* 的主题,您将得到<http://www.example.org/>
。 如果您有其他三元组链接到这个三元组,它们可能也会出现。
我怀疑上面的答案误解了这个问题。 该问题涉及外部内容 - 即,如果 GraphDB 的 Lucene 能够索引http://example.org 上可用的内容,而不是与其关联的 RDF 文字(然后在搜索中返回指向该内容的三元组)。
从我能够尝试的情况来看,目前不支持。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.