簡體   English   中英

RDF4J:解析來自端點的查詢結果並將其存儲為ntriples文件(格式錯誤的查詢)

[英]RDF4J: Parse query result from endpoint and store it as ntriples file (malformed query)

端點中,有一個選項可以獲取N-triples格式的查詢結果。 連接到端點時,我想對rdf4j庫執行相同的操作,並將結果保存在ntriples格式文件中。

到目前為止,我已經使用了graphQuery(CONSTRUCT):

        .....
        String queryString = prefixes +
                " CONSTRUCT { ?sub ?hasProp ?prop } WHERE { ?sub ?hasProp ?prop FILTER(?sub = yago:Naples) } ";
        GraphQuery graphQuery = con.prepareGraphQuery(QueryLanguage.SPARQL, queryString);
        RDFWriter writer = new NTriplesWriter(System.out);
        graphQuery.evaluate(writer);

不幸的是,我得到:[來自服務器的格式錯誤的查詢結果](預期為'。',找到為'–')。 在端點中,結果返回的很好(Ntriples格式)。 這可能是rdf4j的錯誤嗎?

> <http://yago-knowledge.org/resource/Naples>
> <http://yago-knowledge.org/resource/linksTo>
> <http://yago-knowledge.org/resource/S.S.C._Napoli> .
> <http://yago-knowledge.org/resource/Naples>
> <http://yago-knowledge.org/resource/linksTo>
> <http://yago-knowledge.org/resource/Treno_Alta_Velocit\u00E0> .
> <http://yago-know18:50:57.014 [main] ERROR
> o.e.r.rio.helpers.ParseErrorLogger - [Rio fatal] Expected '.', found
> '–' (386, -1) org.eclipse.rdf4j.query.QueryEvaluationException:
> Malformed query result from server    at
> org.eclipse.rdf4j.repository.sparql.query.SPARQLGraphQuery.evaluate(SPARQLGraphQuery.java:69)
>   at org.example.Connect.main(Connect.java:60) Caused by:
> org.eclipse.rdf4j.repository.RepositoryException: Malformed query
> result from server    at
> org.eclipse.rdf4j.http.client.SPARQLProtocolSession.getRDF(SPARQLProtocolSession.java:934)
>   at
> org.eclipse.rdf4j.http.client.SPARQLProtocolSession.sendGraphQuery(SPARQLProtocolSession.java:463)
>   at
> org.eclipse.rdf4j.repository.sparql.query.SPARQLGraphQuery.evaluate(SPARQLGraphQuery.java:62)
>   ... 1 more Caused by: org.eclipse.rdf4j.rio.RDFParseException:
> Expected '.', found '–' [line 386]    at
> org.eclipse.rdf4j.rio.helpers.RDFParserHelper.reportFatalError(RDFParserHelper.java:403)
>   at
> org.eclipse.rdf4j.rio.helpers.AbstractRDFParser.reportFatalError(AbstractRDFParser.java:755)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.reportFatalError(TurtleParser.java:1318)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.verifyCharacterOrFail(TurtleParser.java:1153)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.parseStatement(TurtleParser.java:241)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.parse(TurtleParser.java:201)
>   at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.parse(TurtleParser.java:143)
>   at
> org.eclipse.rdf4j.http.client.SPARQLProtocolSession.getRDF(SPARQLProtocolSession.java:931)
>   ... 3 more

當RDF4J的SPARQLRepository針對此端點執行SPARQL查詢請求時,該端點以Turtle格式發送回其響應。 不幸的是,該響應包含語法錯誤。 發生了以下情況:

  1. RDF4J發出查詢請求,指示幾種可接受的結果格式(包括Turtle和N-Triples);
  2. 端點執行查詢,選擇Turtle作為響應格式,並在Turtle中序列化查詢結果;
  3. RDF4J接收Turtle數據並進行解析;
  4. 解析的結果將傳遞到NTriplesWriter,然后將其寫出。

但是,端點發回的查詢結果文檔在語法上不是有效的Turtle,這會導致RDF4J的Turtle解析器在步驟3中因錯誤而中止。

問題是響應中的這一行(386行):

    yago:Italian_War_of_1494–98 ,

具體而言,介於149498之間的字符。 盡管它看起來像一個負號( - ),這是完全合法的,但實際上它是所謂的“破折號”(Unicode字符0x2013)。 這不是Turtle前綴名稱中的合法字符。

端點的Turtle編寫器通過更改為完整URI而不是前綴名稱並使用Unicode轉義序列來正確地序列化值,如下所示:

<http://yago-knowledge.org/resource/Italian_War_of_1494\u201398>

可能值得與端點維護人員一起記錄錯誤報告,並針對此問題提出建議的修復方法。

解決方法是,端點的N-Triples輸出(如果您強迫它以N-Triples而不是Turtle進行響應)在語法上似乎是正確的。 您可以通過“覆蓋” RDF4J的SPARQLRepository發送的標准Accept標頭來強制服務器使用N-Triples而不是Turtle進行響應,如下所示:

SPARQLRepository repo = new SPARQLRepository(endpoint);

// create a new map of additional http headers
Map<String, String> headers = new HashMap<String, String>();

// we set the Accept header to _only_ accept text/plain, forcing the endpoint
// to use N-Triples as the response format. This overwrites the standard
// Accept header that RDF4J sends.
headers.put("Accept", "text/plain");
repo.setAdditionalHttpHeaders(headers);

完成此操作后,其余代碼將正常工作。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM