將斯坦福解析器類型的依賴項轉換為RDF格式

Question

對Stackoverflow來說是新手，對RDF和類型化依賴項是新手。 但是到目前為止，這是我得到的結果：我目前正在使用Stanford解析器從Java程序中的句子中提取類型化的依賴項。 我想知道如何將這些類型的依賴項轉換為N-triples RDF格式？

稍后，我將把RDF寫入Sesame存儲庫，但這是另一個問題。 因此，我真正要問的是如何將Stanford解析器類型的依賴項轉換為RDF格式？ 我正在用Java在Eclipse中編寫代碼。

句子“約翰喜歡可樂”的類型化依存關系將是：

[nsubj(likes-2, John-1), root(ROOT-0, likes-2), dobj(likes-2, coke-3)]

Answer 1

將任何數據轉換為RDF包括思考您想代表什么，並為它們提供一個詞匯表（或本體）。 實際上，可能存在現有詞匯可以重復使用，但是出於這個問題的目的，我們假設您要自己制作詞匯。

由於RDF中的每個詞匯都是一個URI，因此我們首先需要一個名稱空間。 現在，讓我們選擇http://example.org/stanford sp ）。 我們將需要一些詞匯來使某物成為依賴，聲明特定的依賴類型，並表達組成該依賴的句子片段之間的關系。 為了簡單起見，可以使用RDF對您給出的特定句子片段示例進行建模，如下所示：

 @prefix sp: <http://example.org/stanford/>
 @prefix : <http://example.org/> 

 :nsubj1 a sp:NominalSubject;
         sp:governor :likes-2;
         sp:dependent :john-1 .

 :s1 a sp:Root ;
     sp:dependent :likes-2 .

 :dobj1 a sp:DirectObject ;
        sp:governor :likes-2;
        sp:dependent :coke-3.

等等

為了使這種情況在Java / Sesame中實現，您可能應該編寫一些東西來讀取Stanford Parser的輸入，並將每個依賴項視情況轉換為等效的RDF術語（提示：聲明一些常量用於您的RDF條款），然后通過Sesame的Rio解析器/編寫器直接寫入磁盤，在運行時建立內存模型，甚至創建一個簡單的存儲庫（基本上是數據庫），在其中添加RDF數據。

我建議您嘗試一下，使用一些現有的教程/文檔來開始使用Sesame進行編程。 如果您陷於某個地方，則可以針對您的具體問題寫一個后續問題。

將斯坦福解析器類型的依賴項轉換為RDF格式

問題描述

1 個解決方案

解決方案1
0 2015-05-13 00:40:28

將斯坦福解析器類型的依賴項轉換為RDF格式

問題描述

1 個解決方案

解決方案1 0 2015-05-13 00:40:28

解決方案1
0 2015-05-13 00:40:28