簡體   English   中英

將斯坦福解析器類型的依賴項轉換為RDF格式

[英]Converting stanford parser typed dependencies to RDF format

對Stackoverflow來說是新手,對RDF和類型化依賴項是新手。 但是到目前為止,這是我得到的結果:我目前正在使用Stanford解析器從Java程序中的句子中提取類型化的依賴項。 我想知道如何將這些類型的依賴項轉換為N-triples RDF格式?

稍后,我將把RDF寫入Sesame存儲庫,但這是另一個問題。 因此,我真正要問的是如何將Stanford解析器類型的依賴項轉換為RDF格式? 我正在用Java在Eclipse中編寫代碼。

句子“約翰喜歡可樂”的類型化依存關系將是:

[nsubj(likes-2, John-1), root(ROOT-0, likes-2), dobj(likes-2, coke-3)]

將任何數據轉換為RDF包括思考您想代表什么,並為它們提供一個詞匯表(或本體 )。 實際上,可能存在現有詞匯可以重復使用,但是出於這個問題的目的,我們假設您要自己制作詞匯。

由於RDF中的每個詞匯都是一個URI,因此我們首先需要一個名稱空間。 現在,讓我們選擇http://example.org/stanford sp )。 我們將需要一些詞匯來使某物成為依賴,聲明特定的依賴類型,並表達組成該依賴的句子片段之間的關系。 為了簡單起見,可以使用RDF對您給出的特定句子片段示例進行建模,如下所示:

 @prefix sp: <http://example.org/stanford/>
 @prefix : <http://example.org/> 

 :nsubj1 a sp:NominalSubject;
         sp:governor :likes-2;
         sp:dependent :john-1 .

 :s1 a sp:Root ;
     sp:dependent :likes-2 .

 :dobj1 a sp:DirectObject ;
        sp:governor :likes-2;
        sp:dependent :coke-3. 

等等

為了使這種情況在Java / Sesame中實現,您可能應該編寫一些東西來讀取Stanford Parser的輸入,並將每個依賴項視情況轉換為等效的RDF術語(提示:聲明一些常量用於您的RDF條款),然后通過Sesame的Rio解析器/編寫器直接寫入磁盤,在運行時建立內存模型,甚至創建一個簡單的存儲庫(基本上是數據庫),在其中添加RDF數據。

我建議您嘗試一下,使用一些現有的教程/文檔來開始使用Sesame進行編程。 如果您陷於某個地方,則可以針對您的具體問題寫一個后續問題。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM