簡體   English   中英

Python JSON API用於帶有平面文件的鏈接數據

[英]Python JSON API for linked data, with flat files

我們正在創建gamma-cat (伽馬射線天文學的開放數據收集),並正在尋求有關如何進行最佳設置的建議(在此處,或指向資源,格式,工具,包的鏈接)。

我們擁有的數據包括來自不同論文的不同來源的度量。 這是非常不同的,有時在一篇論文中有多個來源的數據,每個來源通常有幾篇論文,有時沒有頻譜,有時一個,有時很多,...

當前,我們僅將數據作為YAML和CSV文件收集在input文件夾中,現在我們希望將其公開給用戶。 主要從Python訪問,也從Javascript訪問,並且可以從靜態網站訪問。

問題是我們應該使用哪種格式和組織數據,以及是否有任何Python軟件包可以幫助我們將output文件生成為一組鏈接數據,以及Python和Javascript軟件包可以幫助我們訪問數據?

我們希望獲得數據的多個“視圖”或簡單的“查詢”,例如“所有來源列表”,“所有論文列表”,“來源X的所有光譜列表”,“論文B的光譜A”源C”。

對於格式,JSON可能是一個不錯的選擇? 盡管YAML讀起來更好一些,但也可以有注釋和有序的地圖。 我們將輸出文件存儲在git倉庫中,並且JSON文件存在很多毫無意義的差異,因為密鑰順序一直在變化。

為了使數據集可發現和鏈接,我不知道該使用什么。 我發現了例如http://jsonapi.org/,但這似乎是針對REST API的,而不僅僅是靜態Web服務器上的一系列平面JSON文件? 也許仍然可以那樣使用? 我還發現http://json-ld.org/看起來很相關,但是也很復雜。 這些或別的什么都是好選擇嗎?

最后,我們想使用Python腳本從input的一些有點組織化的YAML和CSV文件生成output的鏈接的和可發現的文件。 到目前為止,我們僅基於Python字典/列表和YAML / JSON文件編寫了一堆Python類或腳本。 是否有一個Python軟件包可以幫助完成生成鏈接數據文件的任務?

對於冗長而復雜的問題,我們深表歉意! 我希望它仍適用於SO,並且有人可以分享一些建議。

從問題的廣度來看,您不熟悉鏈接數據。 最不適合您的格式可能是數據包 在最常見的情況下,它只是CSV文件和JSON元數據的zip存檔。 它有一個Python包

如果對數據有查詢,則應使用SPARQL端點來建立數據庫(三重存儲)。 看看Fuseki 然后,您可以使用Turtle或RDF / XML進行文件導出。

如果數據來自某種工具,則可以使用Eclipse Lyo( 教程 )對它表示的域進行建模。

這些工具由3個不同的社區維護,如果您對它們還有其他疑問,可以分別與他們的用戶郵件列表聯系。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM