[英]Python JSON API for linked data, with flat files
我們正在創建gamma-cat (伽馬射線天文學的開放數據收集),並正在尋求有關如何進行最佳設置的建議(在此處,或指向資源,格式,工具,包的鏈接)。
我們擁有的數據包括來自不同論文的不同來源的度量。 這是非常不同的,有時在一篇論文中有多個來源的數據,每個來源通常有幾篇論文,有時沒有頻譜,有時一個,有時很多,...
當前,我們僅將數據作為YAML和CSV文件收集在input
文件夾中,現在我們希望將其公開給用戶。 主要從Python訪問,也從Javascript訪問,並且可以從靜態網站訪問。
問題是我們應該使用哪種格式和組織數據,以及是否有任何Python軟件包可以幫助我們將output
文件生成為一組鏈接數據,以及Python和Javascript軟件包可以幫助我們訪問數據?
我們希望獲得數據的多個“視圖”或簡單的“查詢”,例如“所有來源列表”,“所有論文列表”,“來源X的所有光譜列表”,“論文B的光譜A”源C”。
對於格式,JSON可能是一個不錯的選擇? 盡管YAML讀起來更好一些,但也可以有注釋和有序的地圖。 我們將輸出文件存儲在git倉庫中,並且JSON文件存在很多毫無意義的差異,因為密鑰順序一直在變化。
為了使數據集可發現和鏈接,我不知道該使用什么。 我發現了例如http://jsonapi.org/,但這似乎是針對REST API的,而不僅僅是靜態Web服務器上的一系列平面JSON文件? 也許仍然可以那樣使用? 我還發現http://json-ld.org/看起來很相關,但是也很復雜。 這些或別的什么都是好選擇嗎?
最后,我們想使用Python腳本從input
的一些有點組織化的YAML和CSV文件生成output
的鏈接的和可發現的文件。 到目前為止,我們僅基於Python字典/列表和YAML / JSON文件編寫了一堆Python類或腳本。 是否有一個Python軟件包可以幫助完成生成鏈接數據文件的任務?
對於冗長而復雜的問題,我們深表歉意! 我希望它仍適用於SO,並且有人可以分享一些建議。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.