簡體   English   中英

創建研究數據庫

[英]Create a Research Database

我想創建一個研究數據庫,我可以在其中存儲和檢索文章(PDF 文件)。 有什么建議?

我查看了幾個關系數據庫教程,但沒有一個涉及文檔的存儲和檢索,僅涉及原始數據。

我會考慮使用 Elasticsearch、Solr 或 Lucene 之類的東西,而不是傳統的數據庫方法。 您可以索引、搜索和訪問元數據。

這是通過附件插件的 Elasticsearch 方式: https : //www.elastic.co/guide/en/elasticsearch/reference/current/mapping-attachment-type.html以及如何示例:
http://www.hashcode.eti.br/?p=420

索爾:
https://gist.github.com/nichtich/429904

和Lucene:
https://wiki.apache.org/lucene-java/LuceneFAQ#How_can_I_index_PDF_documents.3F

要在本地計算機上構建它:將所有文件放在一個文件夾/目錄中,並為它們唯一命名。 使用任何數據庫(Postgres、mysql、sqlite、mongo 等)來存儲元數據並按名稱引用 PDF 文件。 即使您將其放入數據庫 - 您也無能為力。

要在互聯網上構建它,相同但使用類似 Amazon S3 的東西來存儲 PDF 文件。 如果您設想其他人與您合作,您可能會決定為其構建一個 Web UI:例如添加或評價文章。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM