簡體   English   中英

如何在MongoDB中有效地存儲和查詢原始JSON流?

[英]How do I efficiently store and query a raw JSON stream in MongoDB?

我想將原始JSON流(通過Twitter或NYTimes)有效地存儲在MongoDB中,以便以后可以使用Lucene或Hadoop索引數據(NYTimes文章或Tweets /用戶名)。 在Mongo中存儲數據的最聰明的方法是什么? 我應該只傳送JSON,還是有更好的選擇? 我只為mongodb使用一台機器,帶有3個副本集。

是否有一種有效(智能)的方式來編寫查詢或存儲我的數據以更好地優化搜索查詢?

是否有一種有效(智能)的方式來編寫查詢或存儲我的數據以更好地優化搜索查詢?

這完全取決於您需要進行哪種查詢以及應用程序的使用方式。 將每個tweet存儲在包含以下內容的Mongo Document中將非常簡單:發件人,時間戳,文本等。根據需要進行的查詢,您將需要在這些字段上創建索引(更多信息: http:// www .mongodb.org / display / DOCS / Indexes

對於全文搜索,您可以對推文的文本進行標記/解析/詞干處理,並在每個推文中存儲一個標記數組,您可以對其進行索引以對其進行快速查詢。 如果您需要更強大的全文本搜索功能,則還可以使用Lucene對其進行索引,並將objectId存儲在每個Lucene文檔中-但這引入了本質上擁有2個數據存儲區的復雜性

同樣,在不了解用例細節的情況下,這里確實沒有正確的答案。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM