簡體   English   中英

Hadoop(HDFS) - 文件版本控制

[英]Hadoop (HDFS) - file versioning

在給定時間,我的應用程序(apache CMIS)中有用戶文件系統。 隨着它越來越大,我懷疑是否要轉向hadoop(HDFS),因為我們還需要對它進行一些統計。 問題:當前文件系統提供文件的版本控制。 當我讀到hadoop - HDFS-和文件版本控制時,我發現大多數時候我必須自己編寫這個(版本控制)層。 是否已有可用於管理HDFS中文件版本的東西,或者我是否真的必須自己編寫(不想重新發明熱水,但也找不到合適的解決方案)。

回答

有關詳細信息:請參閱下面的答案評論

Hadoop(HDFS)不支持文件版本控制。 當您將hadoop與(amazon)S3結合使用時,您可以獲得此功能:Hadoop將使用S3作為文件系統(沒有chuncks,但S3將提供恢復)。 此解決方案附帶S3提供的文件版本控制。 Hadoop仍將使用YARN進行分布式處理。

HDFS無法進行版本控制。
相反,您可以使用Amazon S3 ,它提供版本控制並且還與Hadoop 兼容

HDFS支持快照。 我認為這與使用HDFS進行“版本控制”的情況一樣接近。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM