1. 首頁
  2. 工作計劃範文

Hadoop並非完美:8個代替 HDFS 的絕佳方案

Hadoop並非完美:8個代替 HDFS 的絕佳方案

HDFS(Hadoop Distributed File System)是Hadoop專案的核心子專案,是分散式計算中資料儲存管理的基礎,坦白說HDFS是一個不錯的分散式檔案系統,它有很多的優點,但也存在有一些缺點,包括:不適合低延遲資料訪問、無法高效儲存大量小檔案、不支援多使用者寫入及任意修改檔案。

Apache軟體基金會成立的時候,HDFS就一直在想辦法提高它的效能和可用性,坦白說,這也許對試點專案、非常規專案、要求不嚴格的大環境中比較適用,但是對於某些Hadoop使用者來說,他們對於效能、可用性、企業級特性有較高的要求,且注重直接附加儲存(DAS)架構,特別是老版本的`Hadoop沒有高效能的主節點,那麼接下來8個產品就是代替HDFS的絕佳方案。

1.Cassandra(DataStax)

並非一個完全的檔案系統,而是一個開源、NoSQL 鍵值(key-value)商店。這給依靠快速資料訪問的Web 應用多了一個HDFS選擇。簡單來說它把Hadoop融合在Cassandra裡面,支援Web應用透過Hadoop快速訪問資料, 而Hadoop可以快速訪問流入Cassandra的資料。

2.Ceph

Ceph 是一個開源、多管齊下的作業系統,因為其高效能並行檔案系統的特性,有人甚至認為它是基於Hadoop環境下的HDFS的接班人,因為自2010年就有研究者在尋找這個特性。

3.Cleversafe:分散儲存網路

本週一Cleversafe宣佈將融合Hadoop的並行程式設計技術和自己的分散存貯網路。其原理是透過把整個元資料分佈在叢集中(不是依靠單個主節點、不是依靠複製),Cleversafe表示這比HDFS更快、更穩定、更具擴充套件性。

4.GPFS(IBM)

IBM一直在向高效能要求的使用者銷售其並行檔案系統,包括世界上最快的超級電腦,2010年它推出了基於Hadoop的GPFS, 並宣佈GPFS不共享叢集版本比Hadoop快多了,因為

它在核心級別中執行,而不是在作業系統中執行例如HDFS。

5.Isilon(EMC)

EMC提供Hadoop發行版已經一年了,但2012年1月轉型為HDFS企業級別的新方案Isilon 的 OneFS檔案系統。因為Isilon可以讀取 NFS, CIFS以及 HDFS 協議, 一個單獨的 Isilon NAS系統可以攝入、處理、分析資料。

6.Lustre

HPC儲存提供商Xyratex 增在2011年的一份報道中寫到, 基於Lustre的叢集會比基於HDFS的叢集更快更便宜。

7. MapR檔案系統

MapR 檔案系統在業內已經具有一定知名度了,不僅MapR宣佈它自己的檔案系統比HDFS快2-5倍(實際上有20倍),它還具有映象、快照、高效能這些企業使用者喜歡的特點。

8.NetAppHadoop開放方案

NetApp重新改版了物理Hadoop結構:把HDFS放在磁碟陣列中,透過這樣來達到更快、更穩定、更安全的Hadoop工作。

[Hadoop並非完美:8個代替 HDFS 的絕佳方案]相關文章:

1.Hadoop並非完美:8個代替 HDFS 的絕佳方案