Alluxio分布式存儲(chǔ)系統(tǒng)是一款非常便捷好用的數(shù)據(jù)庫(kù)框架,它結(jié)合了傳統(tǒng)數(shù)據(jù)庫(kù)分類齊全的優(yōu)點(diǎn),又吸收了大數(shù)據(jù)存儲(chǔ)的優(yōu)勢(shì),給用戶非常良好的使用體驗(yàn)。讓用戶在更少的選擇中進(jìn)行更多的數(shù)據(jù)信息操作!
應(yīng)用簡(jiǎn)介:
Alluxio發(fā)布了,Alluxio是一個(gè)高容錯(cuò)的分布式文件系統(tǒng),允許文件以內(nèi)存的速度在集群框架中進(jìn)行可靠的共享,類似Spark和 MapReduce。通過(guò)利用lineage信息,積極地使用內(nèi)存,Alluxio的吞吐量要比HDFS高300多倍。Alluxio都是在內(nèi)存中處理緩 存文件,并且讓不同的 Jobs/Queries以及框架都能內(nèi)存的速度來(lái)訪問(wèn)緩存文件。
應(yīng)用產(chǎn)品特性:
Alluxio居于傳統(tǒng)大數(shù)據(jù)存儲(chǔ)和大數(shù)據(jù)計(jì)算框架(如Spark,Hadoop Mapreduce)之間;
在大數(shù)據(jù)領(lǐng)域,最底層的是分布式文件系統(tǒng),如Amazon S3、Apache HDFS等,而較高層的應(yīng)用則是一些分布式計(jì)算框架,如Spark、MapReduce、Hbase、Flink等。
關(guān)于Alluxio:
與其他諸如HDFS、HBase、Spark等大數(shù)據(jù)相關(guān)框架一致,Alluxio也是一個(gè)主從結(jié)構(gòu)的系統(tǒng)。它的主節(jié)點(diǎn)為Master,負(fù)責(zé)管理全局的文件系統(tǒng)元數(shù)據(jù),比如文件系統(tǒng)樹等,而從節(jié)點(diǎn)為Worker,負(fù)責(zé)管理本節(jié)點(diǎn)數(shù)據(jù)存儲(chǔ)服務(wù)。另外,Alluxio還有一個(gè)組件為Client,為用戶提供統(tǒng)一的文件存取服務(wù)接口。當(dāng)應(yīng)用程序需要訪問(wèn)Alluxio時(shí),通過(guò)客戶端先與主節(jié)點(diǎn)Master通訊,或許對(duì)應(yīng)文件的元數(shù)據(jù),然后再和對(duì)應(yīng)Worker節(jié)點(diǎn)通訊,進(jìn)行實(shí)際的文件存取操作。所有的Worker會(huì)周期性地發(fā)送心跳給Master,維護(hù)文件系統(tǒng)元數(shù)據(jù)信息和確保自己被Master感知扔在集群中正常提供服務(wù),而Master不會(huì)主動(dòng)發(fā)起與其他組件的通信,它只是以回復(fù)請(qǐng)求的方式與其他組件進(jìn)行通信。這與HDFS、HBase等分布式系統(tǒng)設(shè)計(jì)模式是一致的。