當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 辦公軟件下載 > 文件管理軟件下載
“NoHadoop”?——新一代海量數(shù)據(jù)架構(gòu)分析
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
[CSDN編譯]在經(jīng)歷了長(zhǎng)達(dá)25年的統(tǒng)治地位后,關(guān)系型數(shù)據(jù)庫(kù)正面臨越來(lái)越火的“NoSQL”挑戰(zhàn),而挑戰(zhàn)者是以Hadoop為代表的分布式計(jì)算開(kāi)源架構(gòu)??梢钥吹剑絹?lái)越多的消息表明,不管NoSQL是被解釋為“No SQL”還是“Not Only SQL”,如果你面臨海量數(shù)據(jù)的挑戰(zhàn),那么你最應(yīng)該選的海量數(shù)據(jù)架構(gòu)是Hadoop。但是Hadoop就能代表一切嗎?答案顯然是否定的,Hadoop的MapReduce在性能上的確是有局限性的:比如MapReduce沒(méi)有索引,只有靠強(qiáng)大的運(yùn)算能力來(lái)處理;此外,MapReduce本身存在一些lower-level實(shí)現(xiàn)的問(wèn)題, 特別是skew和數(shù)據(jù)交換等等。
因此有些人開(kāi)始回到關(guān)系型數(shù)據(jù)庫(kù)上,因?yàn)橄啾容^Hadoop的處理能力,一些SQL架構(gòu)依然呈現(xiàn)數(shù)量級(jí)的優(yōu)勢(shì)。
也許,我們現(xiàn)在正處于一個(gè)新的“NoHadoop”時(shí)代,因?yàn)樵絹?lái)越多的企業(yè)開(kāi)始認(rèn)識(shí)到,海量數(shù)據(jù)處理僅有Hadoop是不夠的。在他們看來(lái),簡(jiǎn)單的批處理工具比如MapReduce和Hadoop恐怕并不足以應(yīng)付將來(lái)更大的數(shù)據(jù)結(jié)構(gòu)。誠(chéng)然,大多數(shù)的比較復(fù)雜的海量數(shù)據(jù)處理我們也許能夠用Hadoop就足以對(duì)付——也許更多的是一個(gè)無(wú)奈選擇。它們可能涉及更復(fù)雜的連接,比如ACID需求、實(shí)時(shí)要求、超級(jí)計(jì)算的算法、圖形計(jì)算、互動(dòng)分析或者連續(xù)增量的需求等等。
事實(shí)上,Hadoop之所以受到越來(lái)越多的人歡迎,原因在于它對(duì)于海量數(shù)據(jù)的處理方式,而且,最重要的是,它是免費(fèi)的。
但是隨著對(duì)海量數(shù)據(jù)處理的應(yīng)用程序性能需求不斷增加,我們會(huì)發(fā)現(xiàn),在很多領(lǐng)域,我們需要除了Hadoop以外的更多的海量數(shù)據(jù)處理方式。
那么,我們應(yīng)該怎樣看待下一代分布式計(jì)算架構(gòu)呢?或者說(shuō),“NoHadoop”的架構(gòu)應(yīng)該是怎樣的呢?從性能上而言,下一代的架構(gòu)需要在MapReduce/Hadoop的基礎(chǔ)上有10——10000倍的性能提高。
在每一種應(yīng)用下,都有新一代的數(shù)據(jù)架構(gòu),可以提供所需的規(guī)模和效能。在未來(lái)的幾年內(nèi),這些架構(gòu)中的某些也許會(huì)成為主流。
1、SQL:數(shù)據(jù)庫(kù)已經(jīng)有了25年的發(fā)展歷史。大量的創(chuàng)新正在圍繞數(shù)據(jù)庫(kù)技術(shù),比如VoltDB、Clustrix等等(也許下一代產(chǎn)品不應(yīng)該再稱為數(shù)據(jù)庫(kù)),但當(dāng)你需要處理復(fù)雜的連接,或需要ACID需求時(shí),數(shù)據(jù)庫(kù)依然是你最好的選擇。
應(yīng)用場(chǎng)景:復(fù)雜的業(yè)務(wù)查詢、在線交易處理。
2、Cloudscale:在海量數(shù)據(jù)上的實(shí)時(shí)分析,它打破了自由批量處理的限制。比如,當(dāng)你打算分析一臺(tái)百萬(wàn)次的服務(wù)器中發(fā)生的事件流,你需要一個(gè)真正的實(shí)時(shí)數(shù)據(jù)流體系結(jié)構(gòu)。而Cloudscale架構(gòu)提供的這種實(shí)時(shí)數(shù)據(jù)分析能力,比Hadoop的批處理系統(tǒng)快了近10000倍。
應(yīng)用場(chǎng)景:商業(yè)算法,欺詐檢測(cè),手機(jī)廣告、位置服務(wù)、市場(chǎng)情報(bào)。
3、MPI和BSP:相當(dāng)多的超級(jí)計(jì)算機(jī)應(yīng)用中,需要在海量數(shù)據(jù)上建立復(fù)雜的算法,為了實(shí)現(xiàn)規(guī)模效應(yīng),需要對(duì)處理器的直接訪問(wèn)調(diào)用以提高計(jì)算的速度。在并行計(jì)算中,MPI和BSP這些工具是進(jìn)行高性能計(jì)算的必要。
應(yīng)用場(chǎng)景:建模與仿真系統(tǒng),流體動(dòng)力學(xué)。
4、Pregel:當(dāng)你需要分析一個(gè)復(fù)雜的社交網(wǎng),或者是要分析網(wǎng)絡(luò)的時(shí)候,面對(duì)的不是數(shù)據(jù)的問(wèn)題,而是一個(gè)很大的圖形。我們面臨的現(xiàn)狀是,大規(guī)模的動(dòng)態(tài)圖形正成為一些應(yīng)用的關(guān)鍵。Google的Pregel結(jié)構(gòu)采用了BSP模型,以便能夠進(jìn)行規(guī)?;?、高效的圖形計(jì)算。
應(yīng)用場(chǎng)景:算法,算法的結(jié)構(gòu)圖,地理位置圖,網(wǎng)絡(luò)優(yōu)化等
5、Dremel:這是一個(gè)需要與網(wǎng)絡(luò)進(jìn)行大規(guī)模交互的數(shù)據(jù)集。Google的Dremel的設(shè)計(jì)原理在于支持幾秒內(nèi)萬(wàn)億行命令的執(zhí)行,并提供即時(shí)查詢。而它的查詢執(zhí)行并沒(méi)有采用MapReduce 的功能。自從2006年以來(lái)Dremel誕生以來(lái),已經(jīng)有了成千上萬(wàn)的用戶。
應(yīng)用場(chǎng)景:數(shù)據(jù)搜索、客戶支持、數(shù)據(jù)中心監(jiān)控。
6、Percolator (Caffeine) :如果需要對(duì)龐大的數(shù)據(jù)增量進(jìn)行不斷更新,你會(huì)發(fā)現(xiàn),Percolator是一種很好的實(shí)現(xiàn)方式,這也是Google在新的索引系統(tǒng)上采用的架構(gòu),Google的即時(shí)搜索引擎Instant不能沒(méi)有它。“由于索引內(nèi)容可以逐步增加,采用以Percolator的Google Caffeine系統(tǒng)檢索速度將百倍于之前采用Hadoop的分布式數(shù)據(jù)處理方式。”
- 1未來(lái)oa系統(tǒng)的發(fā)展方向
- 2SaaS模式是中小企業(yè)信息化的有效途徑
- 3SaaS在線CRM系統(tǒng)的優(yōu)勢(shì)
- 4教您選擇最具性價(jià)比的辦公文件管理軟件下載
- 5文件管理軟件下載提升企業(yè)管理效率
- 6泛普進(jìn)銷存軟件讓管理更加系統(tǒng)
- 7如何看待免費(fèi)文件管理軟件下載?
- 8CRM系統(tǒng)提高企業(yè)競(jìng)爭(zhēng)力
- 9文件管理軟件下載市場(chǎng)發(fā)展前景
- 10SaaS服務(wù)給企業(yè)帶來(lái)哪些好處?
- 11SaaS軟件服務(wù)化的優(yōu)缺點(diǎn)
- 12文件管理軟件下載的功能和作用
- 13萬(wàn)能的文件管理軟件下載軟件不是好文件管理軟件下載
- 14云計(jì)算結(jié)合開(kāi)源軟件和SaaS后的優(yōu)點(diǎn)
- 15文件管理軟件下載塑造企業(yè)新未來(lái)
- 16如何利用文件管理軟件下載協(xié)助企業(yè)管理
- 17如何使用文件管理軟件下載軟件提高企業(yè)效益?
- 18文檔管理軟件下載 - 軟件安裝
- 19為什么文件管理軟件下載最受企業(yè)歡迎?
- 20哪些企業(yè)急需上文件管理軟件下載辦公?
- 21全面解刨文件管理軟件下載的選擇
- 22化解SaaS安全問(wèn)題的三大措施
- 23SaaS軟件服務(wù)的優(yōu)點(diǎn)分析
- 24文件管理軟件軟件對(duì)企業(yè)的價(jià)值
- 25文件管理軟件下載主要特點(diǎn)
- 26基于SaaS的中小企業(yè)信息化模式探討
- 27企業(yè)提升云安全六大方法
- 28泛普文件管理軟件下載在企業(yè)中的應(yīng)用
- 29文件管理軟件下載成為企業(yè)遠(yuǎn)航的護(hù)身符
- 30獨(dú)創(chuàng)SaaS引擎打造泛普云服務(wù)平臺(tái)