當(dāng)前位置:工程項目OA系統(tǒng) > 泛普服務(wù)體系 > 泛普博客
開源BI系統(tǒng)相關(guān)知識綜合解讀
這些眾多的BI項目從規(guī)模和對BI系統(tǒng)支撐的完善程度上來說,大體可以分為Framework、Stand-alone Tools和BI Suit三種類型。
Framework
開源框架,這是在商業(yè)BI系統(tǒng)中所沒有的。我們可以使用它們來構(gòu)建自己的BI工具,或者增強和擴展我們的BI解決方案。
Stand-alone Tools
獨立的BI工具,這是開源項目中數(shù)量最多的一類。很多工具只側(cè)重BI系統(tǒng)中的某個環(huán)節(jié)和方面,如ETL、Report、OLAP和Database等等。
BI Suit
在統(tǒng)一的架構(gòu)下提供了多種BI系統(tǒng)的特性的工具集合。就目前的情況看,不管是商業(yè)軟件還是開源軟件,還沒有任何一個套件提供了完整的端到端的BI解決方案。這些開源的BI Suit是通過連接多個其他的組件和工具的方式形成套件的,由于BI系統(tǒng)涉及到的工具是非常多的,所以整合一套完整的BI解決方案是很困難的。
BI解決方案中的工具
一個完整的BI解決方案中有多種工具來完成BI系統(tǒng)中各個階段的工作。
ETL工具
數(shù)據(jù)抽取、轉(zhuǎn)換和加載工具。優(yōu)秀的ETL工具應(yīng)該具有以下特性:
1、 Workflow Management, Job Execution and Scheduling Manager。能方便地定義流程并自動化執(zhí)行ETL任務(wù)。
2、 Centralized Metadata Repository and Management。集中存儲和管理符合業(yè)界標(biāo)準的元數(shù)據(jù)。
3、 Data Profile and Validation??梢詸z驗數(shù)據(jù)的質(zhì)量。
4、 High Performance。在大負荷的任務(wù)執(zhí)行中仍然有良好的性能。
5、 Scalable, Platform Independent。具有良好的彈性,支持多種操作系統(tǒng)和數(shù)據(jù)庫系統(tǒng),能操作多種異構(gòu)的數(shù)據(jù)源。
6、 Open Architecture and API。具有開放的架構(gòu)和易于使用的二次開發(fā)接口。
目前較為知名的開源ETL工具有:
1、 KETL,由具有IBM和KPMG背景的Kinetic Networks公司開發(fā),現(xiàn)在已經(jīng)有三年多的產(chǎn)品應(yīng)用歷史,成功應(yīng)用于一些產(chǎn)品中,在點擊流(ClickStream)分析應(yīng)用中表現(xiàn)出色。KETL采用Plug-in的架構(gòu),使用Java開發(fā)。
2、 KETTLE,為一個元數(shù)據(jù)驅(qū)動的ETL工具。已經(jīng)加入Pentaho。
3、 Clover ETL,為一個基于Java的ETL Framework,可以用來開發(fā)自己的ETL應(yīng)用。
4、 Enhydra Octopus,為一個基于Java的ETL工具,使用JDBC來連接各種數(shù)據(jù)源,易于使用和部署。曾有人應(yīng)用于電信網(wǎng)絡(luò)資源分析系統(tǒng)中。
表工具
優(yōu)秀的報表工具通常具有以下特性:
1、 支持多種數(shù)據(jù)源。
2、 直觀的可視化設(shè)計器,簡單易用的報表定制功能。
3、 方便的數(shù)據(jù)訪問和格式化,豐富的數(shù)據(jù)呈現(xiàn)方式。
4、 符合數(shù)據(jù)呈現(xiàn)的通用標(biāo)準,能和應(yīng)用程序很好地進行結(jié)合。
5、 易于擴展和部署。
目前較為知名的開源報表工具有:
1、 JasperReports,一個優(yōu)秀的Java報表工具,始于2001,現(xiàn)在JasperSoft公司持續(xù)開發(fā)和支持該工具。該工具類似于商業(yè)軟件 Crystal Report,支持PDF、HTML、XLS、CSV和XML文件輸出格式,現(xiàn)在是Java開發(fā)者最常用的報表工具。
2、 OpenReports,提供基于web的靈活報表解決方案,通過瀏覽器自動生成動態(tài)PDF,XLS,HTMLCSV 和Chart報表,它是用Java開發(fā)的,使用JasperReports 作為報表引擎,利用到的開源技術(shù)有Hibernate,Veloctiy,Webwork。
3、 JFreeReport,現(xiàn)在是Pentaho的一部分,它是一個優(yōu)秀的用來生成報表的Java類庫。它為Java應(yīng)用程序提供一個靈活的打印功能并支持輸出到打印機和PDF, Excel, HTML和XHTML, PlainText, XML和CSV文件中。
4、 Eclipse BIRT,是Eclipse下面的一個企業(yè)智能和報表 工具,能為J2EE的WEB應(yīng)用程序創(chuàng)建漂亮醒目的PDF或者HTML格式的報表,它提供了核心的報表功能。
OLAP工具
聯(lián)機分析處理工具。目前開源的OLAP工具也分為MOLAP、ROLAP和HOLAP,優(yōu)秀的OLAP工具通常有以下特性:
1、 良好的執(zhí)行性能,能快速地進行分析處理工作。
2、 良好的適用性和可伸縮性。
3、 開放式接口和豐富的API。
目前較為知名的開源OLAP工具有:
1、 Mondrian,是Pentaho的一部分,為一個用Java開發(fā)的OLAP服務(wù)器,實現(xiàn)了MDX語言、XML解析和JOLAP規(guī)范,可以不寫SQL就能分析存儲于SQL 數(shù)據(jù)庫的龐大數(shù)據(jù)集,可以封裝JDBC數(shù)據(jù)源并把數(shù)據(jù)以多維的方式展現(xiàn)出來。
2、 JPivot,是一個JSP 自定制的標(biāo)簽庫,可以繪制一個OLAP表格和圖表。用戶可以執(zhí)行典型的OLAP導(dǎo)航,如下鉆,切片和方塊。它使用Mondrian 作為其OLAP服務(wù)器。它使用WCF (Web Component Framework) ,基于XML/XSLT來渲染W(wǎng)eb UI組件。JPivot在元數(shù)據(jù)緩存方面的過于簡化的整體性初始化裝載的做法將限制它只能處理很小的立方體(Cube)。
數(shù)據(jù)庫
開源的數(shù)據(jù)庫也有很多,大多數(shù)為關(guān)系型數(shù)據(jù)庫,少數(shù)為應(yīng)用于數(shù)據(jù)倉庫環(huán)境做了專門的優(yōu)化工作。Bizgres以PostgreSQL為基礎(chǔ)進行了數(shù)據(jù)倉庫環(huán)境下的優(yōu)化,提高了分析查詢性能。
開源BI套件
下面列出相對成熟和完整,并且有借鑒意義的開源BI套件。
Bizgres
為GreenPlum公司主導(dǎo)的開源項目,和Sun公司達成合作關(guān)系。Bizgres為B
I應(yīng)用而對PostgreSQL做了優(yōu)化,提高了大負荷的并行計算能力,在BI環(huán)境中,相對于普通的關(guān)系型數(shù)據(jù)庫具有卓越的數(shù)據(jù)處理性能。Bizgres的數(shù)據(jù)庫平臺可以和KETL和JasperReports進行整合,從而形成一個BI套件:
1、 數(shù)據(jù)庫:BI專業(yè)數(shù)據(jù)庫Bizgres,或者大型應(yīng)用中的高性能服務(wù)器Bizgres MPP,能比普通關(guān)系數(shù)據(jù)庫快20倍
2、 ETL工具:KETL
3、 報表工具:JasperReports
Openi
是一個Java開發(fā)的Web應(yīng)用,能對OLAP服務(wù)器、關(guān)系數(shù)據(jù)庫和數(shù)據(jù)挖掘服務(wù)器進行分析和報表展示,非常易于使用和部署,界面美觀友好,后續(xù)還將支持數(shù)據(jù)挖掘和ETL等。Openi主要包括:
1、 OLAP展示:JPivot
2、 報表工具:JFreeChart
3、 分析數(shù)據(jù)源連接器
Pentaho
是一個以工作流為核心的、強調(diào)面向解決方案而非工具組件的BI套件,整合了多個開源項目,目標(biāo)是和商業(yè)BI相抗衡。它包括:
1、 工作流引擎:Shark and JaWE
2、 數(shù)據(jù)庫:Firebird RDBMS
3、 集成管理和開發(fā)環(huán)境:Eclipse
4、 報表工具:Eclipse BIRT
5、 ETL工具:Enhydra/Kettle
6、 OLAP Server:Mondrian
7、 OLAP展示:JPivot
8、 數(shù)據(jù)挖掘組件:Weka
9、 應(yīng)用服務(wù)器和Portal服務(wù)器:JBoss
10、 單點登陸服務(wù)及LDap認證:JOSSO
11、 自定義腳本支持:Mozilla Rhino Javascript腳本處理器
由上可見Pentaho是一個很完善的BI解決方案。Pentaho偏向于與業(yè)務(wù)流程相結(jié)合的BI解決方案,側(cè)重于大中型企業(yè)應(yīng)用。
SpagoBI
SpagoBI 集成了Mondrain和JProvit,能夠通過OpenLaszlo產(chǎn)生實時報表。SpagoBI使用java開發(fā),不依賴于具體的操作系統(tǒng),有很強的擴展能力。它主要包括:
1、 報表工具:JasperReports /Eclipse BIRT/ iReport
2、 OLAP Server:Mondrian
3、 OLAP展示:JPivot
4、 數(shù)據(jù)挖掘組件:Weka
5、 Map引擎:Geo
6、 ETL:BIE
7、 搜索引擎:Lucene
8、 Dashboard:OpenLaszlo
9、 Portal Server:JBoss/ Tomcat/ JOnAS
根據(jù)其Roadmap可以看出,SpagoBI將融入更多的BI功能,甚至BI之外的功能。(CIO時代論壇)
- 1中國公司治理的成人禮
- 2OA辦公系統(tǒng)使企業(yè)員工能及時感知企業(yè)發(fā)展動態(tài)
- 3美國連鎖店基本運作方式及其管理
- 4調(diào)查結(jié)果表明:大學(xué)生心系國家立志成才意愿強
- 5泛普OA辦公系統(tǒng)實現(xiàn)無紙化辦公的事跡,掀起一股政府無紙化辦公的熱潮
- 6危機助推新資本協(xié)議改進與發(fā)展
- 7泛普OA辦公系統(tǒng)的出現(xiàn),幫助企業(yè)實現(xiàn)了辦公高效管理的目的
- 82015國家公務(wù)員考試準考證打印入口
- 9OA是架構(gòu),這說明它包括了一套最佳實踐以及需要遵循的規(guī)律
- 10如何打消企業(yè)在購買OA軟件時可能會有的顧慮?
- 11充分挖掘您的CRM系統(tǒng)
- 12調(diào)查稱國人果蔬吃太少
- 13經(jīng)濟危機下下管理軟件要比企業(yè)"快半步"
- 14[服裝管理軟件]服裝店經(jīng)營技巧之接近顧客
- 15為企業(yè)順利過冬支招:優(yōu)化流程練好內(nèi)功
- 16有梧桐樹才能吸引金鳳凰
- 17雙11,馬云如何給對手們一嘴巴子
- 18小討論:CRM是“歐版”還是“美版”?
- 19聯(lián)華連鎖便利店發(fā)展攻略
- 20Instagram到Pinterest:圖片社交緣何估值連城--泛普軟件和科技北京軟件開發(fā)
- 21調(diào)查顯示:50%青少年在8歲前“觸網(wǎng)”
- 22妨礙財務(wù)信息化管理效果兩大因素
- 23CAD聯(lián)盟:雷聲大雨點?。?/a>
- 24易到用車賣身滴滴調(diào)查:投資方或與管理層博弈
- 25網(wǎng)管員基礎(chǔ)知識:詳解VoIP網(wǎng)關(guān)相關(guān)術(shù)語(1)
- 26商業(yè)智能提高企業(yè)信息化應(yīng)用水平
- 27中小企業(yè)的生存法則是什么
- 28OA辦公系統(tǒng)的本職工作就是依靠先進的OA技術(shù)平臺
- 29蚌埠一液化氣加氣點發(fā)生爆炸 原因還在調(diào)查之中
- 30如何從沖突走向共贏
成都公司:成都市成華區(qū)建設(shè)南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓