當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 福建OA系統(tǒng) > 福州OA系統(tǒng) > 福州OA快博
多維數(shù)據(jù)模型與OLAP的實(shí)現(xiàn)
近年來,隨著網(wǎng)絡(luò)技術(shù)和數(shù)理分析在銀行業(yè)中的廣泛應(yīng)用,西方商業(yè)銀行開始廣泛采用人口地理統(tǒng)計(jì)理論,運(yùn)用數(shù)據(jù)挖掘及商業(yè)智能等技術(shù),處理跨時(shí)間、跨空間、跨部門、跨產(chǎn)品的銀行數(shù)據(jù)集成分析問題,逐步實(shí)現(xiàn)了金融產(chǎn)品和金融服務(wù)的交叉銷售,以保留住優(yōu)質(zhì)客戶。目前,國內(nèi)多家銀行也不同程度地開展了商業(yè)智能(BI,Business Intelligence)系統(tǒng)建設(shè),從信息管理角度看,商業(yè)智能是決策支持技術(shù)在商業(yè)銀行應(yīng)用的進(jìn)一步發(fā)展和完善,OLAP(On-Line Analytical Processing,聯(lián)機(jī)分析處理)技術(shù)是BI的關(guān)鍵技術(shù)之一。自1970年第一個(gè)OLAP的雛形工具Express發(fā)布,到1993年關(guān)系數(shù)據(jù)庫之父、數(shù)學(xué)家與計(jì)算機(jī)科學(xué)家愛德華·庫德(E.F.Codd)系統(tǒng)地提出OLAP概念和OLAP的12條準(zhǔn)則,OLAP技術(shù)和產(chǎn)品有了很大的發(fā)展,其內(nèi)涵和外延也發(fā)生了一定的變化。但其本質(zhì)特征仍然是:以多維數(shù)據(jù)模型為基礎(chǔ)組織和存儲(chǔ)數(shù)據(jù),滿足對用戶請求的快速響應(yīng)和交互式操作。
OLAP技術(shù)在國內(nèi)興起和發(fā)展的過程中,人們對某些基本概念還有不同的理解。比如,OLAP與多維數(shù)據(jù)模型的關(guān)系,多維數(shù)據(jù)模型與多維數(shù)據(jù)庫(MDD,Multi Dimensional Database)的關(guān)系,MOLAP(Multidimensional OLAP,關(guān)系聯(lián)機(jī)分析處理)和HOLAP(Hybrid OLAP,混合聯(lián)機(jī)分析處理)間的差異,多維數(shù)據(jù)庫與多維聯(lián)機(jī)分析處理是不是完全一致等問題,還有待于進(jìn)一步澄清。
一、多維數(shù)據(jù)模型及相關(guān)概念
數(shù)據(jù)模型一般有兩個(gè)層次:概念層(邏輯層)和物理層。邏輯數(shù)據(jù)模型是從概念角度抽象出現(xiàn)實(shí)世界的內(nèi)在規(guī)律,如業(yè)務(wù)流程、數(shù)據(jù)架構(gòu)等;物理數(shù)據(jù)模型則側(cè)重于特定環(huán)境下的具體實(shí)現(xiàn),如效率、安全性等。
多維數(shù)據(jù)模型是一個(gè)邏輯概念,該模型主要解決如何對大量數(shù)據(jù)進(jìn)行快速查詢和多角度展示,以便得出有利于管理決策的信息和知識(shí)。多維數(shù)據(jù)模型的應(yīng)用領(lǐng)域主要有數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘3個(gè)方面,其中,多維結(jié)構(gòu)是OLAP的核心。
多維數(shù)據(jù)模型通過引入維、維分層和度量等概念,將信息在概念上視為一個(gè)立方體。圖1表示了一個(gè)數(shù)據(jù)立方體。
圖1 一個(gè)數(shù)據(jù)立方體
1. 立方體:用三維或更多的維數(shù)描述一個(gè)對象,每個(gè)維彼此垂直。數(shù)據(jù)的度量值發(fā)生在維的交叉點(diǎn)上,數(shù)據(jù)空間的各個(gè)部分都有相同的維屬性。
2. 維:是人們觀察數(shù)據(jù)的特定角度,是考慮問題時(shí)的一類屬性,屬性的集合構(gòu)成一個(gè)維(如時(shí)間維、機(jī)構(gòu)維等)。
3. 維分層:同一維度還可以存在細(xì)節(jié)程度不同的各個(gè)描述方面(如時(shí)間維可包括年、季度、月份、旬和日期等)。
4. 維屬性:維的一個(gè)取值,是數(shù)據(jù)項(xiàng)在某維中位置的描述(例如“某年某月某日”是在時(shí)間維上位置的描述)。
5. 度量:立方體中的單元格,用以存放數(shù)據(jù)。
OLAP的基本多維分析操作有鉆取(Roll up,Drill down)、切片(Slice)、切塊(Dice)及旋轉(zhuǎn)(Pivot)等。
鉆取包含向下鉆取和向上鉆取(上卷)操作,鉆取的深度與維所劃分的層次相對應(yīng)。上卷操作通過維規(guī)約,在數(shù)據(jù)立方體上進(jìn)行聚集;下鉆操作是上卷操作的逆操作,由不太詳細(xì)的數(shù)據(jù)到更詳細(xì)的數(shù)據(jù)。
切片和切塊是在一部分維上選定值后,度量數(shù)據(jù)在剩余維上的分布。在多維數(shù)據(jù)結(jié)構(gòu)中,按照二維、二維進(jìn)行切塊可得到所需數(shù)據(jù),如在“機(jī)構(gòu)、產(chǎn)品、時(shí)間”三維立方體中進(jìn)行切塊和切片,可得到各城市、各產(chǎn)品的銷售情況。
旋轉(zhuǎn)(轉(zhuǎn)軸)是變換維的方向,即在表格中重新安排維的放置(如行列互換),通過旋轉(zhuǎn)得到不同視角的數(shù)據(jù)。
二、多維數(shù)據(jù)模型的物理實(shí)現(xiàn)
OLAP多維數(shù)據(jù)模型的實(shí)現(xiàn)有多種途徑,其中主要有采用數(shù)組的多維數(shù)據(jù)庫、關(guān)系型數(shù)據(jù)庫以及兩者相結(jié)合的方式,人們通常稱之為MOLAP、ROLAP和HOLAP。但MOLAP的提法容易引起誤解,畢竟根據(jù)OLAP的多維概念,ROLAP也是一種多維數(shù)據(jù)的組織方式。
1. 多維聯(lián)機(jī)分析處理(多維數(shù)據(jù)庫管理系統(tǒng))
多維聯(lián)機(jī)分析處理嚴(yán)格遵照庫德的定義,自行建立多維數(shù)據(jù)庫來存放聯(lián)機(jī)分析系統(tǒng)的數(shù)據(jù),它以多維數(shù)據(jù)組織方式為核心,也就是說,多維聯(lián)機(jī)分析處理使用多維數(shù)組存儲(chǔ)數(shù)據(jù)。
當(dāng)利用多維數(shù)據(jù)庫存儲(chǔ)OLAP數(shù)據(jù)時(shí),不需要將多維數(shù)據(jù)模型中的維度、層劃分和立方體等概念轉(zhuǎn)換成其他的物理模型,因?yàn)槎嗑S數(shù)組(矩陣)能很好地體現(xiàn)多維數(shù)據(jù)模型特點(diǎn)。
針對圖1,可以定義一個(gè)三維數(shù)組矩陣(7,6,3),體現(xiàn)立方體的維、屬性和維度量。其中數(shù)組中維的個(gè)數(shù)對應(yīng)立方體的維度數(shù),數(shù)組中每一維取值對應(yīng)立方體中每一維度的屬性個(gè)數(shù),而數(shù)組的126個(gè)交點(diǎn)對應(yīng)立方體中的單元格,用來存放數(shù)據(jù)。
利用數(shù)組實(shí)現(xiàn)多維數(shù)據(jù)模型的優(yōu)點(diǎn),在于對數(shù)據(jù)的快速訪問,但同時(shí)也會(huì)帶來存儲(chǔ)空間的冗余,即稀疏矩陣問題,進(jìn)而導(dǎo)致對存儲(chǔ)空間的極大需求。例如,圖2中定義的一個(gè)立方體結(jié)構(gòu),在用數(shù)組定義時(shí),其取值可能有104463億種情況。但實(shí)際上,并不是每一天、每個(gè)經(jīng)營機(jī)構(gòu)在不同地區(qū)和不同特約商戶都會(huì)產(chǎn)生具有不同幣種、不同卡種的交易,和關(guān)系數(shù)據(jù)庫管理系統(tǒng)相比,只有當(dāng)某一交易確實(shí)發(fā)生時(shí),才在相應(yīng)的表中留下記錄。
圖2 認(rèn)力一體中的稀疏矩陣問題
為了解決稀疏矩陣問題,某些產(chǎn)品提出了稀疏維(sparse)和密度維(Dense)策略。由稀疏維產(chǎn)生索引塊,由密度維形成數(shù)據(jù)塊。只有當(dāng)稀疏維的組合在交易事件初次發(fā)生時(shí)才創(chuàng)建索引塊,進(jìn)而創(chuàng)建數(shù)據(jù)塊。
圖3顯示了數(shù)據(jù)塊和索引塊的關(guān)系。稀疏維和密度維的引入在一定程度上降低了立方體的存儲(chǔ)冗余問題,此外,通過數(shù)據(jù)壓縮技術(shù)可降低數(shù)據(jù)塊的存儲(chǔ)空間。
圖3 稀疏維和密度維
- 1數(shù)據(jù)在企業(yè)福州OA實(shí)施中到底有多重要
- 2把BI集成到SOA的好處和策略研究
- 3SOA業(yè)務(wù)需求的考慮應(yīng)從后臺(tái)角度出發(fā)
- 4IT高速發(fā)展時(shí)代SOA怎么了
- 5企業(yè)OA辦公系統(tǒng)流程中涉及角色清單
- 6數(shù)據(jù)倉庫——商業(yè)智能的基石
- 7福州OA實(shí)施烏云壓頂 巧借WBS重見天日
- 8從全球目前的競爭格局來講有四種模式
- 9商務(wù)流程模型結(jié)合SOA消除業(yè)務(wù)部門間隔閡
- 10福州OA烏云壓頂,巧借WBS重見天日
- 11中小型企業(yè)應(yīng)用精益生產(chǎn)系統(tǒng)的探討
- 12福州OA實(shí)施危機(jī)處理:挽狂瀾之即倒
- 13實(shí)施福州OA項(xiàng)目可解決企業(yè)哪五大問題
- 14SOA應(yīng)用使BPM管理得到最大程度的簡化
- 15影響福州OA實(shí)施成敗的幾項(xiàng)關(guān)鍵因素
- 16體系與軟件之爭 中小企業(yè)信息化中誰更重要
- 17物流信息化的三重境界:從軟件到平臺(tái)
- 18通過WOA部署SOA 反常道而行之
- 19降低福州OA運(yùn)維成本助企業(yè)度過危機(jī)
- 20詳解關(guān)鍵點(diǎn) 企業(yè)IT部門成本管理簡析
- 21實(shí)現(xiàn)福州OA系統(tǒng)與固定資產(chǎn)管理有效結(jié)合的建議
- 22兵馬未動(dòng)糧草先行 企業(yè)信息化先IRP后福州OA
- 23如何在企業(yè)門戶建設(shè)中應(yīng)用知識(shí)管理
- 24中小企業(yè)信息資源管理存在問題及解決對策
- 25對于商業(yè)智能的前生今世之思考和分析
- 26生產(chǎn)及物料控制部門的管理流程及注意事項(xiàng)
- 27利用數(shù)據(jù)倉庫技術(shù)輔助CRM決策
- 28覆蓋整體產(chǎn)品生命周期 探尋PDM管理迷局
- 29企業(yè)業(yè)務(wù)流程管理成熟度模型
- 30解析企業(yè)SOA架構(gòu)實(shí)施的失敗之謎
成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓