當(dāng)前位置:工程項目OA系統(tǒng) > 泛普各地 > 湖南OA系統(tǒng) > 長沙OA系統(tǒng) > 長沙OA軟件行業(yè)資訊
商務(wù)智能的關(guān)鍵技術(shù)
商務(wù)智能是一套完整的解決方案,它是將數(shù)據(jù)倉庫、聯(lián)機分析處理(OLAP)和數(shù)據(jù)挖掘等結(jié)合起來應(yīng)用到商業(yè)活動中,從不同的數(shù)據(jù)源收集數(shù)據(jù),經(jīng)過抽取(Extract)、轉(zhuǎn)換(Transform)和加載(Load),送入到數(shù)據(jù)倉庫或數(shù)據(jù)集市,然后使用合適的查詢與分析工具、數(shù)據(jù)挖掘工具和聯(lián)機分析處理工具對信息進行處理,將信息轉(zhuǎn)變成為輔助決策的知識,最后將知識呈現(xiàn)于用戶面前,以實現(xiàn)技術(shù)服務(wù)與決策的目的。
商務(wù)智能的支撐技術(shù)主要包括ETL(數(shù)據(jù)的提取、轉(zhuǎn)換與加載)技術(shù)和數(shù)據(jù)倉庫與數(shù)據(jù)集市技術(shù)、OLAP技術(shù)、數(shù)據(jù)挖掘技術(shù)與數(shù)據(jù)的發(fā)布與表示技術(shù)。
1.數(shù)據(jù)倉庫技術(shù)
實施BI首先要從企業(yè)內(nèi)部和企業(yè)外部不同的數(shù)據(jù)源,如客戶關(guān)系管理(CRM)、供應(yīng)鏈管理(SCM)、企業(yè)資源規(guī)劃(ERP)系統(tǒng)以及其他應(yīng)用系統(tǒng)等搜集有用的數(shù)據(jù),進行轉(zhuǎn)換和合并,因此需要數(shù)據(jù)倉庫和數(shù)據(jù)集市技術(shù)的支持。
數(shù)據(jù)倉庫(Data Warehouse)是指從多個數(shù)據(jù)源收集的信息,以一種一致的存儲方式保存所得到的數(shù)據(jù)集合。數(shù)據(jù)倉庫創(chuàng)始人之一W.H.Inmon的定義為:“數(shù)據(jù)倉庫是一個面向主題的、集成的、穩(wěn)定的、包含歷史數(shù)據(jù)的數(shù)據(jù)集合,它用于支持管理中的決策制定過程”。在構(gòu)造數(shù)據(jù)倉庫時,要經(jīng)過數(shù)據(jù)的清洗、數(shù)據(jù)的抽取轉(zhuǎn)換、數(shù)據(jù)集成和數(shù)據(jù)加載等過程。面向不同的需求,對數(shù)據(jù)進行清洗以保證數(shù)據(jù)的正確性,然后對數(shù)據(jù)進行抽取,轉(zhuǎn)換成數(shù)據(jù)倉庫所需形式,并實現(xiàn)加載到數(shù)據(jù)倉庫。
數(shù)據(jù)倉庫是一種語義上一致的數(shù)據(jù)存儲,充當(dāng)決策支持數(shù)據(jù)模型的物理實現(xiàn),并存放企業(yè)戰(zhàn)略決策所需信息。數(shù)據(jù)倉庫的數(shù)據(jù)模型有星型模式、雪花模式。星型模式最為常見,有一個包含大批數(shù)據(jù)并且不含冗余的中心表,每維一組小的附屬表。雪花模式中某些維表是規(guī)范化的,因而把數(shù)據(jù)進一步分解到附加的表中,模式圖形成了類似雪花的形狀。對數(shù)據(jù)倉庫的研究集中在數(shù)據(jù)集成中數(shù)據(jù)模式的設(shè)計、數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換、導(dǎo)入和更新方法等。
數(shù)據(jù)倉庫通常是企業(yè)級應(yīng)用,因此涉及的范圍和投入的成本非常巨大,使一些企業(yè)無力承擔(dān)。因而,他們希望在最需要的關(guān)鍵部門建立一種適合自身應(yīng)用的、自行定制的部門數(shù)據(jù)倉庫子集。正是這種需求使數(shù)據(jù)集市應(yīng)運而生。數(shù)據(jù)集市( Data Mart) 是聚焦在選定的主題上的,是部門范圍的。根據(jù)數(shù)據(jù)的來源不同,數(shù)據(jù)集市分為獨立的和依賴的兩類。在獨立的數(shù)據(jù)集市中,數(shù)據(jù)來自一個或多個操作的系統(tǒng)或外部信息提供者,或者來自在一個特定的部門或地域局部產(chǎn)生的數(shù)據(jù)。依賴的數(shù)據(jù)集市中的數(shù)據(jù)直接來自企業(yè)數(shù)據(jù)倉庫。
2.聯(lián)機分析處理技術(shù)(OLAP)
聯(lián)機分析處理(Online Analytical Processing ,簡稱OLAP) 又稱多維分析,由EF Codd 在1994 年提出,它對數(shù)據(jù)倉庫中的數(shù)據(jù)進行多維分析和展現(xiàn),是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、并真實反映企業(yè)維特性的信息進行快速、一致、交互地存取,從而獲得對數(shù)據(jù)更深入了解的一類軟件技術(shù)。它的技術(shù)核心是“維”這個概念,因此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。
進行OLAP分析的前提是已有建好的數(shù)據(jù)倉庫,之后即可利用OLAP 復(fù)雜的查詢能力、數(shù)據(jù)對比、數(shù)據(jù)抽取和報表來進行探測式數(shù)據(jù)分析了。稱其為探測式數(shù)據(jù)分析,是因為用戶在選擇相關(guān)數(shù)據(jù)后,通過切片(按二維選擇數(shù)據(jù))、切塊(按三維選擇數(shù)據(jù))、上鉆(選擇更高一級的數(shù)據(jù)詳細信息以及數(shù)據(jù)視圖)、下鉆(展開同一級數(shù)據(jù)的詳細信息)、旋轉(zhuǎn)(獲得不同視圖的數(shù)據(jù)) 等操作,可以在不同的粒度上對數(shù)據(jù)進行分析嘗試,得到不同形式的知識和結(jié)果。聯(lián)機分析處理研究主要集中在ROLAP(基于關(guān)系數(shù)據(jù)庫的OLAP) 的查詢優(yōu)化技術(shù)和MOLAP(基于多維數(shù)據(jù)組織的OLAP) 中減少存儲空間和提高系統(tǒng)性能的方法等。
3.數(shù)據(jù)挖掘技術(shù)
與OLAP 的探測式數(shù)據(jù)分析不同,數(shù)據(jù)挖掘是按照預(yù)定的規(guī)則對數(shù)據(jù)庫和數(shù)據(jù)倉庫中已有的數(shù)據(jù)進行信息開采、挖掘和分析,從中識別和抽取隱含的模式和有趣知識,為決策者提供決策依據(jù)。數(shù)據(jù)挖掘的任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)模式。模式有很多種,按功能可分為兩大類:預(yù)測型( Predictive)模式和描述型(Descriptive)模式。
預(yù)測型模式是可以根據(jù)數(shù)據(jù)項的值精確確定某種結(jié)果的模式。挖掘預(yù)測型模式所使用的數(shù)據(jù)也都是可以明確知道結(jié)果的。描述型模式是對數(shù)據(jù)中存在的規(guī)則做一種描述,或者根據(jù)數(shù)據(jù)的相似性把數(shù)據(jù)分組。描述型模式不能直接用于預(yù)測。在實際應(yīng)用中,根據(jù)模式的實際作用,可細分為分類模式、回歸模式、時間序列模式、聚類模式、關(guān)聯(lián)模式和序列模式6 種。其中包含的具體算法有貨籃分析(Market Analysis)、聚類檢測(Clustering Detection)、神經(jīng)網(wǎng)絡(luò)(Neural Networks)、決策樹方法(Decision Trees)、遺傳算法(Genetic Analysis)、連接分析(Link Analysis)、基于范例的推理(Case Based Reasoning)和粗集(RoughSet)以及各種統(tǒng)計模型。
OLAP 與數(shù)據(jù)挖掘的區(qū)別和聯(lián)系是:OLAP 側(cè)重于與用戶的交互、快速的響應(yīng)速度及提供數(shù)據(jù)的多維視圖,而數(shù)據(jù)挖掘則注重自動發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和有用信息,盡管允許用戶指導(dǎo)這一過程。OLAP 的分析結(jié)果可以給數(shù)據(jù)挖掘提供分析信息作為挖掘的依據(jù),數(shù)據(jù)挖掘可以拓展OLAP 分析的深度,可以發(fā)現(xiàn)OLAP 所不能發(fā)現(xiàn)的更為復(fù)雜、細致的信息。數(shù)據(jù)挖掘的研究重點則偏向數(shù)據(jù)挖掘算法以及數(shù)據(jù)挖掘技術(shù)在新的數(shù)據(jù)類型、應(yīng)用環(huán)境中使用時所出現(xiàn)新問題的解決上, 如對各種非結(jié)構(gòu)化數(shù)據(jù)的挖掘、數(shù)據(jù)挖掘語言的標(biāo)準(zhǔn)化以及可視化數(shù)據(jù)挖掘等。
4.BI 的表示和發(fā)布技術(shù)
為了使分析后的數(shù)據(jù)直觀、簡練地呈現(xiàn)在用戶面前,需要采用一定的形式表示和發(fā)布出來,通常采用的是一些查詢和報表工具。不過,目前越來越多的分析結(jié)果是以可視化的形式表現(xiàn)出來,這就需要采用信息可視化技術(shù)。
所謂信息可視化是指以圖形、圖像、虛擬現(xiàn)實等易為人們所辨識的方式展現(xiàn)原始數(shù)據(jù)間的復(fù)雜關(guān)系、潛在信息以及發(fā)展趨勢,以便我們能夠更好地利用所掌握的信息資源。隨著Web 應(yīng)用的普及,商務(wù)智能的解決方案能夠提供基于Web 的應(yīng)用服務(wù),這樣就擴展了商務(wù)智能的信息發(fā)布范圍。作為基于Web 的商務(wù)智能解決方案,需要一些基本的組成要素,包括基于Web 的商務(wù)智能服務(wù)器、會話管理服務(wù)、文件管理服務(wù)、調(diào)度、分配和通知服務(wù)、負載平衡服務(wù)和應(yīng)用服務(wù)等。
- 1如何安全地使用IaaS云計算服務(wù)?
- 2如何讓IaaS服務(wù)免受DNS漏洞的威脅?
- 3智能企業(yè)網(wǎng)產(chǎn)品分析:HP ProCurve
- 4如何選擇數(shù)據(jù)庫虛擬化平臺
- 5關(guān)于4G的二十問
- 6重復(fù)數(shù)據(jù)刪除與壓縮孰優(yōu)孰劣?
- 7湖南長沙锃嘉科學(xué)儀器有限公司招聘OA辦公軟件管理員
- 8協(xié)同OA辦公系統(tǒng)即將進入變革的時代
- 9無所不在的商業(yè)智能
- 10偏遠區(qū)域如何加強煙草專賣市場監(jiān)管
- 11虛擬化響起安全警報
- 12數(shù)據(jù)中心6大技術(shù)創(chuàng)新
- 13淺議SOA成熟度模型五個階段
- 14HP ProCurve 無線網(wǎng)絡(luò)POE供電
- 15基站回傳,3G網(wǎng)絡(luò)建設(shè)的基石
- 16BPM 開發(fā)利器 Lombardi Teamworks 7
- 17CIO選購:三大巨頭虛擬化新品橫向比較
- 18部署適用于云的多租戶基礎(chǔ)結(jié)構(gòu)
- 192010年數(shù)據(jù)中心網(wǎng)絡(luò):雙層網(wǎng)絡(luò)來臨
- 20視頻會議系統(tǒng)的“軟硬之爭”
- 21視頻監(jiān)控系統(tǒng)設(shè)備中的視頻處理技術(shù)
- 22讓企業(yè)SOA項目更可控之必備十大戒條
- 23應(yīng)用多樣----OA普適性價值突出
- 24協(xié)同管理軟件在集團中的公文管理解決方案
- 25未來,誰來保護你的安全
- 26下一代防火墻:更高速更智能
- 27網(wǎng)絡(luò)視頻進入內(nèi)容時代
- 28物聯(lián)網(wǎng): 事物即服務(wù)
- 29CPU與GPU融合之勢難擋
- 30數(shù)據(jù)中心與云服務(wù),兩項服務(wù)可否共存?
成都公司:成都市成華區(qū)建設(shè)南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓