監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機(jī)APP | 產(chǎn)品資料
X 關(guān)閉
重慶OA信息化

當(dāng)前位置:工程項目OA系統(tǒng) > 泛普各地 > 重慶OA系統(tǒng) > 重慶OA信息化

基于SQL SERVER 2005的數(shù)據(jù)挖掘系統(tǒng)設(shè)計

申請免費(fèi)試用、咨詢電話:400-8352-114

文章來源:泛普軟件 數(shù)據(jù)挖掘系統(tǒng)設(shè)計(上)

數(shù)據(jù)倉庫(Data Warehouse)是伴隨著決策支持系統(tǒng)的發(fā)展而產(chǎn)生的,是人們對信息需求從簡單到復(fù)雜,從基本的事務(wù)處理和業(yè)務(wù)管理到信息分析和戰(zhàn)略決策的體現(xiàn)。而數(shù)據(jù)挖掘(DataMining)就是應(yīng)用一系列技術(shù)從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫的數(shù)據(jù)中提取人們感興趣的信息和知識,是統(tǒng)計學(xué)、數(shù)據(jù)庫技術(shù)和人工智能技術(shù)的綜合。

但一方面,隨著數(shù)據(jù)挖掘工具的使用日漸廣泛,人們發(fā)現(xiàn)有些工具只有精通數(shù)據(jù)挖掘算法的專家才能熟練使用。如果對算法不了解,難以得出好的模型.所以迫切需要一類使用簡單而又具有針對性、功能良好的數(shù)據(jù)挖掘軟件。

另一方面,國內(nèi)對數(shù)據(jù)挖掘方面的算法和方面的研究相對較少。因此,本文結(jié)合數(shù)據(jù)挖掘軟件的發(fā)展,針對第3代數(shù)據(jù)挖掘系統(tǒng)的設(shè)計,提出一種基于SQL Server 2005的縱向數(shù)據(jù)挖掘解決方案的設(shè)計框架。

1 數(shù)據(jù)挖掘軟件的發(fā)展

1.1 數(shù)據(jù)挖掘軟件經(jīng)歷的4個時代

在對數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)挖掘軟件的探索和開發(fā)過程中,很多學(xué)者提出了自己獨(dú)特的觀點(diǎn)。對于數(shù)據(jù)挖掘軟件的發(fā)展,Robert Grossman認(rèn)為,數(shù)據(jù)挖掘軟件經(jīng)歷了或即將經(jīng)歷的時代有4個,如表1所示。

表1 數(shù)據(jù)挖掘軟件經(jīng)歷的4個時代

1.2 數(shù)據(jù)挖掘工具經(jīng)歷的3個階段

目前在整個數(shù)據(jù)挖掘技術(shù)的發(fā)展過程中,數(shù)據(jù)挖掘工具一共經(jīng)歷了3個階段,分別是:

1)獨(dú)立的數(shù)據(jù)挖掘軟件。該階段對應(yīng)第一代數(shù)據(jù)挖掘系統(tǒng),出現(xiàn)在數(shù)據(jù)挖掘技術(shù)發(fā)展早期,研究人員開發(fā)出一種新型的數(shù)據(jù)挖掘算法,就形成一個軟件。這類軟件要求用戶對具體的算法和數(shù)據(jù)挖掘技術(shù)有相當(dāng)?shù)牧私?,還要負(fù)責(zé)大量的數(shù)據(jù)預(yù)處理工作。

2)橫向的數(shù)據(jù)挖掘工具集。此類工具集的特點(diǎn)是提供多種數(shù)據(jù)挖掘算法,包括數(shù)據(jù)的轉(zhuǎn)換和可視化。由于此類工具并非面向特定的應(yīng)用,是通用的算法集合,所以稱之為橫向的數(shù)據(jù)挖掘工具。

3)縱向的數(shù)據(jù)挖掘解決方案。此類工具的特點(diǎn)是,針對特定的應(yīng)用提供完整的數(shù)據(jù)挖掘方案,所以稱之為縱向的數(shù)據(jù)挖掘解決方案。

2 SQL Server 2005簡介

2.1 數(shù)據(jù)挖掘的范圍及其在SQL Server 2005中的功能實(shí)現(xiàn)

SQL Server 2005不僅是一個成熟的數(shù)據(jù)庫管理系統(tǒng)(DBMS),而且更是一個高度集成的功能強(qiáng)大的商業(yè)智能平臺。下面結(jié)合商務(wù)智能的范圍來介紹SQL Server 2005所提供的相關(guān)組件。

圖1 數(shù)據(jù)挖掘在SQL Server 2005中的功能實(shí)現(xiàn)

圖1所示的就是數(shù)據(jù)挖掘的三個重要的方面,即數(shù)據(jù)報表、數(shù)據(jù)分析和數(shù)據(jù)挖掘。其中,數(shù)據(jù)報表模塊為企業(yè)解決了“它現(xiàn)在是什么樣”的問題,數(shù)據(jù)分析,也就是人們經(jīng)常說的OLAP模塊為企業(yè)解釋了“它為什么是這樣”的原因,而數(shù)據(jù)挖掘模塊則為企業(yè)提供“它以后會是什么樣”的預(yù)測。而SQL Server 2005作為商業(yè)智能解決方案,則分別提供了相應(yīng)的功能模塊和組件,即數(shù)據(jù)挖掘、分析服務(wù)和報表服務(wù)。

其中,數(shù)據(jù)挖掘功能的組件主要包括集成服務(wù)(SQL Server Integration Services,SSIS)和分析服務(wù)(Analysis Services,AS)。集成服務(wù)可用于數(shù)據(jù)預(yù)處理階段,完成數(shù)據(jù)的轉(zhuǎn)換、清洗和加載(ETL)過程;而分析服務(wù)用于完成模式發(fā)現(xiàn)功能,兩者具體功能介紹如下。

發(fā)布:2007-04-22 09:11    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:

泛普重慶OA信息化其他應(yīng)用

重慶OA軟件 重慶OA新聞動態(tài) 重慶OA信息化 重慶OA客戶 重慶OA快博 重慶OA行業(yè)資訊 重慶軟件開發(fā)公司 重慶網(wǎng)站建設(shè)公司 重慶物業(yè)管理軟件 重慶餐飲管理軟件 重慶倉庫管理系統(tǒng) 重慶門禁系統(tǒng) 重慶微信營銷 重慶ERP 重慶監(jiān)控公司 重慶金融行業(yè)軟件 重慶B2B、B2C商城系統(tǒng)開發(fā) 重慶建筑施工項目管理系統(tǒng)開發(fā)