監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 簽約案例 | 購買價(jià)格 | 在線試用 | 手機(jī)APP | 產(chǎn)品資料
X 關(guān)閉
上海OA軟件行業(yè)資訊

當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 上海OA系統(tǒng) > 上海OA軟件行業(yè)資訊

鋼鐵企業(yè)生產(chǎn)成本數(shù)據(jù)集市及數(shù)據(jù)挖掘研究

申請免費(fèi)試用、咨詢電話:400-8352-114

文章來源:泛普軟件

0 引 言

近十年來 ,鋼鐵企業(yè)面臨的市場競爭環(huán)境發(fā)生了巨大的改變,客戶對鋼材的品種、規(guī)格(如板材的寬度、厚度、鍍層和機(jī)械性能指標(biāo)等)需求越來越多樣化,客戶需求呈現(xiàn)多品種、小批量的特點(diǎn)。因此,在現(xiàn)有的市場條件下,鋼鐵企業(yè)必須在保證產(chǎn)品質(zhì)量與交貨期的同時(shí),大力加強(qiáng)成本管理,使產(chǎn)品在質(zhì)優(yōu)價(jià)廉的情況下獲取適當(dāng)?shù)睦麧?,以增?qiáng)企業(yè)的市場競爭力。

鋼鐵行業(yè)的成本管理是一個(gè)復(fù)雜的系統(tǒng)工程,必須在整個(gè)企業(yè)經(jīng)營范圍內(nèi)對采購成本、生產(chǎn)成本、銷售成本、質(zhì)量成本等進(jìn)行全面監(jiān)控,定期獲取各種生產(chǎn)消耗數(shù)據(jù),如原材料中的合金料消耗、鋼鐵料消耗以及各種輔助材料的消耗(部分輔料可能需要手工歸集),實(shí)現(xiàn)實(shí)時(shí)成本的歸集和計(jì)算,以實(shí)現(xiàn)鋼鐵產(chǎn)品成本的事前、事中和事后控制。

通過將先進(jìn)的數(shù)據(jù)挖掘技術(shù)引入到鋼鐵生產(chǎn)成本管理領(lǐng)域,可以從大量的鋼鐵生產(chǎn)成本歷史數(shù)據(jù)中獲得潛在的規(guī)律和發(fā)展趨勢,以指導(dǎo)鋼鐵生產(chǎn),降低產(chǎn)品成本。這些潛在的信息包括:為什么某一個(gè)特定日某種材料消耗總是比較高;哪一個(gè)因素(班組、工序、設(shè)備、環(huán)境、原料配比等)是導(dǎo)致成本增加的主要原因;哪一個(gè)班組在成本控制方面做得更好等。

傳統(tǒng)的數(shù)據(jù)庫技術(shù)是事物驅(qū)動、面向應(yīng)用的操作型數(shù)據(jù)庫系統(tǒng),而數(shù)據(jù)挖掘和決策支持需要將來自各種異種源的數(shù)據(jù)統(tǒng)一,產(chǎn)生高質(zhì)量的、純凈的集成的數(shù)據(jù)。在這種情況下,操作型數(shù)據(jù)庫中的數(shù)據(jù)盡管很豐富,對于決策和數(shù)據(jù)挖掘還是遠(yuǎn)遠(yuǎn)不夠的,因此不能簡單地在一般操作數(shù)據(jù)庫上進(jìn)行數(shù)據(jù)挖掘,需要建立為數(shù)據(jù)挖掘和決策分析提供支持的數(shù)據(jù)集市或數(shù)據(jù)倉庫。

1 鋼鐵生產(chǎn)成本分析模型

超高功率電弧爐煉鋼是一個(gè)高溫、多相、快速的冶金過程,整個(gè)過程所涉及的變量非常多,必須建立合理的煉鋼成本分析模型,才能達(dá)到提高生產(chǎn)率、降低成本和改善產(chǎn)品質(zhì)量的目的。為了建立合理的成本分析模型,首先要對煉鋼工序系統(tǒng)進(jìn)行分析,系統(tǒng)分析模型如圖1所示。

圖1 鋼鐵生產(chǎn)工序成本分析模型

有關(guān)成本的變量可以歸納為原料變量、設(shè)備變量、工藝變量3類,其中原料變量包括鐵料品種變量、合金鐵品種變量和鋼包等各種輔材的變量;設(shè)備變量包括電極參數(shù)、冶煉爐次、廢鋼預(yù)熱;工藝變量包括供電操作、冷卻水流量、目標(biāo)出鋼溫度、吹氧操作等。輸出變量包括鋼水成本和冶煉時(shí)間。從鋼鐵冶煉工序系統(tǒng)各變量對成本的影響程度來看,電爐冶煉成本和LF(ladle furnace)精煉成本大概占總成本的70%左右,此外設(shè)備的運(yùn)轉(zhuǎn)率對鋼水成本固定費(fèi)用的降低起著重要的作用,因此,本文擬對班組成本、工序成本等進(jìn)行決策分析。

2 鋼鐵生產(chǎn)成本數(shù)據(jù)集市的建立

數(shù)據(jù)集市按照某一特定部門的決策支持需求組織起來,是針對一組主體的應(yīng)用系統(tǒng);而數(shù)據(jù)倉庫則是面向主體的、集成的、穩(wěn)定的、時(shí)間各異的數(shù)據(jù)集合。數(shù)據(jù)集市和數(shù)據(jù)倉庫相比,數(shù)據(jù)倉庫實(shí)施周期長、成本巨大、見效慢;而數(shù)據(jù)集市則是一種更小、更集中的數(shù)據(jù)倉庫,它為企業(yè)提供一條部門級的分析商業(yè)數(shù)據(jù)的廉價(jià)途徑。

在鋼鐵生產(chǎn)管理系統(tǒng)的基礎(chǔ)上,將數(shù)據(jù)挖掘和數(shù)據(jù)集市引入鋼鐵生產(chǎn)成本管理領(lǐng)域,從中獲得有效的成本決策模型,以進(jìn)一步提高鋼鐵生產(chǎn)成本的管理水平,整個(gè)系統(tǒng)如圖2所示。

圖2 鋼鐵生產(chǎn)車間成本數(shù)據(jù)挖掘模型

 2.1 數(shù)據(jù)模型

數(shù)據(jù)集市的邏輯建模是數(shù)據(jù)集市實(shí)施的重要環(huán)節(jié),因?yàn)樗苤苯臃磻?yīng)出業(yè)務(wù)部門的需求,同時(shí)對數(shù)據(jù)集市的物理實(shí)施有著重要的指導(dǎo)作用??梢杂脦追N方式來構(gòu)建數(shù)據(jù)倉庫或數(shù)據(jù)集市,例如采用實(shí)體關(guān)系模型、匯總表、多維數(shù)據(jù)庫、星型模式和雪花模式等模型。

鋼鐵車間生產(chǎn)成本數(shù)據(jù)集市模型采用星型關(guān)系模式,星型關(guān)系模式的關(guān)鍵是確定事實(shí)表和各數(shù)據(jù)維之間的聯(lián)系,并針對各個(gè)維做了大量的預(yù)處理,如按照維進(jìn)行預(yù)先的統(tǒng)計(jì)、分類、排序等。鋼鐵車間生產(chǎn)成本數(shù)據(jù)集市星型模型如圖3所示。系統(tǒng)通過物料跟蹤事實(shí)表將各數(shù)據(jù)維聯(lián)系起來,按爐號、班組、批次、工序獲得各工序的消耗信息,通過把每一爐鋼的實(shí)際成本和各工序成本分別與其相應(yīng)的標(biāo)準(zhǔn)成本相比較,就可以得到相關(guān)成本差異信息。

圖3 鋼鐵生產(chǎn)成本數(shù)據(jù)集市星型模式圖

2.2 數(shù)據(jù)集市的實(shí)現(xiàn)過程

無論是數(shù)據(jù)倉庫還是數(shù)據(jù)集市都是服務(wù)于數(shù)據(jù)挖掘和決策支持,因此從數(shù)據(jù)源抽取數(shù)據(jù)時(shí),一般都要經(jīng)過清理、轉(zhuǎn)換、集成等處理。在構(gòu)建鋼鐵車間數(shù)據(jù)集市的過程中,主要包括對數(shù)據(jù)源的數(shù)據(jù)進(jìn)行聚集、轉(zhuǎn)換、導(dǎo)入和最后裝人數(shù)據(jù)集市等幾個(gè)過程。

2.2.1 數(shù)據(jù)聚集

數(shù)據(jù)聚集簡單地說就是對原始數(shù)據(jù)進(jìn)行匯總。在聚集的過程中要考慮到數(shù)據(jù)集市的劃分粒度。粒度是指數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細(xì)程度和級別,數(shù)據(jù)越詳細(xì),粒度越小,級別越低;反之?dāng)?shù)據(jù)綜合度越高,粒度越大,級別就越高。粒度的劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量和所適合的查詢類型。數(shù)據(jù)倉庫的主要功能是面向決策支持,絕大部分查詢都是基于一定綜合程度之上,只有極少的查詢涉及到細(xì)節(jié)。

2.2.2 數(shù)據(jù)轉(zhuǎn)換

數(shù)據(jù)轉(zhuǎn)換是將數(shù)據(jù)轉(zhuǎn)換為適合于數(shù)據(jù)挖掘的形式。在數(shù)據(jù)集市中,對于實(shí)際成本和標(biāo)準(zhǔn)成本的比較結(jié)果,不是采用“盈”或“虧”來存儲,而是將它們分別轉(zhuǎn)換為“1”或“0",這樣就提高了數(shù)據(jù)集市的存儲和訪問性能,增強(qiáng)了數(shù)據(jù)挖掘的簡便性。

2.2.3 數(shù)據(jù)導(dǎo)入

數(shù)據(jù)導(dǎo)入過程就是將數(shù)據(jù)源中一些不需要轉(zhuǎn)換而又必不可少的信息直接拷貝到數(shù)據(jù)集市中。鋼鐵生產(chǎn)車間原操作數(shù)據(jù)庫存儲了一些靜態(tài)的數(shù)據(jù)信息,如物料消耗信息、班組信息、工序信息和標(biāo)準(zhǔn)信息等,這些數(shù)據(jù)可直接導(dǎo)入數(shù)據(jù)集市。

以上3個(gè)過程并不孤立,而是相互融合,對于靜態(tài)數(shù)據(jù)的導(dǎo)入,一般只在這些靜態(tài)信息更新時(shí)才重新導(dǎo)入,而對于聚集,分別在每月的最后一天進(jìn)行,同時(shí)對一些數(shù)據(jù)還需要進(jìn)行必要地轉(zhuǎn)換。

3 數(shù)據(jù)挖掘

數(shù)據(jù)挖掘的方法很多,目前比較常用的有關(guān)聯(lián)法、聚類法、相關(guān)性分析和偏差分析等。常用的技術(shù)有數(shù)理統(tǒng)計(jì)分析、神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)、智能代理、決策樹和遺傳算法等。

利用已建立的鋼鐵生產(chǎn)車間數(shù)據(jù)集市,本文主要采用決策樹數(shù)據(jù)挖掘技術(shù)對成本狀態(tài)的宏觀數(shù)據(jù)進(jìn)行分析。

3.1 決策樹算法

決策樹學(xué)習(xí)是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,它著眼于從一組無次序、無規(guī)則的事例中推理出決策樹表示形式的分類規(guī)則。決策樹學(xué)習(xí)采用自頂向下的遞歸方式,在決策樹的內(nèi)部節(jié)點(diǎn)進(jìn)行屬性值的比較,并根據(jù)不同的屬性值判斷從該節(jié)點(diǎn)向下的分枝,在決策樹的葉節(jié)點(diǎn)得到結(jié)論。所以從根到葉節(jié)點(diǎn)的一條路徑就對應(yīng)著一條合取規(guī)則,整棵決策樹對應(yīng)著一組析取表達(dá)式規(guī)則。由于決策樹用樹狀結(jié)構(gòu)來表示模型,容易理解,已成為常用的數(shù)據(jù)挖掘工具。目前決策樹常用的算法有Chi-squared automatic interaction detection(CHA-ID),Classification and regression trees(CART),ID3,C4. 5,AC2,CN2等。

在決策樹的各種算法中,最有影響的是Quinlan于1979年提出的以信息嫡的下降速度作為選取測試屬性的標(biāo)準(zhǔn)的ID3算法。該算法通過在樹的每一個(gè)節(jié)點(diǎn)上使用信息增益度量來選取測試屬性,選取具有最高信息增益的屬性作為當(dāng)前節(jié)點(diǎn)的測試屬性。該屬性使得對結(jié)果劃分中的樣本分類最小,并反映最小劃分中的隨機(jī)性和“不純性”。這種信息論方法使得對一個(gè)對象的分類所需的期望測試數(shù)目達(dá)到最小,并確保能夠找到一棵簡單的決策樹。

設(shè)S是s個(gè)樣本的集合,假定類標(biāo)號屬性具有m個(gè)不同的值,定義m個(gè)不同的類Ci(i=1,…,m),設(shè)si是類Ci中的樣本數(shù)。對一個(gè)給定的樣本分類所需的期望信息由下式給出:

式中,Pi為任意樣本屬于Ci的概率,并用si/s估計(jì)。這里的對數(shù)以2為底,因?yàn)樾畔⒂枚M(jìn)制編碼。

設(shè)屬性A具有v個(gè)不同的值{a1,a2,…,av}??梢杂脤傩訟將S劃分為v個(gè)子集{S1,S2,…,Sv},其中sj包含S中的這樣一些樣本,它們在A上具有值aj。如果A選作測試屬性,則這些子集對應(yīng)由包含集合S的節(jié)點(diǎn)生長出來的分枝。設(shè)sij是Sj子集中類Cj的樣本數(shù),根據(jù)A劃分成子集的熵或期望信息由下式給出:

項(xiàng)充當(dāng)?shù)趈個(gè)子集的權(quán),并且等于子集(即A值等于ai)的樣本個(gè)數(shù)除以S中的樣本總數(shù)。熵值越小,子集劃分的純度越高。對于給定的子集Sj,有。

式中,pij為Sj中的樣本屬于類Ci的概率,

,在A上分枝將獲得的編碼信息是Gain(A)=I(s1,s2,…,sm)-E(A)。

換言之,Gain(A)是已知屬性A的值而導(dǎo)致的熵的期望壓縮。

算法計(jì)算每個(gè)屬性的信息增益,具有最高信息增益的屬性作為集合S的測試屬性。創(chuàng)建一個(gè)節(jié)點(diǎn),并以該屬性標(biāo)記,對屬性的每個(gè)值創(chuàng)建分枝,并據(jù)此劃分樣本。

3.2 決策樹的應(yīng)用

本系統(tǒng)將以ID3算法對某鋼鐵企業(yè)生產(chǎn)成本數(shù)據(jù)集市進(jìn)行挖掘。

挖掘系統(tǒng)采用瀏覽器/服務(wù)器(Browser/Server,B/S)架構(gòu),數(shù)據(jù)庫管理系統(tǒng)對從其他數(shù)據(jù)源獲得的不同格式數(shù)據(jù)進(jìn)行篩選、清理、冗余檢查和格式轉(zhuǎn)換等數(shù)據(jù)預(yù)處理工作??蛻舳俗鳛槌绦蛑黝}部分,負(fù)責(zé)確定挖掘主體,即定義挖掘目標(biāo),設(shè)置因變量屬性,選擇ID3決策樹算法生成決策樹,提取規(guī)則,然后用測試數(shù)據(jù)進(jìn)行檢測,如規(guī)則合理即可輸出,否則循環(huán)此過程,直到生成滿意的決策樹為止。

某鋼鐵企業(yè)10號電爐(分為甲、乙、丙、丁4個(gè)班組)在2005年6月上半旬共生產(chǎn)滾珠鋼990爐,每爐鋼的成本主要包括電爐冶煉工序(0201)成本、LF精煉工序(0202)成本、鑄錠成本以及其他分配費(fèi)用。

運(yùn)用ID3算法,將班組以及工序作為分類屬性,將爐鋼成本差異作為挖掘目標(biāo)。

初始時(shí)刻根據(jù)每一爐鋼成本差異是否符合要求分為兩類:一類是有利差異(實(shí)際成本小于標(biāo)準(zhǔn)成本);另一類是不利差異(實(shí)際成本大于或等于標(biāo)準(zhǔn)成本)。

所以初始時(shí)刻的熵值為:

如果選取班組屬性作為測試屬性,則條件熵為0.55,計(jì)算公式如下:

如果選取工序1(電爐冶煉)為測試屬性,則條件熵為0.596,計(jì)算公式如下:

如果選取工序2(LF精煉)為測試屬性,則條件熵為0.61,計(jì)算公式如下:

可以看出H(X/BZ)最小,因此Gain(BZ)=0.734-0.55=0.184。班組屬性具有最高信息增益0.184 bit,即有關(guān)班組的信息對分類有最大的幫助,提供最大的信息量,所以選擇班組屬性對決策樹進(jìn)行劃分得到?jīng)Q策樹,如圖4所示。

圖4 鋼鐵生產(chǎn)成本決策樹

圖中Y表示實(shí)際成本滿足每爐鋼標(biāo)準(zhǔn)成本的要求(有利差異),N表示每爐鋼實(shí)際成本超出標(biāo)準(zhǔn)成本(不利差異),0201工序以及0202工序的有利差異和不利差異分別用F和U表示。通過決策樹可以看出,班組和工序兩個(gè)因素中,班組是影響每爐鋼實(shí)際成本超出標(biāo)準(zhǔn)成本的第1要素,而工序是第2要素。從電爐冶煉工序和LF冶煉工序?qū)γ繝t鋼的成本影響程度來看,電爐工序具有較大影響,在電爐冶煉工序出現(xiàn)成本有利差異時(shí),每爐鋼出現(xiàn)有利成本差異的概率較高,如班組甲電爐工序成本有利差異的概率為92.9%,則爐鋼有利差異的概率為82.1%, 而班組丙正好相反。當(dāng)這兩道工序成本具有相同差異時(shí),將對爐鋼成本差異具有決定性地影響,因此對這兩道工序消耗的控制是控制每爐鋼實(shí)際成本的重點(diǎn)。

現(xiàn)將決策樹的分類規(guī)則整理詳細(xì)敘述如下:

規(guī)則1  If工序1實(shí)際成本<標(biāo)準(zhǔn)成本AND工序2實(shí)際成本<標(biāo)準(zhǔn)成本Then爐鋼成本差異為Y。

規(guī)則2  If工序1實(shí)際成本>標(biāo)準(zhǔn)成本AND工序2實(shí)際成本>標(biāo)準(zhǔn)成本Then爐鋼成本差異為N。

規(guī)則3  If工序1實(shí)際成本<標(biāo)準(zhǔn)成本AND工序2實(shí)際成本>標(biāo)準(zhǔn)成本Then爐鋼成本差異為Y的概率較高。

規(guī)則4  If工序1實(shí)際成本>標(biāo)準(zhǔn)成本AND工序2實(shí)際成本<標(biāo)準(zhǔn)成本Then爐鋼成本差異為N的概率較高。

可以看出,加強(qiáng)班組成本管理意識以及工人操作水平是控制爐鋼實(shí)際成本的關(guān)鍵所在,此外還要加強(qiáng)對煉鋼關(guān)鍵工序消耗的分析和控制。

4 結(jié)束語

基于數(shù)據(jù)倉庫(數(shù)據(jù)集市)的挖掘是一個(gè)具有廣泛用途的領(lǐng)域,本文將其引入到鋼鐵生產(chǎn)車間成本管理領(lǐng)域是一個(gè)較新的嘗試,并取得了良好的效果,為數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在車間成本管理領(lǐng)域的應(yīng)用提供了寶貴的的經(jīng)驗(yàn)。(萬方數(shù)據(jù))

 

發(fā)布:2007-04-21 10:47    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
上海OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢

泛普上海OA軟件行業(yè)資訊其他應(yīng)用

上海OA軟件 上海OA新聞動態(tài) 上海OA信息化 上海OA快博 上海OA軟件行業(yè)資訊 上海軟件開發(fā)公司 上海門禁系統(tǒng) 上海物業(yè)管理軟件 上海倉庫管理軟件 上海餐飲管理軟件 上海網(wǎng)站建設(shè)公司