監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

門診收費(fèi)管理系統(tǒng)中以病人為中心的數(shù)據(jù)挖掘

申請免費(fèi)試用、咨詢電話:400-8352-114

前言
        我院自1997年開始運(yùn)行“軍衛(wèi)一號”系統(tǒng),并在此基礎(chǔ)上,先后應(yīng)用了LIS系統(tǒng)、PACS系統(tǒng)等數(shù)字化醫(yī)療系統(tǒng),累積了大量的臨床信息。目前,這些信息只是實(shí)現(xiàn)了病歷電子化,為病案管理和信息檢索帶來了方便,然而更深層次的關(guān)于臨床信息的數(shù)據(jù)挖掘工作卻很少進(jìn)行。一般而言,數(shù)據(jù)挖掘是在一個數(shù)據(jù)存儲倉庫中確定有用的模式或關(guān)系的過程,而且通常數(shù)據(jù)挖掘涉及分析大量的信息來發(fā)現(xiàn)隱藏在數(shù)據(jù)中的趨勢。數(shù)據(jù)挖掘的概念已經(jīng)廣泛運(yùn)用于商業(yè)和金融機(jī)構(gòu),比如商業(yè)智能的概念中就包含了挖掘商業(yè)數(shù)據(jù)轉(zhuǎn)化為商業(yè)知識的過程。但是數(shù)據(jù)挖掘本身是沒有行業(yè)限制的,當(dāng)對大量的臨床信息運(yùn)用數(shù)據(jù)挖掘的概念和方法時,同樣能為我們臨床診斷、科研、教學(xué)等提供很多有用信息,并且結(jié)合我們醫(yī)療領(lǐng)域內(nèi)的知識庫,甚至能預(yù)測疾病的發(fā)展趨勢。
1 病人數(shù)據(jù)挖掘的數(shù)據(jù)源
     通常,我們將數(shù)據(jù)劃分為結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指存儲在數(shù)據(jù)庫里的行數(shù)據(jù),可以用二維表的結(jié)構(gòu)來邏輯表達(dá)實(shí)現(xiàn)的數(shù)據(jù)。相對于結(jié)構(gòu)化數(shù)據(jù),不方便用數(shù)據(jù)庫二維邏輯來表現(xiàn)的數(shù)據(jù)即為非結(jié)構(gòu)化數(shù)據(jù),包括所有格式的辦公文檔、文本、圖標(biāo)、各類報(bào)表、圖像和音頻,視頻等信息。
    醫(yī)院的病人記錄信息一般既包含結(jié)構(gòu)化的數(shù)據(jù),又包含非結(jié)構(gòu)化的數(shù)據(jù),在以“軍衛(wèi)一號”系統(tǒng)為基礎(chǔ)的醫(yī)院信息系統(tǒng)(HIS系統(tǒng))中,所有的病人的基本信息、病史、就診過程等都以結(jié)構(gòu)化數(shù)據(jù)的信息存儲在數(shù)據(jù)庫中,同時門診和住院的費(fèi)用和帳務(wù)信息等也會以結(jié)構(gòu)化數(shù)據(jù)記錄在數(shù)據(jù)庫中。此外醫(yī)學(xué)影像歸檔與通訊系統(tǒng)(PACS)、檢驗(yàn)信息系統(tǒng)(LIS)、臨床診療系統(tǒng)(CIS)、電子病歷系統(tǒng)(EMR)等各種數(shù)字化醫(yī)療系統(tǒng)也都不同程度實(shí)現(xiàn)了病人信息的結(jié)構(gòu)化存儲。但是不少醫(yī)院雖然建成了醫(yī)院信息系統(tǒng),但系統(tǒng)的應(yīng)用程度不高,基本還是局限在門診和住院收費(fèi)水平,這樣申請單、手術(shù)過程等還是只能以紙質(zhì)的形式及非結(jié)構(gòu)化數(shù)據(jù)的形式保存和傳遞。因此本文探討的病人數(shù)據(jù)挖掘系統(tǒng)可能包含多個數(shù)據(jù)源:有結(jié)構(gòu)化的數(shù)據(jù)源,比如HIS數(shù)據(jù)庫、PACS數(shù)據(jù)庫等;也有非結(jié)構(gòu)化的數(shù)據(jù)源,比如申請單、化驗(yàn)單、心電圖、DICOM(醫(yī)學(xué)數(shù)字成像和通訊)格式的圖像信息等。通常,醫(yī)院的HIS、PACS、LIS等系統(tǒng)并非一個廠家開發(fā)的,加之目前周內(nèi)還沒有統(tǒng)一的數(shù)字化規(guī)范可循,因此許多開發(fā)商為了追求最大利潤,往往自己設(shè)定數(shù)據(jù)規(guī)范和開發(fā)標(biāo)準(zhǔn),這樣使得醫(yī)院內(nèi)部的各信息系統(tǒng)軟件之間數(shù)據(jù)平臺不統(tǒng)一,數(shù)據(jù)結(jié)構(gòu)各異。醫(yī)院內(nèi)部的信息系統(tǒng)尚且如此,各醫(yī)院之間的信息系統(tǒng)的差異性就更大。
     各類數(shù)據(jù)源的數(shù)據(jù)結(jié)構(gòu)的差異性(包括非結(jié)構(gòu)數(shù)據(jù)之間的差異性及結(jié)構(gòu)化數(shù)據(jù)的差異性)是導(dǎo)致病人數(shù)據(jù)挖掘難以進(jìn)行的重要原因,因此病人數(shù)據(jù)挖掘的首要任務(wù)是定義統(tǒng)一的結(jié)構(gòu)化臨床信息,并且針對不同數(shù)據(jù)源的特點(diǎn)開發(fā)相應(yīng)的數(shù)據(jù)挖掘器。一個數(shù)據(jù)挖掘器被配置為使用領(lǐng)域?qū)S脴?biāo)準(zhǔn)來挖掘數(shù)據(jù)源,以創(chuàng)建結(jié)構(gòu)化的臨床信息。正如前面所講,病人數(shù)據(jù)挖掘系統(tǒng)需要將各類數(shù)據(jù)源轉(zhuǎn)換為統(tǒng)一的結(jié)構(gòu)化臨床信息,因此對于非結(jié)構(gòu)數(shù)據(jù)需要設(shè)置相應(yīng)的挖掘器負(fù)責(zé)將非結(jié)構(gòu)的數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的結(jié)構(gòu)化臨床信息。通過定義統(tǒng)一的結(jié)構(gòu)化的臨床信息,解決了各數(shù)據(jù)源之間數(shù)據(jù)結(jié)構(gòu)的差異性。下一步就可以定義數(shù)據(jù)挖掘的方法,即結(jié)合專用知識庫挖掘有用信息了。

2 以病人為中心的數(shù)據(jù)挖掘
    以病人為中心的數(shù)據(jù)挖掘是指從與病人相關(guān)的數(shù)據(jù)源中提取信息,并且使用領(lǐng)域?qū)S脴?biāo)準(zhǔn)來推理病人狀態(tài)的過程。與病人相關(guān)的數(shù)據(jù)源通常包括多個數(shù)據(jù)源,每個數(shù)據(jù)源反映了病人關(guān)心的不同方面。一般與病人相關(guān)的數(shù)據(jù)源可以包括醫(yī)療信息、財(cái)務(wù)信息和人口統(tǒng)計(jì)信息中的一個或多個。醫(yī)療信息可以包括自由文本信息、醫(yī)學(xué)影像信息、檢驗(yàn)信息、處方藥信息和波形圖像等信息中的一個或多個。用于挖掘病人數(shù)據(jù)源的領(lǐng)域?qū)S玫闹R可以包括機(jī)構(gòu)專用領(lǐng)域知識,例如,特定醫(yī)院可用的數(shù)據(jù)、門診收費(fèi)管理軟件定義的數(shù)據(jù)存儲結(jié)構(gòu)、醫(yī)院的政策、方針,以及醫(yī)院的任何變化有關(guān)的信息等。此外領(lǐng)域?qū)S玫闹R還可以包括疾病專用的領(lǐng)域知識庫,例如,疾病專用的領(lǐng)域知識可以包括影響疾病危險(xiǎn)的各種因素、疾病的進(jìn)展情況、并發(fā)癥信息、與疾病有關(guān)的措施、與疾病有關(guān)的結(jié)果和變量、以及由醫(yī)療結(jié)構(gòu)建立的方針和政策等。

     以病人為中心的數(shù)據(jù)挖掘主要包括個階段,分別是提取、組合、推理。用于病人數(shù)據(jù)挖掘的挖掘器需要包含個提取部件。該提取部件從病人的所有檢查信息中獲取關(guān)鍵信息以產(chǎn)生與病人相關(guān)的概率斷言,即患有某種疾病的概率斷言。一般而言,對于結(jié)構(gòu)化的數(shù)據(jù)我們會使用結(jié)構(gòu)化查詢語言(SQL)從病人相關(guān)的數(shù)據(jù)庫記錄中檢索關(guān)鍵詞,比如從影像科的PACS數(shù)據(jù)庫中檢索病人的影像學(xué)報(bào)告中的診斷結(jié)論可以獲知病人的影像學(xué)診斷。此外,目前商業(yè)的數(shù)據(jù)庫服務(wù)器軟件中還提供了全文檢索功能,使用全文檢索功能可以從大量的文本信息中檢索更加準(zhǔn)確、全面的信息。從圖像、波形等數(shù)據(jù)格式進(jìn)行的提取可以南提供給系統(tǒng)的圖像處理或特征提取程序來完成。需要注意的是,臨床信息的收集過程中可能會由于各種原因?qū)е掠行┬畔z漏、錯誤和不一致的數(shù)據(jù),因此需要在概率斷言時加以考慮。通過提取與病人相關(guān)的所有信息,我們得到了病人在各個時問點(diǎn)(或時間段)的病歷信息,即形成一個時間序列,然后通過對各個時間點(diǎn)(或時間段)得到的概率斷言,我們即可得到一個狀態(tài)序列及治療期間在不同時間點(diǎn)(或時間段)的病人狀態(tài)的值。同時在同一個時間點(diǎn)上可能會從相同(或不同)的數(shù)據(jù)源中得到可能沖突的斷言,處理這些沖突的斷言形成統(tǒng)一的視圖的過程,即組合階段完成的丁作,這些工作通常需要借助相關(guān)的領(lǐng)域?qū)I(yè)知識完成。推理是通過與病人有關(guān)的所有可用的仿真陳述并通過疾病的狀態(tài)、實(shí)驗(yàn)室化驗(yàn)、治療協(xié)議等產(chǎn)生病人進(jìn)展的復(fù)合視圖的過程。基本上,病人當(dāng)前的狀態(tài)可能受到先前的狀態(tài)和任意新的組合觀察的影響。
     對病人狀態(tài)序列進(jìn)行推理正是以病人為中心的數(shù)據(jù)挖掘的意義所在。正如前面所說,病人當(dāng)前狀態(tài)往往會受到先前狀態(tài)的影響,因此通過以病人為中心的數(shù)據(jù)挖掘?qū)εR床診斷非常有意義。比如,通過分析狀態(tài)序列可以推斷病人之前病情是否出現(xiàn)了復(fù)發(fā),進(jìn)一步結(jié)合領(lǐng)域?qū)I(yè)知識,可以推斷將來病情發(fā)展的趨勢。
3 針對科研統(tǒng)計(jì)的病人數(shù)據(jù)挖掘
      對于醫(yī)院積累的大量臨床信息,我們通常只是檢索某位特定病人相關(guān)的信息,或者一些簡單的數(shù)量統(tǒng)計(jì),而蘊(yùn)藏在這些大量信息當(dāng)中人們事先不知道、但是又潛在有用的知識往往被忽略。究其原因,其一,面對這些海量信息,普通的檢索方式效率低下,甚至經(jīng)常出現(xiàn)檢索超時出錯等;其二,常規(guī)的統(tǒng)計(jì)查詢往往得到的是一些簡單的類似于數(shù)量總和的統(tǒng)計(jì)結(jié)果,不能很好地反映數(shù)據(jù)分布等特點(diǎn),因此對于科研統(tǒng)計(jì)意義不大。本文將提出一種基于聯(lián)機(jī)分析處理(OLAP)技術(shù)的海量病人數(shù)據(jù)挖掘方法,使用這種方法可以快速高效地獲取檢索的結(jié)果,并且以一種新的多維度、可變換的方式來分析我們檢索的結(jié)果。在介紹海量病人數(shù)據(jù)挖掘方法之前,我們先舉一個簡單的例子:假如在我院現(xiàn)有HIS系統(tǒng)的基礎(chǔ)上,要得到關(guān)于某類疾病發(fā)病率的以下統(tǒng)計(jì)結(jié)果:
(1)每年該疾病的發(fā)病率;
(2)每季度該疾病的發(fā)病率;
(3)該疾病患者的地域分布;
(4)該疾病患者當(dāng)中,男女比例各占多少;
(5)該疾病患者當(dāng)中,各年齡層當(dāng)中患病的比例是多少;
(6)該疾病患者當(dāng)中,各年齡層患者的男女比例是多少。
     設(shè)想一下,如果我們使用常規(guī)的檢索方式去統(tǒng)計(jì)這些結(jié)果,往往都需要做好幾次查詢統(tǒng)計(jì),而且目前一般的軟件都很難提供這種伸縮性很強(qiáng)的統(tǒng)計(jì)查詢工具或人機(jī)交互界面。即使是專業(yè)的數(shù)據(jù)庫管理員(DBA)也需要非常復(fù)雜的查詢函數(shù)才能得到這些統(tǒng)計(jì)結(jié)果,而且對于海量數(shù)據(jù)信息時,往往這些查詢函數(shù)效率極其低下。使用基于聯(lián)機(jī)分析處理(OLAP)技術(shù)的海量病人數(shù)據(jù)挖掘方法,可以很好地滿足諸如此類的科研統(tǒng)計(jì)需求。聯(lián)機(jī)分析處理(OLAP)能夠使分析人員快速獲取多維度檢索結(jié)果,而且對檢索結(jié)果可以從不同的維度或者不同的維度組合進(jìn)行觀察和分析,從而獲得對數(shù)據(jù)更深入的了解?;诼?lián)機(jī)分析處理(OLAP)技術(shù)的海量病人數(shù)據(jù)挖掘方法是結(jié)合病人數(shù)據(jù)的特點(diǎn)及常見的科研統(tǒng)計(jì)需求,定義科研統(tǒng)計(jì)所需要的維度,將海量的病人數(shù)據(jù)構(gòu)建為病人數(shù)據(jù)挖掘倉庫,從而實(shí)現(xiàn)高效的科研統(tǒng)計(jì)分析服務(wù)。
     病人數(shù)據(jù)挖掘倉庫主要包含病人的就診信息表和多個統(tǒng)計(jì)量分布表。病人就診信息表包含了所有病人的就診信息,比如病人姓名、性別、年齡、家庭住址、就診日期、檢查科室、診斷結(jié)論等等。我們稱病人就診信息表為事實(shí)表(Fact Table o每一個統(tǒng)計(jì)量, 比如性別、年齡、就診日期等,我們稱之為維度(Dimension),一個或多個相關(guān)
聯(lián)的維度構(gòu)成一個維度表,維度表中定義了所有可能的維度(或多個維度組合)的值,比如,性別維度表中包含了兩個值:男和女。通常,我們需要按照科研統(tǒng)計(jì)的需要構(gòu)建特定的維度。比如,在前面提到的關(guān)于某類疾病發(fā)病率的以下統(tǒng)計(jì)任務(wù)中,我們將需要定義以下維度(表1):

      基于聯(lián)機(jī)分析處理(OLAP)技術(shù)的海量病人數(shù)據(jù)挖掘首先根據(jù)事實(shí)表和定義的維度表,計(jì)算各種維度組合情況下的統(tǒng)計(jì)值,我們稱為度量表(Measure o這些度量值是通過對事實(shí)表中的記錄做聚集計(jì)算(Aggregation)而得來的,一般都是通過做累計(jì)記數(shù)(COUNT),當(dāng)然有時候也會使用求和fSUM),比如關(guān)于費(fèi)用、劑量等信息的相關(guān)統(tǒng)計(jì)。生成這些度量信息之后,使用聯(lián)機(jī)分析處理(OLAP)定義的多維度分析操作方法鉆取(roll up和drill down),切片(slice)、切塊(dice)、旋轉(zhuǎn)(pivot)等,完成對數(shù)據(jù)的分析、查詢和報(bào)表。常用的多維度分析方法是鉆取(roll up和drill down),比如我們知道了某個疾病在各個年齡層中的發(fā)病率,那么通過drill down操作添加一個性別維度,即可得到該疾病發(fā)在各年齡層中男、女發(fā)病率的比例。

     海量病人數(shù)據(jù)挖掘的難度在于維度的定義,維度的定義直接影響度量表計(jì)算過程以及我們分析問題的角度。通常需要分析科研統(tǒng)計(jì)的需求,定義切合統(tǒng)計(jì)需求的維度。目前主流的商業(yè)數(shù)據(jù)庫中已經(jīng)提供了多維度數(shù)據(jù)挖掘的工具, 比如SQL Server 2005的Analysis Service,即提供了構(gòu)建數(shù)據(jù)倉庫和執(zhí)行多維度數(shù)據(jù)分析的功能。但是,正如前面所說的我們,需要結(jié)合病人信息的特點(diǎn)和科研統(tǒng)計(jì)的需求,定義我們需要的維度,從而構(gòu)建合理的病人數(shù)據(jù)挖掘倉庫。
4 結(jié)束語
    隨著醫(yī)療改革的穩(wěn)步推進(jìn)和數(shù)字化醫(yī)療的發(fā)展,醫(yī)院的數(shù)據(jù)量會不斷增加,醫(yī)院的信息化建設(shè)會不斷成熟,更多醫(yī)療信息將會產(chǎn)生,既有來自醫(yī)院內(nèi)部信息,也有更多來自其他醫(yī)療機(jī)構(gòu)共享的信息。挖掘這些急劇增長的大量信息,不僅有利于個體病人的臨床診斷,也有利于對大局的把握和認(rèn)知,從而為我們的臨床研究、疾病預(yù)防和相關(guān)決策提供重要的依據(jù)。希望我們在建設(shè)數(shù)字化醫(yī)院的同時,不僅重視收集存儲各類臨床信息,也要重視對已有信息的分析和再認(rèn)識,通過數(shù)據(jù)挖掘發(fā)現(xiàn)其趨勢、規(guī)律和異常,為醫(yī)院建設(shè)及科研服務(wù)。

發(fā)布:2007-04-09 11:21    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:

泛普門診收費(fèi)管理系統(tǒng)其他應(yīng)用

醫(yī)院行業(yè)管理系統(tǒng) 醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件 病案管理系統(tǒng) 藥店管理系統(tǒng) 醫(yī)院his系統(tǒng) 醫(yī)院預(yù)約軟件 住院收費(fèi)管理系統(tǒng) 區(qū)域醫(yī)療衛(wèi)生信息化平臺 社區(qū)醫(yī)療管理系統(tǒng) 門診收費(fèi)管理系統(tǒng) 醫(yī)療衛(wèi)生軟件 新農(nóng)合軟件 醫(yī)院管理系統(tǒng)免費(fèi)版 免費(fèi)醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件免費(fèi)版 免費(fèi)藥店管理系統(tǒng) 醫(yī)院管理系統(tǒng)下載 醫(yī)院信息管理系統(tǒng)下載 醫(yī)藥管理軟件下載 病案管理系統(tǒng)下載 藥店管理系統(tǒng)下載 醫(yī)院his系統(tǒng)下載 醫(yī)療一體化管理系統(tǒng)下載 新農(nóng)合軟件下載 藥品管理系統(tǒng)下載