監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設計管理系統(tǒng) | 甲方項目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

淺析數(shù)據(jù)挖掘技術(shù)在電子病歷中的應用

申請免費試用、咨詢電話:400-8352-114

       在建設數(shù)字醫(yī)療的基礎(chǔ)之上,電子病歷應運而生,其短暫的歷史和迅速的崛起形成鮮明對比,在社會信息建設進程中擔當了重要角色,并回應了強烈的社會醫(yī)療訴求,將醫(yī)療服務的手段和模式推向縱深。在這一短暫的本土化發(fā)展進程中,電子病歷由簡單文字紀錄載體,迅速進化為多樣式的健康信息體系,其集成能力日益強大,其交換整合能力使醫(yī)療信息流通得到加強。在當前醫(yī)療信息化需求的驅(qū)動之下,電子病歷完成了系統(tǒng)搭建,使信息化滲透到臨床工作中。
       反觀電子病歷的技術(shù)發(fā)展史,立足于眼前需求的功能實現(xiàn)已經(jīng)完成:最早進行電子病歷實踐的地區(qū)和單位,都已擁有固定的運作經(jīng)驗,基于電子病歷的診療新流程得到確立。進一步地,如何挖掘長遠價值、發(fā)揮長期效益,成為電子病歷發(fā)展的下一個主題。筆者認為,數(shù)字化醫(yī)療建設的真正意義,在于如何利用好這些長期積累的數(shù)據(jù)。對數(shù)據(jù)資源的開發(fā)利用,將使電子病歷的意義得到淋漓盡致的展現(xiàn),使其可交換性、可用性得到充分發(fā)揮。由此,電子病歷后續(xù)發(fā)展的主題,明確指向“如何進行數(shù)據(jù)挖掘”。
1 廣義數(shù)據(jù)挖掘
1.1 數(shù)據(jù)挖掘的含義
      數(shù)據(jù)挖掘是揭示存在于數(shù)據(jù)里的模式及數(shù)據(jù)問的關(guān)系的學科,它強調(diào)對大量觀測到的數(shù)據(jù)的處理。數(shù)據(jù)挖掘能夠從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)集中識別有效的、新穎的、潛在有用的、最終可理解的模式。它是一門涉及面很廣的交叉學科,涉及機器學習、模式識別、統(tǒng)計學、智能數(shù)據(jù)庫、知識獲取、數(shù)據(jù)可視化、高性能計算、專家系統(tǒng)等學科。數(shù)據(jù)挖掘的成果可以用在信息管理、過程控制、科學研究、決策支持等許多方面。
1.2 數(shù)據(jù)挖掘的產(chǎn)生與發(fā)展
       數(shù)據(jù)挖掘最初脫胎于統(tǒng)計學,通過計算機,對大量復雜的數(shù)據(jù)集自動進行探索性分析。盡管數(shù)據(jù)挖掘和統(tǒng)計分析之間有明顯的聯(lián)系,迄今為止大部分的數(shù)據(jù)挖掘方法并不產(chǎn)生于統(tǒng)計學科。正因為數(shù)據(jù)挖掘工作對商業(yè)、工業(yè)及科學研究具有極大的影響,在有需求的領(lǐng)域里,關(guān)于數(shù)據(jù)挖掘的研究總有可觀的成績。
1.3 被挖掘數(shù)據(jù)源的形式
       被挖掘的數(shù)據(jù)源有多種形式,目前可歸納的主要有:關(guān)系數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、空間數(shù)據(jù)庫、時態(tài)數(shù)據(jù)庫、文本數(shù)據(jù)源、多媒體數(shù)據(jù)庫、異質(zhì)數(shù)據(jù)庫、遺產(chǎn)(1egacy)數(shù)據(jù)庫,以及Web數(shù)據(jù)源。簡言之,大量數(shù)據(jù)庫技術(shù)的發(fā)展,令數(shù)據(jù)存量大量增加,“數(shù)據(jù)爆炸但知識貧乏”,由此催生了數(shù)據(jù)挖掘技術(shù),以獲得海量數(shù)據(jù)背后隱藏著的知識。
2 特殊語境下的數(shù)據(jù)挖掘
       數(shù)據(jù)挖掘總是在某一特定知識領(lǐng)域內(nèi)進行,具有普遍適用性的數(shù)據(jù)挖掘技術(shù)尚未出現(xiàn)。這由數(shù)據(jù)挖掘本身的難點決定。首先,巨量數(shù)據(jù)集的性質(zhì)非常復雜,非線性、時序性與噪音普遍存在;其次,數(shù)據(jù)分析的目標具有多樣性,而復雜目標無論在表述還是在處理上均與領(lǐng)域知識有關(guān);第三,在復雜目標下,對巨量數(shù)據(jù)集的分析,目前還沒有現(xiàn)成的且滿足可計算條件的一般性理論與方法。在實際應用中,特定知識領(lǐng)域的確認,有效回避了數(shù)據(jù)挖掘的瓶頸問題。電子病歷的應用就是這樣一個明證。作為特殊法律文書,病歷本身是嚴肅而確定的:知識領(lǐng)域的專注使數(shù)據(jù)噪音大量削減,使數(shù)據(jù)源形式簡化,使分析目標明確,使語義指代明顯,語義強度能夠有序排列。另一方面,病歷固有的格式要求和行文習慣,很好地解決了非線性問題和時序性問題。
      在特定知識庫、特殊語言環(huán)境下,廣義數(shù)據(jù)挖掘的難點被一一回避。因此,盡管廣義數(shù)據(jù)挖掘還有很長的道路,還有諸多的分歧,但在電子病歷中,專注于臨床知識的數(shù)據(jù)挖掘應用是合理可行的,是符合現(xiàn)實的。
3 基于結(jié)構(gòu)化采集的數(shù)據(jù)挖掘
3.1 預結(jié)構(gòu)化
      預結(jié)構(gòu)化電子病歷是繼“WORD電子病歷”之后的一大飛躍。最初,一些醫(yī)院采用WORD存儲電子病歷,將病歷文本予以電子存儲,除去存儲和書寫方式的變化,病歷本身沒有發(fā)生任何變化。其功能展開、數(shù)據(jù)交換、數(shù)據(jù)挖掘完全無法進行。隨著社會信息建設要求的提高,數(shù)據(jù)應用的意義得到重視。以WORD存儲電子病歷,無法對病歷數(shù)據(jù)進行開采和利用,只是數(shù)據(jù)垃圾的堆積。于是,電子病歷結(jié)構(gòu)化的理念在業(yè)界達成了高度一致。基于當時的技術(shù)水平,開發(fā)了“預結(jié)構(gòu)化”模式:在病歷中,按照醫(yī)學專業(yè)要求,將知識點提煉,并逐一羅列,使用醫(yī)學規(guī)范用語和診斷專業(yè)術(shù)語書寫。所生成的電子病歷,能夠被識別,從而實現(xiàn)病歷的檢索、分析和質(zhì)量控制,能夠為專家系統(tǒng)所理解,從而為教學科研提供依據(jù)。預結(jié)構(gòu)化模式的典型特征是病歷模板的應用。病歷模板的原型是紙質(zhì)病歷中的表格病歷。借鑒表格病歷的邏輯,病歷模板提煉出了病歷記錄的必須項目,必須內(nèi)容, 以及必須形式。在固定的形式下,將項目和內(nèi)容盡數(shù)羅列,提供單選、多選的錄人形式。
       由于知識庫的支持,電子病歷模板相對靈活方便。根據(jù)前文選擇錄入的內(nèi)容,內(nèi)部邏輯自動進行選擇性地顯示,過濾無關(guān)項目。其次,病案首頁、檢驗報告等文書的格式固定,內(nèi)容明確,預結(jié)構(gòu)化的模板完全能夠使之功能得到最大發(fā)揮。最后,病歷模板分離了存儲,實現(xiàn)了“動態(tài)模板”,以方便臨床工作者重復不斷地修改和完善模板,盡管如此,在實際使用中,預結(jié)構(gòu)化的模板帶有決定性的缺失。模板本身是對自然語言的解構(gòu),借助于醫(yī)學的確定范疇和固定形式,這一過程確實能夠圓滿實現(xiàn)。但它同時也肢解了自然語言的流暢性和靈活性。當醫(yī)生需要以獨立完整的語言進行描述時,他們便拋棄了病歷模板。繞過病歷模板的錄入方式,使預結(jié)構(gòu)化喪失了用武之地。
3.2 后結(jié)構(gòu)化
       實踐表明,自由文本和預結(jié)構(gòu)化病歷的使用,難以滿足臨床科研數(shù)據(jù)管理與統(tǒng)計的要求,而嚴格的表格化病歷限制了臨床描述能力,為了準確表述臨床行為,甚至需要另外撰寫手工病歷,遭到臨床醫(yī)生的反對。
       為了兼顧臨床和科研,后結(jié)構(gòu)化應運而生。后結(jié)構(gòu)化的語義分析模型,最終是將語義元素的固有關(guān)系進行遍歷,結(jié)合語義強度等因素,對自然語言進行處理?;谶@一模型,得以對純文本的病歷內(nèi)容進行結(jié)構(gòu)化采集。在首頁、醫(yī)囑、各類檢查化驗報告、病程記錄、護理記錄等良好的結(jié)構(gòu)化文書之外,病歷的主觀描述部分也實現(xiàn)了完全結(jié)構(gòu)化。解析自然語言的過程稱為“后結(jié)構(gòu)化”。與預結(jié)構(gòu)化不同,后結(jié)構(gòu)化并沒有設定采集范式,沒有設定數(shù)據(jù)的抓取結(jié)構(gòu),因而并不要求細致的填充。后結(jié)構(gòu)化技術(shù)維護了病歷描述的自然語境。后結(jié)構(gòu)化有兩大關(guān)鍵難點。首先是機器學習還相當幼稚。在預結(jié)構(gòu)化中,由于抓取和采集的框架已經(jīng)確定,解析和計算的邏輯相對固定,因而基本不需涉及機器學習。但在后結(jié)構(gòu)化模式中,各種挖掘模式都有應用(如回歸模式、聚類模式、關(guān)聯(lián)模式、序列模式等), 因而其規(guī)則抽取也更為復雜。作為一種機器學習方法,神經(jīng)網(wǎng)絡規(guī)則抽取的重要指標:泛化精度、保真度、可理解性,目前仍處于較低水平。其次,漢語言不同于依附語范疇的語言(諸如英語),其轉(zhuǎn)格及形式缺乏顯著標志,給結(jié)構(gòu)化處理帶來了難度。此外,漢語言的詞性詞義只在特定語境中才能確定,同一詞語可支持多種表義,多種詞性,有很大的機會令算法進入死循環(huán)。因此,關(guān)于漢語言的結(jié)構(gòu)化研究進度遲緩。綜上所述,數(shù)據(jù)挖掘是電子病歷發(fā)展到相當程度的必然要求。而在電子病歷的應用中,實現(xiàn)數(shù)據(jù)挖掘的關(guān)鍵,即結(jié)構(gòu)化采集。盡管存在著大量難點,但在強大的需求面前,結(jié)構(gòu)化研究擁有良好的發(fā)展環(huán)境,必然能獲得長遠的發(fā)展。
參考文獻
1 俞文敏.電子病歷應用中存在的問題及解決方案探討[J].東南國防醫(yī)藥,2006,8(1):66—67.
2 劉靜,沈蓓,黃學寧,等.電子病歷中結(jié)構(gòu)化描述內(nèi)容與專科病歷模板[J].現(xiàn)代醫(yī)學,2005,33(6):4]7—419.

發(fā)布:2007-04-09 11:19    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:

泛普門診收費管理系統(tǒng)其他應用

醫(yī)院行業(yè)管理系統(tǒng) 醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件 病案管理系統(tǒng) 藥店管理系統(tǒng) 醫(yī)院his系統(tǒng) 醫(yī)院預約軟件 住院收費管理系統(tǒng) 區(qū)域醫(yī)療衛(wèi)生信息化平臺 社區(qū)醫(yī)療管理系統(tǒng) 門診收費管理系統(tǒng) 醫(yī)療衛(wèi)生軟件 新農(nóng)合軟件 醫(yī)院管理系統(tǒng)免費版 免費醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件免費版 免費藥店管理系統(tǒng) 醫(yī)院管理系統(tǒng)下載 醫(yī)院信息管理系統(tǒng)下載 醫(yī)藥管理軟件下載 病案管理系統(tǒng)下載 藥店管理系統(tǒng)下載 醫(yī)院his系統(tǒng)下載 醫(yī)療一體化管理系統(tǒng)下載 新農(nóng)合軟件下載 藥品管理系統(tǒng)下載