簡介
醫學統計學是運用數理統計和機率論的原理,結合醫院實際針對醫學數據資料進行收集、整理、分析和推斷的學科,是醫院科研與實踐的重要工具,貫穿於以現代科學試驗方法為基礎的醫學研究隨著計算機技術在社會生活各個領域的廣泛應的整個過程之中。
醫院數據處理即統計信息的加工,是指將業務系統產生的原始數據按照統計主題,按不同的維和定義好的粒度進行統計運算得到信息;處理部分按照一定的統計方法對原始數據完成統計信息的生成和存儲。
通常採用兩種處理方式:
(1)單一數據的求和運算:將單一的原始數據累加起來得到統計信息,大粒度的統計信息就可以通過其包含的小粒度的統計信息中數據累加得到。如月出院人數可以通過日出院人數得到。通過這種運算得到的統計信息在不考慮查詢速度時只保存小粒度的統計信息。
(2)多項數據運算:這種運算用到2項或2項以上的數據,如醫療效率中的平均住院日(平均住院日=住院總天數/出院人數)用到了出院人數和住院總天數兩項數據。這種運算得到的大粒度信息和小粒度信息沒有函式關係,也就是從小粒度信息推算不出大粒度的信息。因此在保存時要分別保存。
系統目標
在醫院業務信息系統的基礎上建立比較完善的統計分析系統,為院長決策提供科學依據。
(一)建立全面反映醫院運行狀況的統計報表體系:該體系要建立起常規的、固定的、自動化的統計系統,在日常業務系統產生的數據的基礎上,統計生成各種管理指標信息,滿足日常的統計工作需要。
(二)建立為特定管理目的進行專題數據分析的支持系統:在醫院日常工作中,經常會圍繞著管理的特定需要,提出一些數據統計分析要求。這些要求不能直接從常規的統計報表得到,而需要進行專門的統計分析。
系統特徵
信息的多層次
按照深度,可以將醫院對統計信息的需求分為如下幾個層次。
1.動態的原始數據 :如危重患者情況、新人院患者等,直接取自於業務過程中的原始數據,無需特殊的統計處理,管理層通過它了解最關心的醫院動態情況。
2.日常的統計報表:是統計分析系統的重點。人們通過統計報表了解當前醫院運行的總體狀況,與歷史情況進行對比,預測未來發展趨勢。從時間上,統計報表可以分為日報、周報、月報等;從內容上,統計報表一般包括醫療數質量統計、收入統計、成本統計等能概括醫院運行情況的主要方面。統計報表具有相對的固定性,具有固定的統計項目、固定的數據來源和統計方法、固定的格式,便於管理者掌握其內容和與歷史數據進行比較。報表應主題明確,每張報表圍繞一個主題展開,報表中的各項統計指標準確翔實。
3.數據分析:是圍繞特定的主題,深層次利用數據,具有較大的隨機性,其信息很難以常規的報表形式固定下來,一般只能反映一段時間內統計值的橫向變化。要想多側面反映統計值的變化或者反映數據之間的關係,就需要特定的數據分析。
我們套用數據倉庫技術。該技術是一種用於分析的資料庫,是將原始的運算元據進行各種處理並轉換成綜合信息,用在線上分析工具對這些信息進行多方位的分析。用戶利用數據倉庫和在線上分析處理技術可以實現對數據多維分析、向下探察分析和變化趨勢分析等;掌握各個層次的數據並和前期或同期的數據作對比;分析數據的變化趨勢,發現問題,分析產生的原因;輔助決策是對數據更高層次的利用,它需要處理大量的數據來發現數據中隱藏的規律,預測數據的變化。輔助決策的實現不僅要利用數據倉庫和在線上分析處理技術,還要用到數據挖掘技術。例如,我們要提高門診發藥的速度,首先要查詢出用量最大的藥,把藥擺放在離發藥視窗近的地方。進一步我們可分析每一張門診處方,發現哪兩種藥或哪幾種藥出現在同一張處方中的機率大,就可將這幾種藥擺放在相鄰的地方方便藥師取藥。這種高級分析就要用數據挖掘技術。數據挖掘從資料庫中識別出有效的、新穎的、具有潛在效用的並最終可理解的信息。通過這些技術用戶可以得到預測性結果,為管理的決策提供科學依據。
信息的多維性
在醫院統計中,除了一些時候需要統計指標的全院匯總值外,很多情況下需要統計指標與某些統計的相關因素。如各科室的醫療效率指標、各種費別的醫療收入情況、醫療收入隨時間的變化等。這裡的相關因素或者影響統計信息的變數就是統計上的維。醫院統計關心的維很多,常見的有科室、患者費別、時間、費用分類等。大多數的醫院統計報表就是根據這些常見的維變數來展開的。以收入統計為例,收入統計信息中有很多相關的因素,如科室、時間和患者費別等,每個收入事實由特定的科室、特定的時間和特定的病人費別組成。我們可以根據需要,分別選擇科室、時間、費別統計與其收入的關係。統計報表是兩維結構。一般在橫向展示各種統計指標,在縱向展示統計變數。也就是說,一般的統計報表表現的是統計指標與一維變數之間的關係,這樣的報表容易閱讀理解。但也有些情況下,需要了解統計指標與多維變數之間的關係,如不同科室的不同費別患者的醫療收入情況。要表現這樣的關係,或者需要將費別展開到橫向維上,或者需要分別通過多張報表反映不同費別的情況。
用戶的多層性
統計信息的使用者包括院領導、各職能部門領導、科室主任和統計員等。統計信息一般可以分成院、部、科室個層次來分別滿足不同用戶的需要。統計人員要掌握各個層次的數據並要進行深入的數據分析工作,完成數據的深層次的利用。院級統計信息是全院各類數據的概括,數據量不大,但其中信息是可以簡明扼要地概括醫院的運行狀況。醫院領導在日常工作中主要關心院級的各種信息,如全院的醫療、收入和成本信息,在總體上掌握醫院的運行狀況。職能部級的統計信息,不僅包括部門工作狀況的概要信息,而且也包括其管轄單位的各項細目數據。各職能部門包括醫療、藥材和器械等部門。這些部門的領導和工作人員通過查詢職能部級的統計信息,直接掌握整個部門的工作狀況。科室統計信息反映科室工作狀況,主要包括本科室的醫療、收入和成本三個方面的信息。
因為科室統計信息只統計本科室的信息,就是說不包括科室維,這樣就可以用更多的其他維來統計數據,如患者費別和時間等。各科室領導查詢並了解科室一級信息中的本科室信息,可以在科室管理中做到心中有數;也可以查詢其他科室信息,並和本科室做對比,發現差距以改進和加強這方面工作。
歷史數據伺服器
統計報表只能表面地反映醫院的運行狀況。用戶經常有些特殊的查詢要求,如某一時間段內有哪些科室的患者有重複住院(出院當天又入院)等情況。要滿足用戶的這些特殊查詢,要深入發現數據背後的問題就要進行數據分析,建立數據分析環境,進行數據分析需要查詢大量的數據,如果直接在業務系統使用的資料庫中存儲大量歷史數據並進行數據分析操作,將占用大量的伺服器的磁碟資源和CPU資源,影響業務系統運行的效率。所以要做好數據處理分析工作就必須建立專用的歷史數據伺服器。
伺服器特點
①數據量巨大:一個1500張床位、日門診4000人次的醫院,信息系統產生的數據用0racle存儲每年增長達5G左右。
②用戶少:進行數據分析的用戶主要是統計分析人員,一般情況下只有一兩個在線上用戶,在高峰時可達幾百個。
③速度要求相對較低:能在5秒內對用戶的大部分分析要求做出反應。
④主要業務是查詢操作:歷史數據伺服器中數據極少進行數據刪除和修改,只是定期載入在用伺服器的數據,平時只滿足分析人員查詢需要。
歷史數據的載入
歷史數據的載入不是簡單地將在用系統中數據移動到歷史數據伺服器上,而是在移動過程中要進行數據格式化處理,通過客戶端編寫應用程式來完成數據移動。這種人機互動式分析處理方式,保證在用系統的數據完整、準確地移動到歷史隸屬數據伺服器。其缺點是客戶機和伺服器間存在著大量的數據交換,執行過程較慢。
分析工具
BusinessObjects是一個集查詢、報表和OLAP技術為一體的智慧型決策支持系統。它使用獨特的“語義層”技術和“動態微立方”技術來表示資料庫中的多維數據,具有較好查詢和報表功能,提供鑽取(Drill)等多維分析技術,支持多種平台(所有Windows平台及Unix平台)和多種資料庫(Oracle、Sybase、MicrosoftSQLserver、DB2、dBase、Access等),同時還支持Intemet/Intranet,可以通過WWW進行查詢、報表和分析決策。
發展方向
目前,我國大部分醫院已建立了基本的醫院信息系統來輔助事務管理,且隨著計算機信息技術特別是在線上事務處理(On LineTransactionProcessing,OLTP)、資料庫技術等的快速發展,醫院信息系統對信息的生成、存儲、傳輸和管理等數據的操作處理已十分成熟有效,成為醫院科學管理和提高醫療服務水平的有力手段。但醫院業務系統及其數據保存格式主要是面向流程設計的事務處理,而不是面向分析管理,因此很難根據現有數據和信息進行深度挖掘,不能從海量數據中提取潛在知識,輔助醫院管理者的決策,加強醫院的管理水平。
在此情況下,使用數據倉庫技術建立醫院數據分析平台來幫助醫院科學地管理,綜合統一地使用各業務系統中分散的數據,以及分析和利用已積累的每年不斷增加的大量數據,成為當前信息化建設的一個新的發展方向。