背景
從上世紀90年代末開始,IT界就開始重新審視大型、複雜信息系統的架構問題和信息化的技術策略問題。其主要的驅動力來自企業對信息共享、實時協同(Collaboration)、流程重構等需求的快速增長,跨企業甚至大規模區域協同信息化市場的形成,而傳統信息系統的架構、設計和開發模式明顯不能適應這些新型套用的規模和複雜性。ERP(Enterprise Resources Planning)在推動企業信息化發展的進程中扮演了重要的角色,但大型ERP項目的失敗率高達40%,在一些業務邏輯複雜、具有大量遺存異構系統的套用領域很少有成功案例;英國醫療信息現代化項目嚴重逾時、超預算,被稱為IT史上的災難等客觀現實從一個側面反映出傳統信息技術和軟體架構技術在複雜套用領域的局限性。
大量遺存(Legacy)信息系統的異構性(Heterogeneity)和由此引起的信息孤島(Information Island)問題是造成這些新型套用項目複雜性高、風險大主要原因之一,也是企業、跨企業複雜套用領域的共性問題。其次,跨企業、跨區域等複雜套用領域業務流程複雜多變,信息共享、互聯協同等需求導致業務邏輯複雜化、信息表達的複雜性大幅增高也是這類新型套用領域的普遍問題。傳統的軟體技術架構、各種通用的中間件和企業級軟體開發平台、甚至包括近年來倍受關注的SOA(Service Oriented Architecture)、Web2.0等技術也未能對上述共性問題提供有效的技術解決路線。醫療健康行業信息化所面對的挑戰、絕大多數解決方案成本高、風險大、需求滿足度低、不能適應長遠發展等問題反映了這一領域的現狀。
DOP(Domain Operating Platform),也稱為領域操作平台,就是在這樣的背景下形成的。
技術理念
按照傳統系統軟體和套用軟體的定義,無論是信息孤島問題,還是新型套用領域業務流程、業務邏輯、信息表達複雜性問題,都屬於“套用軟體” 範疇。而傳統的套用軟體架構基本上都遵循對問題域垂直分割的技術路線。如右圖所示,套用系統基本上都是獨立地架構於系統軟體平台之上,套用系統通常都有獨立的資料庫、業務邏輯層、用戶界面等垂直而封閉的架構。即便信息技術一直在不停地進化,甚至像網際網路技術等革命性技術的衝擊、企業軟體平台、中間件等技術的普遍套用,這一基本格局並沒有根本性的動搖。恰恰是這一傳統的技術路線,製造了如今普遍存在於各行各業的信息孤島現象。
信息孤島之所以成為一個難以解決的問題是由於套用系統的異構性(Heterogeneity)。所謂異構是指不同的套用系統,架構於不同的硬體、系統軟體平台,採用了不同的系統架構、不同的程式語言、不同的資料庫等。更為關鍵的是不同產品在表達相同領域概念、業務邏輯的時候,可能採用完全不同的表達方式,也就是在數據模型和數據層面的異構。當共享、整合、協同成為企業信息化的主流需求時,系統異構造成的信息不能互通共享、系統間不能協同互操作的問題就突顯出來。
系統異構和信息孤島問題並非新問題,各種基於互聯(Interconnection)和數據交換(Data Exchange)等集成手段已存在了幾十年。只是由於信息孤島經過長期累積,而今天的主流需求發生根本改變的情況下,問題由量變到質變,發展為新型企業級和區域規模信息化的主要障礙。當基於互聯或數據交換的集成技術要對付成百上千異構系統的集成的時候,項目的成本、功能、性能、質量、運行和維護都成為風險很高的問題。如果繼續堅持這一傳統的技術路線,其結果只能是信息孤島越來越多,互聯集成越來越複雜。
隨著共享、整合、協同成為企業信息化的主流需求,業務邏輯、信息表達複雜性可能成倍增高。特別是像醫療健康領域等知識密集型套用領域。醫療健康信息系統複雜性表現在很多方面,最典型的是系統所涉及的信息的複雜性。一個現代臨床醫學中心覆蓋幾十種臨床醫學學科,其信息系統涉及三十萬以上的醫學概念和專用辭彙,醫學概念間的相互聯繫不下百萬,業務邏輯多不勝數,業務流程複雜又極具個性化,更為複雜的是,醫學知識、概念、流程和方法由於醫學研究的發展、新技術的出現持續不斷地更新,這些複雜性是導致醫療健康領域信息化程度顯著落後於其它領域的重要原因之一。
綜合上述分析結果,如果延續傳統的系統軟體和套用軟體的劃分模式,堅持傳統套用軟體架構和發展的思維定勢,信息孤島問題的解決將陷入一個怪圈,而套用領域業務邏輯、知識表達的複雜性也難以解決。鑒於上述兩個核心問題的癥結基本都集中在信息模型和數據層,DOP首先提出將系統軟體的邊界向上擴展到傳統套用領域的數據層,但這一新的“系統軟體” 的適用範疇縮小到一個特定套用領域。換句話說,在傳統的套用軟體和系統軟體中間增加一個數據模型和數據層一體化(Unifying)的數據和套用服務平台,這個平台就是右圖所示的DOP,針對於一個特定套用領域的系統支撐平台。
DOP的技術理念可以簡單概括為:
(1)從數據層面和數據建模入手,通過技術創新從根本上削弱大型複雜軟體套用領域的複雜性;
(2)將作業系統的理念和技術向上擴展到傳統套用軟體的數據層,將適用範疇縮小到一個特定套用領域,將系統設備管理擴大到套用領域的常用設備;
(3) 通過領域數據一體化整合異構信息孤島,逐漸消除信息孤島產生的溫床;
(4)支持獨立於套用軟體系統的一體化數據層(Unified Data Layer),使得數據和具體套用軟體松耦合,新的套用系統可以架構在一體化數據層上,使數據的生命周期和具體的套用系統脫鉤;
(5)將特定套用領域信息系統中重複、可共享的部分從傳統套用系統中剝離出來,從而進一步削弱企業級系統的複雜性。
技術核心
DOP的技術核心可以簡要地歸結為:一個新的建模體系(包括方法學,實現技術,工具軟體,套用軟體框架等) 兩個核心引擎(模型引擎、數據引擎)和一系列核心功能和服務模組。
MDT建模體系
DOP的領域動態建模體系,也簡稱為MDT(Meta Data Type)建模是DOP的創新技術之一。MDT建模體系主要由模型引擎、MDT建模及模型管理服務、MDT建模工具軟體(MDT Designer, MDT Browser)等構成。具體細節可參見相關文檔。
DOP的領域動態建模技術是在二階建模(Two-Level Modeling) 技術基礎上的再創新。所有的傳統模型,包括套用廣泛的關係資料庫的模型,面向對象(Object Oriented)模型等都是所謂的一階靜態模型。由於一階模型和數據緊耦合的特點,對模型的修改往往牽一髮而動全身,在小型軟體系統中,其影響並不顯著,但對於大型一體化數據整合,涉及大量異構套用系統的集成,複雜的業務流程,在系統分析和設計階段,系統分析師和架構師須花費至少70%的時間與領域專家進行交流和溝通,如果涉及很多異構系統供應商的話,常常使得這類的項目成為風險大、難協調、難管理、質量難保證的多難項目。右圖簡要描述了領域動態建模的原理。
DOP的領域動態建模技術實現了如下幾個目標:
(1)用類似於套用領域的自然語言來描述信息模型,即領域概念直接用簡單易懂、所見即所得的MDT來表達。直接由領域專家主導建模,省去大量交流時間,避免最易出錯的環節;
(2)領域概念建模和數據松耦合是實現動態建模,或所謂後建模的關鍵。這一動態特性使複雜套用領域模型具有進化能力,是削弱一階靜態模型牽一髮而動全身問題的關鍵;
(3)DOP通過完整的建模、模型管理、數據管理體系自動生成和管理物理模型,禁止了從概念/邏輯模型到物理模型的人為干預環節,避免人為解讀/翻譯造成的信息模型異構;
(4)領域概念模型獨立於任何資料庫和程式語言,使得信息模型完全開放成為可能;
(5)領域概念模型可以攜帶實用的信息和知識,是知識建模的基礎;
(6)可交叉支持各種國家、國際標準。
基於領域概念建模、一體化數據層的軟體平台實際上是開創了一個新的軟體領域。下表對領域動態建模和其它常用的建模技術作了一個簡要的比較:
可比性 | 資料庫E-R模型 | 面向對象模型 | 動態MDT建模 |
建模主角 | 資料庫建模專家 | UML/OO專家 | 領域專家 |
適合套用領域 | 傳統套用系統 | 傳統套用系統 | 一體化(Unified)企業或行業套用 |
小模型複雜性 | 低 | 低 | 不高,但沒有優勢 |
複雜套用領域建模複雜性 | 隨領域概念數量和業務邏輯的複雜性增加而指數式增高 | 隨領域概念數量和業務邏輯的複雜性增加快速增高,比E-R模型低 | 特別適合複雜套用領域建模,即便非常複雜的套用領域,仍可保持線性複雜性 |
知識模型支持 | 不適合 | 可以攜帶知識 | 非常容易數據模型關聯相關知識,但仍然不屬於語義網類知識建模 |
開放性 | 封閉模型 | 可以構建參考模型 | 完全可開放 |
可進化性 | 很困難 | 困難 | 目前最好的可進化性 |
兩個核心引擎
DOP的核心是由實現領域動態建模體系的模型引擎、基於MDT模型的數據管理引擎及相關的輔助服務和管理模組構成的。
如右圖所示,模型引擎是領域動態建模體系的核心。它實現了MDT屬性模板管理、MDT對象創建管理、數據物理模型的創建和管理、物理模型和MDT 模型映射。同時,模型引擎負責DOP運行支持(Runtime)的數據和模型的映射。換句話說,數據的意義需要和相應的MDT相結合、通過數據引擎和模型引擎的“恢復” 才有意義。這一機制具有內在的安全性。通過特別的建模,DOP可以用於對數據安全要求極高的套用領域。因為,通過網路截取數據,甚至侵入到DOP數據中心,如果沒有獲得相應的MDT模型,或沒有模型引擎和數據引擎的支持,那些數據可能沒有任何意義,也不可能通過任何解密手段破譯。
數據引擎是DOP運行支持(Runtime)系統的核心。和其它企業級軟體平台和中間件不同,DOP實際上“接管” 了目標套用領域的數據層,包括一體化數據/信息模型、數據、各種數據操作服務調用。從這各角度來看,DOP更接近於一個新型資料庫系統。
數據引擎支持獨立於關係資料庫、獨立於檔案系統的海量數據存儲管理。數據引擎也是分布計算、數據快取、異構系統數據集成、數據中心間實時數據同步的核心。
作為DOP核心,除MDT建模體系、兩個核心引擎外,還有多個核心支撐模組和服務,比如細粒度一體化數據安全管理體系等。具體請見相關技術文檔。
MDT 映射技術
基於一體化(Unifying)信息模型的數據集成是DOP可以消融信息孤島的技術核心。根據Robert Worden對異構系統和數據集成技術進化的分級方法[1],異構系統數據集成被分為四級。目前大多數主流集成技術和產品處於第二或第三級。基於SOA、ESB等集成機制的基本都限於第三級。DOP基於一體化信息模型、一體化數據層、MDT映射技術的異構系統集成是目前唯一達到Robert Worden定義的第四級集成的技術,即基於一體化數據模型的集成。微軟在收購了華盛頓醫學中心的滴水盤(Drip Pan)技術後,也在數據集成領域積極推動一體化(Unifying)解決方案,然而,基於傳統的資料庫建模不能真正達到數據層一體化的目標,僅僅是從小的信息孤島集成為大的信息孤島而已。
右圖所示為MDT映射原理。MDT映射是DOP和異構系統間進行雙向實時數據同步的技術。通過建立MDT和傳統關係資料庫物理模型的映射關係,首先將各種異構物理數據模型統一到一體化領域概念模型,其次,通過映射確定異構系統的數據和DOP一體化數據的整合和轉換模式。目前,絕大多數基於MDT映射的異構系統整合可以通過DOP提供的可視化工具實現。由於MDT映射支持雙向實時數據同步,和各種基於ETL和類似技術的單向數據集成技術有本質差異。和目前市場上常見的解決方案相比,基於MDT映射的一體化數據集成數據整合深度、一體化程度、數據質量、整合效率、可擴展性都已經在市場化項目中體現出代級差異。關於基於DOP的一體化集成細節請參閱相關文檔。
套用實例
數字健康支撐平台是DOP技術用於醫療健康領域的範例。也是到目前為止產品化最成熟、經過市場實證的DOP平台。圖6所示為DOP數字健康支撐平台的主要功能模組、各種服務模組、及外圍支撐系統。
醫療健康領域是典型的知識密集型套用領域,領域概念超過30萬,業務邏輯多不勝數,整體信息化水平偏低,信息孤島問題嚴重,而且在明顯在惡化,醫療健康信息共享和協同難度大,企業、區域、甚至更大規模的整合需求增長快。然而,DOP數字健康支撐平台可能是唯一成熟、有效、風險和成本可控的解決方案。
基於DOP的區域醫療健康信息一體化解決方案已經成功地在上海、珠海等大型區域項目中成功套用。技術優勢明顯,整體建設成本和未來系統運行、維護、升級換代的成本節省至少可以在一個數量級以上。解決方案特點可以概括為如下三個主要方面:
(1) 智慧型節點為基礎的區域一體化解決方案實現了不依賴於異構系統提供商的數據深度一體化整合,異構系統所引起的高複雜性和風險被局限於智慧型節點,區域網路因此而獲得極高的可擴展性;
(2) 數據層一體化整合不僅最大限度保護了過去的信息化投資,也為基於一體化數據層的新型套用系統開發提供了全新模式。對未來發展的意義尚難估量。
(3) 獨立於套用系統的、細粒度數據安全機制為複雜套用領域的數據安全,用戶許可權管理提供了高效、實用的平台。
由於篇幅所限,技術細節和套用實例請參考相關文檔
技術儲備
儘管DOP尚未在其它套用領域進行實質性推動,但已經引起電信、保險、企業雲計算等行業的關注。同時,也在積極推動在DOP基礎之上的創新和儲備技術的研發。下列為幾個已經完成原型研發儲備或創新技術:
(1) 基於DOP平台的虛擬設備即插即用 -適於醫遠和設備/信息密集性工業
(2) 面向企業、區域的搜尋的技術研究 - 大型企業和區域信息搜尋
(3) DOP促進企業或私有雲計算、SAAS套用發展模式的研究.
戰略意義
DOP的出現、成熟和發展,將對大型複雜套用系統發展的格局、方法、經濟和產業鏈等層面造成相當的衝擊。其潛在的影響尚難估計,但從目前業界所關注的程度來看,從大的發展和競爭格局來看,它恰恰處於推動企業轉型的焦點之上。