統一醫學語言系統

統一醫學語言系統

統一醫學語言系統(Unified Medical Language System,UMLS)是美國國立醫學圖書館持續開發了20多年的巨型醫學術語系統,涵蓋了臨床、基礎、藥學、生物學、醫學管理等醫學及與醫學相關學科,收錄了約200萬個醫學概念,醫學辭彙更是空前,達到了500多萬個。

UMLS目前已套用電子病歷、衛生服務、公共衛生統計、生物醫學文獻分類以及臨床基礎和衛生服務研究等領域。因此,UMLS醫學術語漢化對於我國的醫學事業的發展具有歷史裡程碑意義。然而UMLS醫學術語漢化是一個浩大複雜的工程。

簡介

1986年初,美國國家醫學圖書館開始著手一個長期的研發計畫,即制定統一醫學語言系統這一衛生信息標準。開始,主要是基於“及時檢索正確而新穎的信息,將有助於決策的制定,並能提升研究及病人看護品質”的假設。由於生物醫學信息不斷大量地增加且分散於不同的資料庫系統中,想要檢索完整而新穎的信息變得越來越困難,故UMLS應運而生。

UMLS目的在於提升信息系統能力,使信息系統能了解讀者在生物醫學方面的問題及意願,進而幫助讀者檢索及整合相關信息。

UMLS著重解決兩個影響有效檢索的問題:一是概念經由不同的人或在不同的資料庫中可能會有不同的表達方式;二是資料庫系統分散所造成的檢索不完整的問題。UMLS試圖在讀者問題與資料來源問建立概念上的聯結。

UMLS計畫的目的並不在於建立一索引辭彙,或建立一大型知識庫以涵蓋所有生物醫學文獻資料,而是針對病歷記錄定義其電子形式資料應具備的架構及內容。也就是說,在UMLS計畫中,希望可以創造出一個界面環境,而這個界面必須擔負起三項主要功能:①具備解釋讀者問題的能力;②具備判斷並聯結相關資料庫的人工智慧;③執行有效檢索的能力。

組成部分

UMLS標準主要由泛索引詞典、語意網路、信息來源圖和專家詞語錄組成。

①泛索引詞典(meta thesaurus):信息檢索結果的成功與否,取決於讀者對其所使用資料庫架構的了解程度,而要使計算機與使用者作互動式地交談,關鍵因素即是“語言”。而泛索引詞典即是UMLS系統中負責控制辭彙的工具。泛索引詞典可視為一個概念名詞的知識庫,由生物醫學領域中許多不同索引詞典或分類表中所抽取出來的辭目所組成。

②語意網路(semantic network):語意網路的產生是為了讓泛索引詞典中所涵蓋的概念能有一致的分類體系,並為所有的概念建立關係,能根據每一個概念所屬之語意形式在網路中所在的位置來檢查其與其他概念間的關係。

③信息來源圖(information sources map):大量而快速成長的生物醫學信息以及資料形態的多元化,使得任何個人想要完整蒐集單一主題的生物醫學信息變得越來越困難。信息來源圖設計的目的即在幫助生物醫學領域的讀者,在系統功能的支持下,輔助其在資料內容上做選擇判斷,並透過網路快速獲得相關信息,以解決其問題。

④專家詞語錄(specialist lexicon):專家詞語錄主要是在提供各項詞語資料,以便系統可以據此處理自然語言所產生之語法上不確定的問題。我們可將專家詞語錄視為一套大部頭的電子辭典,而其範圍則涵蓋一般常用英文單詞及生物醫學辭彙。

特點

總體來看,UMLS有兩個最主要特徵:

一是規範醫學用語,將概念的不同表達方式進行同義規範。

二是通過分析概念的內涵和外延,建立概念間的上位一下位(分一屬)及相關關係。UMLS雖然在一定程度上表示了醫學專業知識,但它僅僅是一個建立在分類體系上的一個概念層次結構,也就是說UMLS建立了一個醫學術語體系.以及部分術語間的關係,而並沒有利用這些術語來描述醫學事實。

套用

UMLS可用於設計信息檢索或病歷系統,促進不同系統之間的通訊交流,或者用於開發能夠解析生物醫學文獻的系統。對於許多此類套用而言,將不得不以某種自定義形式來使用UMLS,比如,排除某些與當前套用並不相關的源詞表。國立醫學圖書館本身則已將UMLS用於自己的PubMed和ClinicalTrials(臨床試驗系統)。

相關詞條

熱門詞條

聯絡我們