版权归原作者所有,如有侵权,请联系我们

[科普中国]-统一医学语言系统

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

1986年初,美国国家医学图书馆开始着手一个长期的研发计划,即制定统一医学语言系统这一卫生信息标准。开始,主要是基于“及时检索正确而新颖的信息,将有助于决策的制定,并能提升研究及病人看护品质”的假设。由于生物医学信息不断大量地增加且分散于不同的数据库系统中,想要检索完整而新颖的信息变得越来越困难,故UMLS应运而生。

UMLS目的在于提升信息系统能力,使信息系统能了解读者在生物医学方面的问题及意愿,进而帮助读者检索及整合相关信息。

UMLS着重解决两个影响有效检索的问题:一是概念经由不同的人或在不同的数据库中可能会有不同的表达方式;二是数据库系统分散所造成的检索不完整的问题。UMLS试图在读者问题与资料来源问建立概念上的联结。

UMLS计划的目的并不在于建立一索引词汇,或建立一大型知识库以涵盖所有生物医学文献资料,而是针对病历记录定义其电子形式资料应具备的架构及内容。也就是说,在UMLS计划中,希望可以创造出一个界面环境,而这个界面必须担负起三项主要功能:①具备解释读者问题的能力;②具备判断并联结相关数据库的人工智能;③执行有效检索的能力。2

组成部分

UMLS标准主要由泛索引词典、语意网络、信息来源图和专家词语录组成。

①泛索引词典(meta thesaurus):信息检索结果的成功与否,取决于读者对其所使用数据库架构的了解程度,而要使计算机与使用者作交互式地交谈,关键因素即是“语言”。而泛索引词典即是UMLS系统中负责控制词汇的工具。泛索引词典可视为一个概念名词的知识库,由生物医学领域中许多不同索引词典或分类表中所抽取出来的辞目所组成。

②语意网络(semantic network):语意网络的产生是为了让泛索引词典中所涵盖的概念能有一致的分类体系,并为所有的概念建立关系,能根据每一个概念所属之语意形式在网络中所在的位置来检查其与其他概念间的关系。

③信息来源图(information sources map):大量而快速成长的生物医学信息以及资料形态的多元化,使得任何个人想要完整搜集单一主题的生物医学信息变得越来越困难。信息来源图设计的目的即在帮助生物医学领域的读者,在系统功能的支持下,辅助其在资料内容上做选择判断,并透过网络快速获得相关信息,以解决其问题。

④专家词语录(specialist lexicon):专家词语录主要是在提供各项词语资料,以便系统可以据此处理自然语言所产生之语法上不确定的问题。我们可将专家词语录视为一套大部头的电子辞典,而其范围则涵盖一般常用英文单词及生物医学词汇。2

特点

总体来看,UMLS有两个最主要特征:

一是规范医学用语,将概念的不同表达方式进行同义规范。

二是通过分析概念的内涵和外延,建立概念间的上位一下位(分一属)及相关关系。UMLS虽然在一定程度上表示了医学专业知识,但它仅仅是一个建立在分类体系上的一个概念层次结构,也就是说UMLS建立了一个医学术语体系.以及部分术语间的关系,而并没有利用这些术语来描述医学事实。3

应用

UMLS可用于设计信息检索或病历系统,促进不同系统之间的通讯交流,或者用于开发能够解析生物医学文献的系统。对于许多此类应用而言,将不得不以某种自定义形式来使用UMLS,比如,排除某些与当前应用并不相关的源词表。国立医学图书馆本身则已将UMLS用于自己的PubMed和ClinicalTrials(临床试验系统)。3