检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国医学科学院医学信息研究所,北京100020
出 处:《情报科学》2013年第4期134-138,共5页Information Science
基 金:国家科技支撑计划(2011BAH10B02)
摘 要:在简述词形归并(原形化处理)基本目标的基础上,着重分析UMLS专家词典的构建方式与词典工具的核心功能,以及Norm原形化工具的处理机制;在此基础上,提出一种词形归并算法及Norm处理缺陷的修正办法,并收集医学词表数据进行算法测试与验证;此外,本文算法与经典的Porter算法进行了多方面的深入比较研究。Based on the brief description of the basic objective of lemmatization (normalization), the mech- anism of developing UMLS SPECALIST lexicon and the key performance of the lexical tool, especially the working procedure of Norm, were carefully studied. Then an algorithm for lemmatization and the strategy to correct the defect of Norm processing were proposed, followed by testing and verification using the lexi- cal data from medical vocabularies. Besides, the well-known Porter method was used for algorithm com- parison.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:13.59.172.7