黄林晟

作品数:1被引量:14H指数:1
导出分析报告
供职机构:北京大学更多>>
发文主题:文本挖掘组织机构中文抽取算法基于主题更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《山东大学学报(理学版)》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-1
视图:
排序:
基于编辑距离的中文组织机构名简称-全称匹配算法被引量:14
《山东大学学报(理学版)》2012年第5期43-48,共6页黄林晟 邓志鸿 唐世渭 王文清 陈凌 
国家"八六三"高技术研究发展计划基金资助项目(2009AA01Z136);国家自然科学基金资助项目(90812001);国家教育部"211工程"中国高等教育文献保障系统(CALIS)三期建设项目
在面对中文语言环境下组织机构名简称-全称匹配这一具体问题时,经典的基于编辑距离进行字符串相似匹配方法的实用性有所下降。基于编辑距离的思想,提出了一种改进匹配算法:首先对简称和全称进行分词,以切合中文的语法结构特点;之后结合...
关键词:文本挖掘 机器学习 编辑距离 组织机构名 简称-全称匹配 
检索报告 对象比较 聚类工具 使用帮助 返回顶部