未登录词识别

作品数:52被引量:729H指数:12
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周蕾黄德根曾依灵许洪波朱巧明更多>>
相关机构:中国科学院苏州大学大连理工大学南京师范大学更多>>
相关期刊:《常熟理工学院学报》《烟台大学学报(自然科学与工程版)》《测绘科学》《情报杂志》更多>>
相关基金:国家自然科学基金江苏省自然科学基金国家重点基础研究发展计划江苏省教育厅自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 机构=苏州大学计算机科学与技术学院x
条 记 录,以下是1-4
视图:
排序:
基于统计信息的未登录词的扩展识别方法被引量:15
《中文信息学报》2009年第3期24-30,50,共8页韩艳 林煜熙 姚建民 
江苏省自然科学基金资助项目(BK2006539);江苏省高校自然科学基础研究资助项目(06KJB520095)
该文提出一种基于网络资源的未登录词的扩展识别方法。该方法以左右邻信息判断未登录词边界为基础对已识别出的二元候选未登录词种子进行扩展,从而得到不限长度的语义更完整的未登录词。实验证明该文方法可行有效。
关键词:计算机应用 中文信息处理 未登录词识别 左右邻信息 最频繁左邻比 最频繁右邻比 候选OOV扩展 
基于统计和规则的未登录词识别方法研究被引量:21
《计算机工程》2007年第8期196-198,共3页周蕾 朱巧明 
江苏省自然科学基金资助项目(BK2003030);江苏省教育厅自然科学基金资助项目(04KKB320134)
介绍了一种基于统计和规则的未登录词识别方法。该方法分为2个步骤:(1)对文本进行分词,对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,利用贪心算法获得每个碎片的最长路径,从而提取未...
关键词:未登录词识别 贪心算法 二元模型 互信息 
汉语未登录词识别现状及一种新识别方法介绍被引量:3
《计算机应用与软件》2007年第8期213-215,共3页王蕾 杨季文 
未登录词的识别对于各种汉语处理系统不仅有直接的实用意义,而且起到基础性的作用。在大规模中文文本的自动分词中,未被识别的未登录词是造成分词错误的一个重要原因,也成为许多自动分词系统走向应用的瓶颈。首先对未登录词的研究现状...
关键词:专有名词识别 属性标注 错误驱动 规则和实例 
基于属性标记的专有名词自动识别研究
《计算机技术与发展》2006年第11期195-198,共4页王蕾 杨季文 
提出了一种新的基于属性标记的专有名词统一识别方法。其基本思想是:根据专有名词的成词特点,利用标注语料库,设定词语属性作为标准属性重新进行标注,在此语料基础上进行专有名词成词结构、成词环境的实例提取,并采用基于转换的错误驱...
关键词:中文专有名词识别 未登录词识别 属性标注 基于转换的错误驱动学习方法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部