秦颖

作品数:4被引量:26H指数:3
导出分析报告
供职机构:北京邮电大学更多>>
发文主题:自动抽取实体关系抽取中文汉语分词计算机应用更多>>
发文领域:自动化与计算机技术理学语言文字文化科学更多>>
发文期刊:《中文信息学报》《微电子学与计算机》《北京邮电大学学报》《哈尔滨工程大学学报》更多>>
所获基金:国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
级联中文组块识别被引量:2
《北京邮电大学学报》2008年第1期14-17,共4页秦颖 王小捷 钟义信 
语言司民文语科库工具建设项目(MZ115-022)
基于统计方法的中文组块研究大多借鉴CoNLL2000英文组块的思想,建立了组块表示的BIO模型,并将组块识别任务作为一种为词序列标注的多分类问题.为降低分类复杂度,采取了一种分解识别法,即先识别组块的边界,再进行组块类别判定.基于条件...
关键词:中文组块 边界识别 类别识别 条件随机场 
汉语分词中组合歧义字段的研究被引量:11
《中文信息学报》2007年第1期3-8,共6页秦颖 王小捷 张素香 
教育部语言文字信息管理司"汉语及民文语料库工具软件"资助项目(MZ115-022)
汉语自动分词中组合歧义是难点问题,难在两点:组合歧义字段的发现和歧义的消解。本文研究了组合歧义字段在切开与不切时的词性变化规律,提出了一种新的组合歧义字段自动采集方法,实验结果表明该方法可以有效地自动发现组合歧义字段,在1...
关键词:计算机应用 中文信息处理 汉语切分 组合歧义 最大熵 特征 
基于Boot Strapping的中文实体关系自动生成被引量:3
《微电子学与计算机》2006年第12期15-18,共4页张素香 李蕾 秦颖 钟义信 
国家863计划重大项目(2001AA114210)
针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关...
关键词:BOOT Strapping 种子词 种子模板 标量聚类 
实体关系的自动抽取研究被引量:10
《哈尔滨工程大学学报》2006年第B07期370-373,共4页张素香 文娟 秦颖 袁彩霞 钟义信 
国家863计划计算机主题重大基金资助项目(2001AA114210).
针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地...
关键词:极大熵 BOOTSTRAPPING 特征选择 实体关系抽取 评测 
检索报告 对象比较 聚类工具 使用帮助 返回顶部