国家高技术研究发展计划(2006AA012140)

作品数:6被引量:53H指数:4
导出分析报告
相关作者:黄德根周惠巍焦世斗罗彦彦于静更多>>
相关机构:大连理工大学北京科技大学更多>>
相关期刊:《计算机研究与发展》《小型微型计算机系统》《大连理工大学学报》《中文信息学报》更多>>
相关主题:CRFS中文分词条件随机场语义单元FMM更多>>
相关领域:自动化与计算机技术语言文字更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-6
视图:
排序:
短语结构到依存结构树库转换研究被引量:6
《大连理工大学学报》2010年第4期609-613,共5页周惠巍 黄德根 钱志强 杨元生 
"八六三"国家高科技发展计划资助项目(2006AA012140)
为基于真实语料进行句法分析,构建了大规模的短语结构树库和依存结构树库,并尝试在两种结构的树库之间进行转换.讨论了宾州中文树库(Penn Chinese Treebank,CTB)中短语结构树库和依存结构树库的关系,并基于现代中文依存文法制定了中心...
关键词:句法分析 短语结构 依存结构 树库 转换 
基于子词的双层CRFs中文分词被引量:23
《计算机研究与发展》2010年第5期962-968,共7页黄德根 焦世斗 周惠巍 
国家"八六三"高技术研究发展计划基金项目(2006AA012140)~~
提出了基于子词的双层CRFs(conditional random fields)中文分词方法,旨在解决中文分词中切分歧义与未登录词的问题.该方法是建立在基于子词的序列标注模型上.方法第1层利用基于字CRFs模型来识别待测语料中的子词,这样做是为了减少子词...
关键词:中文分词 条件随机场 双层条件随机场 子词 子词过滤 
基于CRFs边缘概率的中文分词被引量:19
《中文信息学报》2009年第5期3-8,共6页罗彦彦 黄德根 
国家863高技术资助项目(2006AA012140);国家自然科学基金资助项目(60673039)
将分词问题转化为序列标注问题,使用CRFs标注器进行序列标注是近年来广泛采用的分词方法。针对这一方法中CRFs的标记错误问题,该文提出基于CRFs边缘概率的分词方法。该方法从标注结果中发掘边缘概率高的候选词,重组边缘概率低的候选词,...
关键词:计算机应用 中文信息处理 中文分词 条件随机场(CRFs) 边缘概率 最大向前匹配(FMM) 全局特征 
分布式策略与CRFs相结合识别汉语组块被引量:6
《中文信息学报》2009年第1期16-22,共7页黄德根 于静 
国家863高技术研究发展计划资助项目(2006AA012140);国家自然科学基金资助项目(60673039)
该文提出了一种基于CRFs的分布式策略及错误驱动的方法识别汉语组块。该方法首先将11种类型的汉语组块进行分组,结合CRFs构建不同的组块识别模型来识别组块;之后利用基于CRFs的错误驱动技术自动对分组组块进行二次识别;最后依据各分组F...
关键词:计算机应用 中文信息处理 组块识别 条件随机域(CRFs) 分布式策略 基于CRFs的错误驱动 浅层句法分析 
一种利用统计语义单元识别中文人名的方法被引量:1
《小型微型计算机系统》2008年第12期2339-2343,共5页余祖波 马建军 
国家高技术研究发展"八六三"计划项目(2006AA012140)资助
从语义语言的角度提出一种利用统计语义单元识别中文人名的方法.在该方法中没有词的概念,一切单位都是语义单元,语义单元有参数和类型等属性.通过语义单元对句子进行语义切分,获得句子的语义单元图,并利用联合概率模型求得语义单元图中...
关键词:自然语言处理 中文人名识别 语义单元 人名模式集 
一种基于语义单元的查询扩展方法被引量:4
《计算机科学》2008年第2期201-204,共4页李莉 高庆狮 
国家863高技术研究发展计划项目基金(2006AA012140);国家自然科学基金项目(60573014)的资助
查询扩展技术通过向初始查询请求中加入相似或者相关的词,来减少查询请求与相关文献在表达上的不匹配现象,改善检索性能。本文利用语义单元的语义表达能力和语义单元之间的关系,将与初始查询具有密切语义关系的查询词或短语加入到初始...
关键词:信息检索 查询扩展 搜索引擎 语义单元 
检索报告 对象比较 聚类工具 使用帮助 返回顶部