曹海龙

作品数:7被引量:18H指数:2
导出分析报告
供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
发文主题:句法分析汉语句法分析多语自然语言处理性能比较更多>>
发文领域:自动化与计算机技术语言文字文化科学更多>>
发文期刊:《高技术通讯》《智能计算机与应用》《软件学报》《电子与信息学报》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-7
视图:
排序:
基于替换方法的无监督双语词典抽取
《智能计算机与应用》2021年第3期217-219,共3页郭晋鹏 曹海龙 
双语词典抽取任务是自然语言处理一个重要课题。本文基于替换方法重新训练词向量,使得词向量具有跨语言特性。本文主要研究了训练词典的获取方法,以及词向量共训练模型,在中英维基百科语料上进行实验。实验结果表明,按照确信度的方法选...
关键词:双语词典抽取 无监督 替换方法 
面向科技语料的短语结构句法分析器被引量:2
《情报工程》2017年第3期10-20,共11页王亚楠 马春鹏 曹海龙 赵铁军 
国家自然科学基金项目(91520204;61572154);863项目(2015AA015405);微软亚洲研究院合作研究计划的资助
本文介绍了一个由哈尔滨工业大学设计和开发的面向科技语料的短语结构句法分析器。与传统的短语结构句法分析器不同,本句法分析器不需要对输入语料进行预处理。给定未经预处理的语料,本句法分析器可以联合地进行分词、词性标注以及短语...
关键词:短语结构句法分析 科技语料 多任务学习 
层次短语翻译中基于Markov随机场的层次切分模型
《软件学报》2012年第12期3088-3100,共13页刘乐茂 赵铁军 曹海龙 朱聪慧 张春越 
国家自然科学基金(60736014;61173073;61100093);国家高技术研究发展计划(863)(2011AA01A207)
翻译推导的切分歧义是统计机器翻译面临的一个很重要的问题,而在层次短语机器翻译中,其尤为突出.提出了一个层次切分模型来处理推导的切分歧义性.采用Markov随机场构建模型,然后将其融入层次短语翻译模型,以便自动选择更合理的切分.在N...
关键词:层次短语翻译 切分模型 图模型 MARKOV随机场 依存树 
以机器翻译技术为核心的多语信息处理研究被引量:2
《中文信息学报》2011年第6期81-89,110,共10页赵铁军 曹海龙 
国家自然科学基金重点项目(60736014;60736044);国家自然科学基金面上项目(60773066;60773069;61173073);国家863计划重点项目(2006AA010108);国家863计划探索类项目(2006AA01Z150)
该文介绍了哈尔滨工业大学教育部—微软语言语音重点实验室在多语信息处理方面的研究进展和成果。首先综述了国内外的研究现状,然后重点介绍在统计机器翻译、机器翻译应用、机器翻译评价、跨语言信息检索等方面的研究工作。
关键词:机器翻译 多语信息处理 自然语言处理 
基于词汇化模型的汉语句法分析被引量:2
《电子与信息学报》2007年第9期2082-2085,共4页曹海龙 赵铁军 李生 
国家自然科学基金(60373101);国家863计划(2004AA117010-08)资助课题
该文以处理大规模真实文本为目标,把句法分析分解为分词/词性标注、短语识别两个部分。首先提出了一个一体化的分词/词性标注方法,该方法在隐马尔科夫模型(HMM)的基础上引入词汇信息,既保留了HMM简单快速的特点,又有效提高了标注精度;...
关键词:句法分析 隐马尔科夫模型 中心驱动模型 结构模式识别 
基于中心驱动模型的宾州中文树库(CTB)句法分析被引量:3
《高技术通讯》2007年第1期15-20,共6页曹海龙 赵铁军 李生 
国家自然科学基金(60302021、60375019)和863计划(2004AA117010-08)资助项目.
报告了依托宾州中文树库进行句法分析研究的最新进展。以著名的中心驱动模型为基础,首次在宾州中文树库5.0上进行了句法分析实验。同前人的工作相比,这次实验取得了更加成功的结果,极大缩小了中、英文句法分析的差距。在公共的测试...
关键词:中心驱动模型 宾州中文树库 句法分析 结构模式识别 
四种基本统计句法分析模型在汉语句法分析中的性能比较被引量:10
《中文信息学报》2003年第3期1-8,共8页孟遥 李生 赵铁军 曹海龙 
国家自然科学基金资助项目 ( 69775 0 17);国家"八六三"高技术研究发展计划基金资助项目( 863- 30 6- 12 0 0 1AA11410 1)
统计模型的选择是统计句法分析的关键。目前句法分析常用的有四种经典统计模型—PCFG模型 ,基于历史模型、分层渐近式模型和头驱动模型。本文通过实验 ,在已有的 10 0 0 0句汉语树库基础上 ,测试了这四种经典模型在现有数据规模下各自...
关键词:计算机应用 中文信息处理 统计句法分析 基本模型 汉语分析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部