哈尔滨工业大学计算机科学与技术学院语言语音教育部-微软重点实验室

作品数:38被引量:160H指数:6
导出分析报告
发文作者:梁华参孙加东林建方马永亮胡鹏龙更多>>
发文领域:自动化与计算机技术语言文字文化科学生物学更多>>
发文主题:统计机器翻译机器翻译自然语言处理统计翻译模型知识获取更多>>
发文期刊:《计算机技术与发展》《哈尔滨工业大学学报》《通信学报》《计算机应用研究》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划黑龙江省自然科学基金云南省应用基础研究计划面上项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
条 记 录,以下是1-10
视图:
排序:
动态流形方法在多文档文摘模型上的应用
《计算机技术与发展》2018年第3期26-31,共6页刘美玲 郑德权 王慧强 于洋 
中央高校基本科研业务费专项资金(2572014CB26);黑龙江省自然科学基金(F2015037)
网络动态演化内容的识别和分析是人们快速获取有效信息的主要手段之一,已经成为人们迫切需要解决的关键问题。动态多文档文摘建立在时间信息基础上,从网络动态演化性出发,对同一话题不同时段的文档集合进行分析,在识别信息内容差异性的...
关键词:动态多文档文摘 动态演化性 差异性分析 相似度 质心整体选优 
结构化学习的噪声可学习性分析及其应用被引量:2
《软件学报》2013年第10期2340-2353,共14页于墨 赵铁军 胡鹏龙 郑德权 
国家自然科学基金(61173073);国家高技术研究发展计划(863)(2011AA01A207)
噪声可学习性理论指出,有监督学习方法的性能会受到训练样本标记噪声的严重影响.然而,已有相关理论研究仅针对二类分类问题.致力于探究结构化学习问题受噪声影响的规律性.首先,注意到在结构化学习问题中,标注数据的噪声会在训练过程中...
关键词:结构化学习 噪声PAC可学习性 词性标注 自然语言处理 协同训练 跨语言映射 半监督学习 
统计机器翻译中双语语料的过滤及词对齐的改进被引量:3
《智能计算机与应用》2013年第4期10-13,17,共5页梁华参 赵铁军 
国家自然科学基金重点项目(61173073);国家高技术研究发展计划(863)重点项目(2011AA01A207)
词对齐是统计机器翻译系统中最重要的一个环节,统计机器翻译中的翻译模型和调序模型都是在词对齐结果的基础上构造的,词对齐阶段出现的错误,会延续到这些模型中,甚至会因为词对齐的错误而在这些模型中引发更大的错误。为减少词对齐阶段...
关键词:词对齐 统计机器翻译 对齐困惑度 对齐错误率 
基于对等模式的汉-英译文调序
《高技术通讯》2013年第1期29-34,共6页张春祥 赵铁军 卢志茂 高雪瑶 
863计划(2006AA010108)和国家自然科学基金(60903082,60975042)资助项目.
为了提高机器翻译质量,提出了一种基于对等模式的汉-英译文调序方法:从短语翻译对中抽取汉.英语序对应关系,利用语言学特征和错误驱动学习相结合的方式获取对等模式,使用对等模式来改变汉语句法树结构,使其生成的译文符合英语语...
关键词:对等模式 译文调序 短语翻译对 词链交叉率 译文质量 
以机器翻译技术为核心的多语信息处理研究被引量:2
《中文信息学报》2011年第6期81-89,110,共10页赵铁军 曹海龙 
国家自然科学基金重点项目(60736014;60736044);国家自然科学基金面上项目(60773066;60773069;61173073);国家863计划重点项目(2006AA010108);国家863计划探索类项目(2006AA01Z150)
该文介绍了哈尔滨工业大学教育部—微软语言语音重点实验室在多语信息处理方面的研究进展和成果。首先综述了国内外的研究现状,然后重点介绍在统计机器翻译、机器翻译应用、机器翻译评价、跨语言信息检索等方面的研究工作。
关键词:机器翻译 多语信息处理 自然语言处理 
基于主动学习的短语翻译对获取
《高技术通讯》2011年第4期380-385,共6页张春祥 赵铁军 卢志茂 
863计划(2006AA010108),国家自然科学基金(60903082,60975042),黑龙江省教育厅科学技术研究项目(11541045)和教育部春晖计划(S2009-1-15002)资助项目.
利用汉-英双语句对进行了抽取短语翻译对的研究,提出了一种利用双语评价特征进行译文评价的短语翻译对主动获取方法。该方法通过选择有代表性的短语翻译对来达到减少人工标注数据的目的,以短语译文直译率、短语翻译概率和短语长度差...
关键词:短语翻译对 双语句对 双语评价特征 主动获取 支持向量机(SVM) 
多民族语言本体知识库构建技术被引量:15
《中文信息学报》2011年第4期71-74,共4页赵小兵 邱莉榕 赵铁军 
国家科技支撑计划资助项目(2009BAH41B04);教育部资助项目(MZ115-94)
语义本体是共享概念模型的显示的形式化规范说明,其目标是将杂乱无章的信息源转变为有序易用的知识源。语义本体知识库的构建是文本自动处理的一个重要环节,跨语言信息检索、信息抽取、自动翻译等领域中都有广泛的应用。该文旨在描述统...
关键词:知识库 语义本体 词典扩充 本体学习 
词汇相似度约束的短语抽取被引量:2
《哈尔滨工业大学学报》2010年第5期775-778,共4页梁华参 赵铁军 薛永增 孙加东 
国家自然科学基金重点资助项目(60736014);国家高技术研究发展计划重点资助项目(2006AA010208)
为克服传统的短语抽取方法对词对齐信息的依赖性强,抗噪声能力差这一缺陷,提出基于词汇相似度约束的短语抽取策略;在此框架下,提出了3种基于词汇相似度的约束方法:Dice系数、Phi平方系数和对数似然比.在IWSLT2004语料上进行的实验表明,...
关键词:机器翻译 统计机器翻译 短语抽取 词汇相似度 
基于无向图序列标注模型的中文分词词性标注一体化系统被引量:12
《电子与信息学报》2010年第3期700-704,共5页朱聪慧 赵铁军 郑德权 
国家自然科学基金(60773069;60973169)资助课题
在中文词法分析中,分词是词性标注必须经历的阶段。为了能在分词阶段就充分利用词性标注的信息和减少两阶段错误的累计,最好的方法是将两个阶段,整合到一个架构中。该文以无向图模型为基础,将分词和词性标注有机地统一在一个序列标注模...
关键词:中文分词 词性标注 一体化系统 无向图模型 
Web数据反馈的搭配抽取方法
《哈尔滨工业大学学报》2010年第2期281-285,共5页林建方 牛成 李生 郑德权 
国家自然科学基金重点资助项目(60736044);国家科技发展计划探索类资助项目(2006AA01Z150)
为了提高搭配(Collocation)抽取的精度,提出一种新的互联网数据的搭配抽取方法.传统的搭配抽取统计方法都是基于语料库的,常受到语料库规模的影响和制约,而在互联网数据中蕴含着丰富的知识和信息,基于Web的词汇相关性度量方法,充分利用...
关键词:搭配 共现频率 互信息 卡方检验 语料库 WEB 
检索报告 对象比较 聚类工具 使用帮助 返回顶部