张孝飞

作品数:7被引量:65H指数:5
导出分析报告
供职机构:中国科学院计算机语言信息工程研究中心更多>>
发文主题:机器翻译自然语言处理语料库查询翻译转换更多>>
发文领域:自动化与计算机技术语言文字更多>>
发文期刊:《模式识别与人工智能》《山东大学学报(理学版)》《小型微型计算机系统》《计算机工程》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-7
视图:
排序:
一种采用聚类技术改进的KNN文本分类方法被引量:34
《模式识别与人工智能》2009年第6期936-940,共5页张孝飞 黄河燕 
国家自然科学基金项目(No.60672149);国家863计划项目(No.2006AA010109)资助
KNN算法稳定性好、准确率高,但由于其时间复杂度与样本数量成正比,导致其分类速度慢,难以在大规模海量信息处理中得到有效应用.文中提出一种改进的KNN文本分类方法.其基本思路是,通过文本聚类将样本中的若干相似文档合并成一个中心文档...
关键词:k-最近邻(KNN) 文本分类 文本聚类 聚类中心 自然语言处理 
跨语言信息检索中查询语句翻译转换算法被引量:1
《计算机工程》2007年第11期166-167,212,共3页张孝飞 黄河燕 陈肇雄 代六玲 
国家自然科学基金资助项目(60502048)
跨语言信息检索中,输入的查询语句往往是一系列关键词组合,而不是一个完整意义上的句子,致使查询关键词序列缺乏必要的语法、语境信息,难以实现查询语句的精确翻译。该文基于大规模双语语料库,以向量空间模型和词汇同现互信息为理论基础...
关键词:跨语言信息检索 查询语句 翻译转换 双语语料库 
基于本体的专业机器翻译术语词典研究被引量:10
《中文信息学报》2007年第1期17-22,共6页黄河燕 张克亮 张孝飞 
国家863计划资助项目(2004AA1170010-02);国家自然科学基金资助项目(60272088)
在专业机器翻译系统的设计和实现中,要解决的一个关键问题是如何有效地组织面向不同专业领域的专业术语,以及如何根据当前所处理的文本选择相应的术语定义。本文首先分析现有专业机器翻译系统在术语词典组织和建设方面存在的主要问题,...
关键词:人工智能 机器翻译 本体 术语词典 
大规模句子相似度计算方法被引量:6
《中文信息学报》2006年第B03期47-52,共6页黄河燕 陈肇雄 张孝飞 张克亮 
国家自然科学基金资助项目(60502048,60272088);国家863计划资助项目(2002AA117010-02)
如何根据源语言文本从大规模语料库中找出其最相近的翻译实例,即句子相似度计算,是基于实例翻译方法的关键问题之一。本文提出一种多层次句子相似度计算方法:首先基于句子的词表层特征和信息熵从大规模语料库中选择出少量候选实例,...
关键词:句子相似度 基于实例的机器翻译 多策略机器翻译 泛化匹配 
面向中文问答系统的问句句法分析被引量:5
《山东大学学报(理学版)》2006年第3期85-88,共4页张亮 王树梅 黄河燕 张孝飞 
国家自然科学基金资助项目(60372064)
中文句法分析是汉语研究和信息处理中的一个关键环节,同时也是难点之一.探讨了中文问句的结构特征,在面向中文问答系统的问句句法分析算法中,运用语料库句法处理技术,并对问句长度短、含疑问词、有疑问结构句式等特点加以利用,初步实验...
关键词:问答系统 句法分析 语料库 
基于锚点词对的双语词对齐算法被引量:10
《小型微型计算机系统》2006年第2期330-334,共5页张孝飞 陈肇雄 黄河燕 王建德 
国家自然科学基金项目(60272088;60502048)资助;国家"八六三"计划基金项目(2002AA117010-02)资助
双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要...
关键词:自然语言处理 双语词对齐 语料 锚点词对 
多策略机器翻译系统IHSMTS中实例模式泛化匹配算法被引量:1
《中文信息学报》2005年第4期1-9,共9页张孝飞 陈肇雄 黄河燕 胡春玲 
国家自然科学基金资助项目(6027088);国家863计划资助项目(2002AA117010-02)
基于精确匹配的EBMT,由于翻译覆盖率过低,导致其难以大规模实际应用。本文提出一种实例模式泛化匹配算法,试图改善EBMT的翻译覆盖率:以输入的待翻译句子为目标导向,对候选翻译实例有针对性地进行实时泛化,使得算法既能满足实时文档翻译...
关键词:人工智能 机器翻译 基于实例的机器翻译 泛化匹配 翻译覆盖率 
检索报告 对象比较 聚类工具 使用帮助 返回顶部