国家重点基础研究发展计划(2004CB318102)

作品数:78被引量:626H指数:14
导出分析报告
相关作者:俞士汶彭爽吴云芳金晓艳穗志方更多>>
相关机构:北京大学南京师范大学南开大学郑州大学更多>>
相关期刊:《汉语学报》《五邑大学学报(社会科学版)》《滁州学院学报》《外语研究》更多>>
相关主题:中文信息处理计算机应用自然语言处理词义消歧语料库更多>>
相关领域:自动化与计算机技术语言文字文化科学电子电信更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于分类器集成的兼类词消歧研究被引量:2
《南京师大学报(自然科学版)》2010年第4期144-147,152,共5页张一哲 曲维光 刘金克 孙玉霞 
国家自然科学基金(60773173;61073119);国家"973"项目(2004CB318102);江苏省社科基金(06JSBYY001)
兼类词词性消歧是中文词性标注的难点之一.本文集成了支持向量机、条件随机场、最大熵等3种分类模型,对兼类词词性消歧进行研究.以1998年1月份已标注《人民日报》为实验语料,对410个常见的兼类词进行开放测试,平均精度达到89.69%,取得...
关键词:兼类词消歧 支持向量机 条件随机场 最大熵 分类器集成 
基于动词的汉语复合名词短语释义研究被引量:9
《中文信息学报》2010年第6期3-9,共7页王萌 黄居仁 俞士汶 李斌 
国家973计划资助项目(2004CB318102);国家社科基金资助项目(07BYY050)
复合名词短语的语义解释的主要目的是恢复修饰语和中心词之间隐含的语义关系。该文针对汉语复合名词短语的语义解释,首次采用动态的策略,提出了"基于动词的短语释义"的方法,利用语料库及Web数据,自动获取复合名词短语的释义短语,实验结...
关键词:汉语复合名词短语 语义解释 释义短语 释义动词 
基于挖掘Web双语词汇关联度的无指导译文消歧
《高技术通讯》2010年第4期349-354,共6页刘鹏远 赵铁军 
973计划(2004CB318102);国家自然科学基金(60903063);中国博士后科学基金(20090450007)资助项目
为缓解译文消歧任务中消歧知识获取困难及数据稀疏问题,提出了一种基于Web的挖掘双语词汇相关关系的无指导译文消歧方法。该方法将双语词汇在语料库中的间接相关拓展到Web,提出了基于Web的双语词汇间接相关模型,在此基础上又提出了一种...
关键词:无指导译文消歧 双语词汇相关 页面计数 间接相关 基于WEB 
中文信息处理60年被引量:17
《语言文字应用》2009年第4期53-61,共9页宗成庆 曹右琦 俞士汶 
国家自然科学基金项目(60736014);"863"计划项目(2006AA010108-4);国家支撑计划项目(2006BAH03B02);国家973课题(2004CB318102)的支持
本文首先简要回顾中国语文现代化走过的历程、取得的重要成果及其对中文信息处理的影响,然后对汉字信息处理和汉语信息处理的其他工作予以归纳阐述,并对这一领域的学术活动与国际交流情况做简要介绍,最后对中文信息处理所面临的挑战和...
关键词:中文信息处理 自然语言处理 自然语言理解 计算语言学 
基于Web的无指导译文消歧词模型与N-gram模型及对比研究被引量:3
《电子与信息学报》2009年第12期2969-2974,共6页刘鹏远 赵铁军 
国家重点基础研究发展计划(2004CB318102)资助课题
该文提出了基于Web的无指导译文消歧的词模型及N-gram模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web上的Page Count作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web相...
关键词:计算语言学 无指导译文消歧 词模型 N-GRAM模型 PAGE COUNT 双语词汇Web相关度 
语料库技术及其应用被引量:50
《外语研究》2009年第5期43-51,共9页常宝宝 俞士汶 
中国国家973课题(2004CB318102);国家社会科学基金项目(06BYY048)的支持
现代意义上的语料库最早出现于20世纪60年代,40多年来,发展迅速,不但规模越来越大,而且加工深度越来越深,语料库方法在语言研究和计算语言学研究领域发挥了重要作用。本文首先概要介绍了语料库的概念、发展和应用,然后介绍了北京大学的...
关键词:语料库 汉语语料库 汉英平行语料库 词典编纂平台 
计算语言学浅介被引量:4
《术语标准化与信息技术》2009年第3期34-39,共6页俞士汶 朱学锋 
国家973课题(2004CB318102);国家自然科学基金项目(60773173)支持
计算语言学是文理交叉的新兴学科,以自然语言(汉语、英语等)的计算机处理(包括分析和生成)为研究内容,其最高境界是自然语言的机器理解,从而在人机之间实现自然语言的交互。本文简单介绍计算语言学和自然语言处理的研究对象、内容和当...
关键词:计算语言学 自然语言处理 自然语言理解 语言知识库 现代汉语语法信息词典 
隐喻自动处理研究进展被引量:10
《中文信息学报》2009年第6期46-55,共10页贾玉祥 俞士汶 朱学锋 
国家973课题资助项目(2004CB318102);国家自然科学基金资助项目(60773173)
隐喻在人类语言中普遍存在,是自然语言理解必须面对的问题。该文首先探讨了对隐喻的认识及语言中隐喻表达的分类。把隐喻自动处理分为隐喻识别、隐喻理解和隐喻生成三个子任务,对以往的研究成果进行梳理,着重介绍近几年来隐喻自动处理...
关键词:人工智能 机器翻译 隐喻自动处理 自然语言处理 机器学习 知识获取 
汉语形容词的自动词义区分研究被引量:1
《中文信息学报》2009年第6期19-25,共7页朱虹 刘扬 俞士汶 
国家973课题资助项目(2004CB318102);国家自然科学基金资助项目(60775031);国家社科基金资助项目(08BYY060);全国优秀博士学位论文作者专项资助项目(200514)
词义知识获取是词义知识库建设、词义消歧等任务的基础和起点,目前该工作基本依赖人类专家的智慧和洞察力,在大规模文本处理上缺乏意义计算的客观性和一致性。该文以汉语的中高频形容词为样本,深入挖掘词义特征并采用有参数初始化过程...
关键词:计算机应用 中文信息处理 知识获取 词义区分 特征选择 EM算法 
一种基于使用差异的词语领域性分析方法被引量:5
《中文信息学报》2009年第6期72-78,共7页李素建 宋涛 高杰 幺鹏跃 李文捷 
国家自然科学基金资助项目(60603093;60875042);国家973课题资助项目(2004CB318102)
领域知识的表达形式最终体现在词汇的领域性上,因此对领域词及其部件的领域度分析是一个关键。该文在分词的基础上,对各个领域语料进行分析,利用词语之间的关系,引入链接分析方法分析词语在各个领域中的使用重要性,并通过词语在各个领...
关键词:人工智能 自然语言处理 领域性分析 领域词 领域部件词 链接分析 使用差异 
检索报告 对象比较 聚类工具 使用帮助 返回顶部