“十一五”国家科技支撑计划(2006BAH03B02)

作品数:14被引量:84H指数:5
导出分析报告
相关作者:章成志王惠临高影繁徐红姣梁勇更多>>
相关机构:中国科学技术信息研究所南京理工大学南京大学中国科学院自动化研究所更多>>
相关期刊:《情报理论与实践》《情报学报》《中国图书馆学报》《智能系统学报》更多>>
相关主题:文本聚类主题聚类主题抽取数字图书馆学科更多>>
相关领域:文化科学自动化与计算机技术经济管理文学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
查询分类在跨语言检索中的应用研究被引量:2
《情报学报》2011年第4期366-371,共6页高影繁 王惠临 徐红姣 
“十一五”国家科技支撑计划项目(2006BAH03B02); 博士后科学基金(20090450465); 中国科学技术信息研究所预研基金(YY-200908);中国科学技术信息研究所2009重点工作(2009kp01-3-3);中国科学技术信息研究所学科建设项目(2009DP01-6)资金支持
文章旨在探讨查询分类技术和跨语言检索技术的关系,前者的应用能否改善后者的系统性能是核心问题。首先提出一种基于查询分类的标准化折扣累积增量评价指标,通过对采用查询分类技术前后信息检索系统的标准化折扣累积增量评价指标的变化...
关键词:标准化折扣累积增量 查询分类 查询翻译消歧算法 
基于多层术语度的一体化术语抽取研究被引量:19
《情报学报》2011年第3期275-285,共11页章成志 
本研究受国家自然科学基金项目(70903032);教育部人文社会科学研究一般项目(08JC870007);“十一五”国家科技支撑计划重点项目(2006BAH03B02)资助.
以往的术语抽取研究大多将语言学方法和统计方法分别进行单独的处理,并且只考虑候选术语本身的术语度,而没有考虑候选术语所在句子的术语度对术语抽取性能的影响。本文将语言学方法与统计方法进行并行融合,综合考虑候选术语及其所在...
关键词:术语抽取 多层术语度 一体化策略 条件随机场 
面向数字图书馆应用的多语言领域本体学习研究被引量:7
《图书情报工作》2011年第2期11-15,94,共6页章成志 王惠临 
"十一五"国家科技支撑计划重点项目子课题"多语言信息服务环境关键技术研究"(项目编号:2006BAH03B02);教育部人文社会科学研究一般项目"多语领域本体的自动构建研究"(项目编号:08JC870007)研究成果之一
首先分析相关应用案例,说明多语言领域本体在数字图书馆领域的潜在应用价值,然后阐述数字图书馆环境下多语言领域本体学习的特点,由此给出面向数字图书馆应用的多语言领域本体学习基本框架,接着说明其中涉及到的若干关键技术与本课题组...
关键词:多语言领域本体 数字图书馆 本体学习 双语术语抽取 层次关系生成 
跨语言文本分类技术研究进展被引量:5
《情报理论与实践》2010年第11期126-128,104,共4页高影繁 王惠临 徐红姣 
"十一五"国家科技支撑计划项目(项目编号:2006BAH03B02);博士后科学基金(项目编号:20090450465);中国科学技术信息研究所预研基金(项目编号:YY-200908)资金支持
本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求;从关键技术出发,了解该项技术的核心问题及解决方案;从已有研究成果得到的结论揭示了该项技术的发展状况,作为一种重...
关键词:跨语言文本分类 特征提取 算法 
一种基于泊松估计的可控特征选择算法
《情报学报》2010年第3期408-413,共6页高影繁 王惠临 
“十一五”国家科技支撑计划重点项目(2006BAH03B02); 国家社科基金项目(06BTQ030)支持
特征选择是文本分类的关键技术之一。本文提出一种基于泊松估计的可控特征选择算法,该算法以基于泊松假设估算的文档频率作为衡量特征语义信息的依据,以通信领域中的信息率失真理论作为可控特征选择的思想来源。在Reuters-21578新闻语...
关键词:泊松估计 语义特征 率失真理论 可控特征选择 
关于建立中国国家科学技术语料库的思考被引量:3
《图书情报工作》2010年第6期102-106,共5页张东 王惠临 
"十一五"国家科技支撑计划项目"多语言信息服务环境关键技术研究与应用"(项目编号:2006BAH03B02)研究成果之一
论述当前语料库建设的最新发展趋势以及建立我国大规模、国家级科学技术语料库对应用于科技信息领域的自然语言处理技术、知识技术等智能信息技术研究发展的意义和重要性,探讨国家科技语料库的建设目标、设计原则、加工功能、组成结构...
关键词:自然语言处理 科学技术语料库 句法树库 语料标注 
基于主题聚类的学科研究热点及其趋势监测方法被引量:20
《情报学报》2010年第2期342-349,共8页章成志 梁勇 
本研究受“十一五”国家科技支撑计划重点项目(2006BAH03B02);中国博士后科学基金资助项目(20080430463);南京理工大学科研启动基金项目(AB41123)资助.
常规的学科热点及趋势监测方法存在监测成本高、监测信息相对滞后等问题。因此需要寻求较低成本、较快速的方法进行学科热点和趋势的监测,以保证监测系统提供信息的时效性。本文以图书情报档案学科为例,依据学科学术论文全文,从主题...
关键词:学科热点监测 主题聚类 主题抽取 文本聚类 
基于集成学习的自动标引方法研究被引量:5
《中国索引》2009年第2期16-23,共8页章成志 
“十一五”国家科技支撑计划重点项目(2006BAH03B02);中国博士后科学基金资助项目(20080430463);南京理工大学科研启动基金项目(AB41123)资助
目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式...
关键词:自动标引 关键词提取 集成学习 
基于双向标注融合的汉语最长短语识别方法被引量:9
《智能系统学报》2009年第5期406-413,共8页鉴萍 宗成庆 
国家自然科学基金资助项目(60736014;90820303);"十一五"国家科技支撑计划项目(2006BAH03B02);国家"863"计划资助项目(2006AA010108-4);中国新加坡数字媒体研究院资助项目
汉语最长短语(最长名词短语和介词短语)具有显著的语言学特点.采用基于分类器的确定性标注方法进行双向标注,其结果能够显示最长短语识别在汉语句子正(由左至右)反(由右至左)2个方向上的互补性.基于此,利用确定性的双向标注技术来识别...
关键词:最长名词短语识别 介词短语识别 序列标注 双向标注 分歧点 
基于可比语料库的双语术语抽取研究述评被引量:6
《现代图书情报技术》2009年第10期7-13,共7页康小丽 章成志 王惠临 
"十一五"国家科技支撑计划重点项目"多语言信息服务环境关键技术研究"(项目编号:2006BAH03B02);中国博士后科学基金特别资助项目"多语领域本体学习研究"(项目编号:200801105);中国博士后科学基金面上资助项目"多语领域本体学习关键技术研究"(项目编号:20080430463)的研究成果之一
对基于平行语料库的双语术语抽取和基于可比语料库的双语术语抽取进行对比分析,说明基于可比语料库的双语术语抽取的研究意义与应用价值。分析总结解决该问题的主要方法及其优化方法,指出存在的问题并展望该研究的未来发展方向。
关键词:双语术语抽取 可比语料库 上下文向量 向量相似度计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部