国家自然科学基金(60435020)

作品数:87被引量:1311H指数:17
导出分析报告
相关作者:王晓龙刘挺李生刘远超关毅更多>>
相关机构:哈尔滨工业大学北京大学复旦大学哈尔滨理工大学更多>>
相关期刊:《高技术通讯》《电机与控制学报》《模式识别与人工智能》《山东大学学报(理学版)》更多>>
相关主题:自然语言处理中文信息处理信息检索计算机应用知网更多>>
相关领域:自动化与计算机技术电子电信生物学理学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于词汇链的关键短语抽取方法的研究被引量:14
《计算机学报》2010年第7期1246-1255,共10页刘铭 王晓龙 刘远超 
国家自然科学基金重点项目(60435020);国家"八六三"高技术研究发展计划目标导向类课题(2006AA01Z197;2007AA01Z172)资助~~
文中提出一种基于词汇链的关键短语抽取算法,算法首先通过构造多条词汇链来表达文章的多条叙事线索,并从多条词汇链中抽取富含主题信息的强链代表文章着重叙述的信息,然后从强链中选取能够从不同侧面充分表达强链所述信息的短语作为文...
关键词:词汇链 知网 中心词聚类 关键短语 词义获取 
A conditional random fields approach to Chinese pinyin-to-character conversion被引量:1
《通讯和计算机(中英文版)》2009年第4期25-31,共7页LI Lu WANG Xuan WANG Xiao-long YU Yan-bing 
Acknowledgements: This research was partially supported by the National Natural Science Foundation of China (No. 60435020 and No. 90612005), the Goal-oriented Lessons from the National 863 Program of China (No.2006AA01Z197) and Project of Microsoft Research Asia.
关键词:随机场 汉语拼音 字符转换 特征空间 
一种大规模高维数据快速聚类算法被引量:18
《自动化学报》2009年第7期859-866,共8页刘铭 王晓龙 刘远超 
国家高技术研究发展计划(863计划)(2006AA01Z197;2007AA01Z172);国家自然科学基金(60435020)资助~~
提出了一种面向大规模高维数据的自组织映射聚类算法.算法通过压缩神经元的特征集合,仅选择与神经元代表的文档类相关的特征构造神经元的特征向量,从而减少了聚类时间.同时由于选取的特征能够将映射到不同神经元的文档类进行有效区分,...
关键词:向量压缩 神经元合并 类内相似度 类间区分度 
查询扩展在开放领域问答系统中的应用
《计算机应用与软件》2009年第7期1-2,13,共3页李波 邱锡鹏 曹均阔 
国家自然科学基金项目(60435020)
文档检索是问答式检索系统的重要组成部分,它提供了整个系统进行答案抽取等后续处理的基础。查询扩展是一种能有效地改进文档检索性能的常用方法。FDUQA在检索模块中结合自然语言处理技术,引入了查询扩展功能。实验证明,通过在开放领域...
关键词:问答系统 自然语言处理 查询扩展 
基于语义的高维数据聚类技术被引量:6
《电子学报》2009年第5期925-929,共5页刘铭 王晓龙 刘远超 
国家自然科学基金重点项目(No.60435020);国家863高技术研究发展计划(No.2006AA01Z197;No.2007AA01Z172)
本文提出一种有效处理高维数据的聚类算法,算法首先通过构造特征链将文档集合划分为多个类别,同时在相似度计算及权值调整时考虑相似特征的影响以凝聚语义相似的文档,并动态调整文档权重使分布不平衡的文档得到充分训练.实验表明:该算...
关键词:语义相似度计算 自组织映射 特征链 权值调整 
开放领域的QA系统结构及性能分析
《模式识别与人工智能》2009年第4期527-531,共5页杜永萍 黄萱菁 
国家自然科学基金重点项目(No.60435020);国家自然科学基金青年基金项目(No.60803086)资助
开放领域的问题回答(QA)是近年来自然语言处理研究领域的一个热门研究方向.文中介绍基于模式匹配策略的问题回答系统,并对其进行深层次的性能分析与评价,讨论检索参数和训练样例数目对系统性能的影响.同时,进行t-test来检验不同因素对...
关键词:问题回答 性能分析 自然语言处理 
主题分析技术在文档聚类中的应用被引量:2
《哈尔滨工业大学学报》2009年第3期53-57,共5页刘铭 刘远超 王晓龙 
国家自然科学基金重点资助项目(60435020);国家高技术研究发展计划资助项目(2006AA01Z1972007AA01Z172)
为解决高频特征对文章的主题信息反映不够全面,无法获得高质量聚类结果的问题,同时为获得聚类后各类别反映信息的精确描述,采用词汇链反映文章所描述的主题信息,并依据文本间词汇链的相似度进行聚类.将聚类后属于同一类别并反映相同主...
关键词:知网 词汇链融合 主题层次聚类 
基于线索词识别和训练集扩展的中文问题分类被引量:6
《高技术通讯》2009年第2期111-118,共8页张志昌 张宇 刘挺 李生 
863计划(2006AA012145);国家自然科学基金(60435020,60503072)资助项目
针对问题分类的数据稀疏问题,提出了一种以疑问词和焦点词为关键线索的中文事实型问题分类方法。该方法首先自动识别用户提出的问题中的疑问词和焦点词,若疑问词和焦点词存在,则用最近邻模型进行分类,而对没有用最近邻方法分类的其他问...
关键词:问题分类 焦点词 词义距离 训练集扩展 
基于语法分析和统计方法的答案排序模型被引量:6
《中文信息学报》2009年第2期23-27,47,共6页李波 高文君 邱锡鹏 
国家自然科学基金资助项目(60435020)
该文描述了一种构建问答式检索系统中答案排序模型的新方法。该方法结合了基于密度方法的度量特征和外部知识库,并且引入了基于语法分析方法的语法关键路径的新特征,使用支持向量机回归模型训练评估函数。实验证明,引入了上述语法关键...
关键词:计算机应用 中文信息处理 自动问题回答 语法关键路径 答案排序 支持向量机 
基于主题分析的文本分割技术研究被引量:6
《电子学报》2009年第2期278-284,共7页刘铭 王晓龙 刘远超 
国家自然科学基金重点项目(No.60435020);国家863高技术研究发展计划项目(No.2006AA01Z197;No.2007AA01Z172)
本文提出一种新颖的文本分割算法,算法首先将待分割文档划分为若干片段的集合,然后构造全文词汇链分析文中描述的多个子主题,并通过构造片段对子主题的覆盖图将描述相同子主题的相似片段归类.针对段落分割点可能落在片段内部的情况,算...
关键词:主题分析 词汇链 知网 二次划分 
检索报告 对象比较 聚类工具 使用帮助 返回顶部