国家自然科学基金(60373095)

作品数:29被引量:299H指数:11
导出分析报告
相关作者:林鸿飞杨志豪赵晶黄德根叶正更多>>
相关机构:大连理工大学朝阳师范高等专科学校吉林市教育局北京大学更多>>
相关期刊:《智能系统学报》《中文信息学报》《计算机工程与应用》《控制与决策》更多>>
相关主题:中文信息处理文本分类计算机应用支持向量机向量空间模型更多>>
相关领域:自动化与计算机技术文化科学医药卫生理学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于ChunkCRF的观点持有者识别及其在观点摘要中的应用被引量:2
《小型微型计算机系统》2009年第7期1462-1466,共5页宋锐 洪莉 林鸿飞 
国家自然科学基金项目(60373095,60673039)资助;国家“八六三”高科技计划项目(2006AA01Z151)资助;教育部留学回国人员科研启动基金项目资助
含有观点的文档中准确识别出观点的持有者是预处理步骤.通过建立ChunkCRF模型对观点表达句进行观点持有者的识别;对于同一个观点句中含有多个观点持有者的情况,借助语言学手段进行预处理,再利用模型进行观点持有者识别.在此基础上还进...
关键词:ChunkCRF 观点持有者识别 观点摘要 观点倾向性分析 
基于支持向量机的生物医学文献蛋白质关系抽取被引量:20
《智能系统学报》2008年第4期361-369,共9页杨志豪 洪莉 林鸿飞 李彦鹏 
国家自然科学基金资助项目(60373095,60673039);国家“863”高科技计划资助项目(2006AA01Z151)
从生物医学文献中抽取蛋白质(基因)交互作用关系对蛋白质知识网络的建立、蛋白质关系的预测以及新药的研制等均具有重要的意义.提出了一种基于支持向量机(SVM)的蛋白质(基因)交互作用关系抽取方法.该方法除了选取词项特征、关键词特征...
关键词:关系抽取 链接语法 支持向量机 
基于改进编辑距离和依存文法的汉语句子相似度计算被引量:22
《计算机应用与软件》2008年第7期33-34,47,共3页刘宝艳 林鸿飞 赵晶 
国家自然科学基金资助项目(60373095)
句子相似度计算在中文自然语言处理领域有着广泛的应用背景。要准确地刻画一个句子所表达的意思,必须深入到语义层面级并结合语法结构信息,提出了一种基于改进编辑距离和依存文法的汉语句子相似度计算方法。依存文法考虑到句子内部的结...
关键词:相似度计算 依存文法 改进编辑距离 句法分析 
基于用户聚类的电子商务推荐系统被引量:15
《计算机应用与软件》2008年第4期25-26,共2页潘宇 林鸿飞 杨志豪 
国家自然科学基金资助项目(60373095)
协同过滤是推荐系统中采用最为广泛和成功的推荐技术,但随着电子商务系统用户数目和商品数目的增加,在整个用户空间上搜索目标用户的最近邻居的耗时也急剧增加,导致系统性能下降。提出了一种基于用户项目类偏好值矩阵聚类的合作推荐方法...
关键词:电子商务 推荐系统 协同过滤 聚类 
基于文本挖掘机制的区域经济关系分析被引量:5
《情报学报》2008年第3期418-424,共7页丁堃 刘盛博 许侃 
本文得到国家自然科学基金项目(编号:60373095,60673039)的资助.
已有的经济关系研究大都采用实证的或单纯的计量学的方法来实现的。本文则针对非结构化的文本特点,采用信息抽取和文本挖掘方法挖掘用户感兴趣的区域经济关系是具有十分重大应用价值的研究课题。本文在探讨了基于实体关系的文本挖掘机...
关键词:文本挖掘 同义扩充 实体关系 关系标注 聚类分析 区域经济 
基于粗糙集理论的不完备数据填补方法被引量:14
《计算机工程与应用》2008年第6期175-177,共3页孟军 刘永超 莫海波 
国家自然科学基金(the National Natural Science Foundation of Chinaunder Grant No.60373095)。
ROUSTIDA算法具有较好的数据填补能力,但依然会出现一些不完备信息。利用了可扩充辨识所反映的对象间的属性差异信息,对遗失属性进行填充,从而使改进后的ROUSTIDA算法的填充能力得到了很大的改善,同时还具备了初步排除噪声数据的能力,...
关键词:粗糙集 相似关系 扩充辨识矩阵 
基于网页框架和规则的网页噪音去除方法被引量:17
《计算机工程》2007年第19期276-278,共3页时达明 林鸿飞 杨志豪 
国家自然科学基金资助项目(60373095)
提出了一种基于网页框架和规则的网页去除噪音的新方法,该方法根据网页中HTML标签将网页分成若干部分,对各个table的长宽比属性进行比较,去掉长宽比很大的部分,并对其余table中的内容进行分析,根据内部是否存在和段落文字有关的...
关键词:信息检索 网页噪音 页面框架 
生物医学文本分类方法比较研究被引量:3
《计算机工程与应用》2007年第12期147-149,172,共4页倪茂树 赵晶 林鸿飞 
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60373095)。
文本分类技术对处理海量的生物医学文献起着重要的作用。TREC(The Text Retrieval Conference)2005 Genomics Track的测评结果显示,支持向量机(Surport Vector Machine,SVM)在生物医学文本分类问题上,比其他模型具有明显的优势。在TREC...
关键词:文本分类 支持向量机 简单向量距离分类 命名实体识别 
基于问句相似度的中文FAQ问答系统被引量:14
《计算机工程与应用》2007年第9期161-163,248,共4页叶正 林鸿飞 杨志豪 
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60373095)。
常见问题(FAQ)问答系统是一种在已有的“问题—答案”对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的问答式检索系统。其关键问题是用户提出问句与FAQ库中问句进行相似度计算,找出FAQ库中最相近的问句,并返回事先存...
关键词:问句相似度 语义相似度 常见问题集 向量空间模型 
基于内容计算和链接分析的Web话题跟踪方法被引量:3
《情报学报》2007年第4期555-560,共6页宋丹 林鸿飞 杨志豪 
国家自然科学基金资助项目(编号:60373095).
话题跟踪属于话题识别与跟踪(TDT)的一项子任务,是一种基于事件的信息组织技术.话题跟踪任务就是根据某一话题的训练报道,在后续报道中找出讨论该话题的所有报道.虽然传统的基于内容计算的话题跟踪方法也可以应用于Web话题跟踪,但它...
关键词:话题跟踪 链接分析 内容计算