陶晓鹏

作品数:19被引量:167H指数:4
导出分析报告
供职机构:复旦大学计算机科学技术学院更多>>
发文主题:文本分类KNN语义相似度全文索引信息检索更多>>
发文领域:自动化与计算机技术文化科学理学更多>>
发文期刊:《模式识别与人工智能》《计算机研究与发展》《软件学报》《计算机工程》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
客户评论中用户体验信息自动提取研究被引量:2
《计算机工程》2015年第1期49-53,60,共6页胡令传 陶晓鹏 
客户评论在人们的日常生活中越来越重要,人们希望从客户评论中获取商品的用户体验信息。客户评论数量的急剧增长使得用户快速、精准地获取有用的信息变得较为困难。为此,提出一种能够自动提取用户体验信息的方法。该方法通过语义片段过...
关键词:客户评论 特征挖掘 情感分析 语义片段提取 用户体验 语义相似度 
面向计算机专业的《信息论与编码》课程的教学探讨
《教育研究前沿(中英文版)》2013年第2期60-64,共5页陶晓鹏 
本文结合我们多年的教学实践,从八个方面讨论了《信息论与编码》课程的教学方法,即课程命名、教材、内容深度和广度、教学方式、考核方式、内容的严谨性和趣味性、内容的抽象性和实用性、实验设置。本文分析各种方法的利弊,提出了我...
关键词:信息论 编码 本科教学 教学改革. 
基于二值信任网络的推荐算法改进被引量:4
《计算机应用与软件》2012年第12期157-160,共4页林韶娟 陶晓鹏 
协同过滤算法根据用户项目评分数据进行推荐,但评分数据通常很稀疏,使得用户无法获得满意的推荐,尤其是新用户。而信任网络以及社交网络能提供用户之间的关系数据,可用于推荐算法中。基于二值信任网络,提出GenTrust算法预测新的信任关系...
关键词:推荐系统 协同过滤 二值信任网络 
利用同场景多幅图像进行图像降噪
《计算机应用与软件》2011年第8期265-269,共5页王恒 陶晓鹏 
提出一种利用同场景多幅图像作为输入来降低数码照片在高感光度下数码照片噪点的方法。该方法本质上基于按区块匹配加权平均值的方法。该方法在匹配区块的搜索过程中利用了计算机视觉中的追踪、变换等技术来减小搜索范围,从而大幅度降...
关键词:图像降噪 多幅图像 特征追踪 仿射变换 
基于维基百科的语义相似度计算方法被引量:15
《计算机工程》2011年第7期193-195,共3页盛志超 陶晓鹏 
针对目前语义计算准确率低、可理解性差的问题,提出一种基于维基百科的语义相似度计算方法。不同于利用分类信息计算词的语义相似度,该方法利用页面的链接信息,通过模仿人类联想的方式计算不同词之间的相似度,所得到的结果较容易被理解...
关键词:页面网 类别网 维基百科 人脑思维 
基于双排序互关联后继树的索引压缩和原文生成算法被引量:2
《计算机应用与软件》2010年第9期1-3,13,共4页杨茹 胡运发 陶晓鹏 
国家自然科学基金项目(60473070)
针对全文检索模型的研究,在双排序互关联后继树(DIRST)模型的基础上,进行了索引压缩,并在此基础上提出了一种新的原文生成算法。实验表明,DIRST模型的空间效率和时间效率都得到了显著的提高。
关键词:DIRST模型 索引压缩 原文生成 
XML数据的数值对象化及其转化算法被引量:1
《计算机工程》2010年第6期45-48,共4页曹小冲 胡运发 陶晓鹏 葛家翔 
XML数据的结构复杂且具有异构性,数据使用难度大,其文本内容特点使XML数据访问程序难以被有效维护。针对该问题提出数值对象化模型,使用相同算法对所有XML数据进行处理,将XML数据的使用问题转化为面向对象编程语言中的VO值对象处理问题...
关键词:XML数据 值对象 外层容器对象 内部成员对象 
基于特征选择及Condensing技术的文本取样
《模式识别与人工智能》2009年第5期709-717,共9页郝秀兰 陶晓鹏 王述云 徐和祥 胡运发 
国家自然科学基金资助项目(No.60736016)
作为一种基于实例的方法,k-近邻(kNN)分类器有大量的计算及存储需求.同时,训练数据分布的不均衡,也会导致kNN分类器的性能下降.针对这些缺陷,文中提出特征选择与Condensing技术相结合的取样方法,以达到下述目的.在减少kNN分类的计算量...
关键词:文本分类 k-近邻(kNN) 取样 特征选择 Condensing算法 
社团挖掘和话题监控的互动模型研究
《计算机应用》2009年第3期908-911,共4页杨茹 陶晓鹏 
社团挖掘是Web信息挖掘领域的重要应用,而话题监控是文本信息研究领域的重要应用,目前这两种技术是各自独立的。为更好地应用于互联网形成的复杂社会网络,将这两种技术结合起来研究,发现了社团和话题之间的关系,创建了社团挖掘和话题监...
关键词:社团挖掘 话题监控 互动模型 
kNN文本分类器类偏斜问题的一种处理对策被引量:33
《计算机研究与发展》2009年第1期52-61,共10页郝秀兰 陶晓鹏 徐和祥 胡运发 
国家自然科学基金重大项目(60736016)~~
类偏斜问题(class i mbalance problem)是数据挖掘领域的常见问题之一,人们提出了各种策略来处理这个问题.当训练样本存在类偏斜问题时,kNN分类器会将小类中的样本错分到大类,导致分类的宏F1指标下降.针对kNN存在的这个缺陷,提出了文本...
关键词:文本分类 KNN 类偏斜 文本训练集的临界点 权重调节 随机重取样 
检索报告 对象比较 聚类工具 使用帮助 返回顶部