数据预处理

作品数:2321被引量:8681H指数:33
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:俞俊牛玉贞肖甫丁宇吕琛更多>>
相关机构:天津大学电子科技大学东南大学浙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机科学x
条 记 录,以下是1-10
视图:
排序:
文档级关系抽取技术研究综述被引量:4
《计算机科学》2023年第5期189-200,共12页祝涛杰 卢记仓 周刚 丁肖摇 王凌 朱秀宝 
河南省自然科学基金(222300420590)。
关系抽取是信息抽取研究的重要方向,已逐步从句子级扩展到了文档级。与句子相比,文档通常蕴含更多的关系事实,可为知识库构建、信息检索和语义分析等提供更多的信息支持。然而,文档级关系抽取复杂度更高,难度更大,目前缺乏较为系统全面...
关键词:信息抽取 文档级关系抽取 数据预处理 数据集 性能评价 
基于注意力机制的糖尿病视网膜病变分类算法被引量:3
《计算机科学》2022年第S02期377-381,共5页孙福权 邹彭 崔志清 张琨 
国家重点研发计划(2018YFB1402800);河北省高教研究与实践项目(2018GJJG422)
糖尿病视网膜病变是糖尿病的重要并发症之一,是工作人群失明的主要原因。视网膜图像类间差距小,易混淆,由于医疗资源不足和缺乏有经验的眼科医生,难以进行大规模的视网膜图像筛查。为此,提出了一种基于注意力机制的糖尿病视网膜病变分...
关键词:深度学习 糖尿病视网膜病变分类 注意力机制 数据预处理 迁移学习 
基于代价敏感卷积神经网络的非平衡问题混合方法被引量:4
《计算机科学》2021年第9期77-85,共9页黄颖琦 陈红梅 
国家自然科学基金(61976182,62076171);四川省国际科技创新合作重点项目(2019YFH0097)
非平衡问题是数据挖掘领域中普遍存在的一个问题,数据的偏态分布会使得分类器的分类效果不理想。卷积神经网络作为一种高效的数据挖掘工具,被广泛应用于分类任务,但其训练过程若受到数据非平衡的不利影响,则将导致少数类的分类准确率下...
关键词:非平衡问题 卷积神经网络 过采样 数据预处理 代价敏感损失函数 
面向无线传感网络应用的改进LZW算法被引量:5
《计算机科学》2020年第5期260-264,共5页倪晓军 佘戌豪 
在无线传感网络通信中,传感器数据需要通过无线设备发送给上位机。随着终端传感器传输数据量的增大,无线设备的发送能耗逐渐加大。在不便于及时维护的复杂环境中,这将导致无线通讯设备过早失效从而使得通讯中断。因此需要先将传感器采...
关键词:无线传感网络 压缩算法 LZW算法 数据预处理 压缩率 
边缘计算构架下基于孤立森林算法的DoS异常检测被引量:21
《计算机科学》2020年第2期287-293,共7页陈佳 欧阳金源 冯安琪 吴远 钱丽萍 
国家自然科学基金(61572440);浙江省自然科学基金(LR16F010003,LR17F010002)~~
随着网络技术的快速发展,网络攻击带来了极大的负面影响,因此网络安全问题亟待解决。针对网络攻击中的拒绝服务(Denial of Service,DoS)攻击,提出了一种基于边缘计算框架的孤立森林网络异常检测方法。该方法根据每个边缘节点的特性实现...
关键词:异常检测 边缘计算 孤立森林 DOS攻击 数据预处理 
重复数据中关键属性值缺失填补的改进ROUSTIDA算法被引量:4
《计算机科学》2019年第2期30-34,共5页樊哲宁 杨秋辉 翟宇鹏 万莹 王帅 
随着数据分析研究的兴起,数据预处理越来越得到研究者的重视,其中缺失数据填补问题的重要性也逐渐显现。在ROUSTIDA数据补齐算法的基础上,针对具有关键属性的重复数据的特点,文中提出了一种改进的ROUSTIDA算法——Key&Rpt_RS算法。Key&R...
关键词:数据预处理 重复数据 缺失填补 ROUSTIDA算法 
向量数学库的向量化方法研究被引量:10
《计算机科学》2019年第1期320-324,共5页周蓓 黄永忠 许瑾晨 郭绍忠 
面向100P高效能计算机的基础数学库系统项目;国家重点研发计划"高性能计算"重点专项:E级计算机关键技术验证系统(2016YFB0200503)资助
SIMD技术的出现使得基础数学库扩展到向量数学库成为必然趋势。基础数学库中多数函数存在代码实现复杂、分支判断多的特点,增加了向量化的难度,同时SIMD指令的不完备导致函数中的部分功能无法直接向量化,频繁的拆分和拼接操作降低了函...
关键词:SIMD技术 向量数学库 核心代码段 数据预处理 指令向量化 
带弱通配符的模式匹配及其在时序分析中的应用被引量:1
《计算机科学》2018年第1期103-107,共5页檀朝东 闵帆 吴霄 李欣伦 
国家自然科学基金(61379089)资助
针对模式匹配的准确性和灵活性问题,提出了一种基于弱通配符的匹配算法,以快速定位重要的时间点,辅助用户决策。首先通过数据预处理得到编码字符串序列,然后定义具有特殊语义的弱通配符及区间长度,最后设计一种高效的模式匹配算法。在...
关键词:模式匹配 时间序列 弱通配符 数据预处理 
基于词频统计规律的文本数据预处理方法被引量:12
《计算机科学》2017年第10期276-282,288,共8页池云仙 赵书良 罗燕 高琳 赵骏鹏 李超 
国家自然科学基金项目(71271067);国家社科基金重大项目(13&ZD091);河北省高等学校科学技术研究项目(QN2014196);河北师范大学硕士基金(xj2015003)资助
在大数据时代,文本挖掘面临特征的"高维-稀疏"问题,海量文本词汇与稀少关键特征间的矛盾导致了高时空复杂度和低效率等问题,严重制约了文本挖掘效率,因此在文本挖掘前进行有效的数据预处理至关重要。传统文本挖掘算法在数据预处理阶段...
关键词:大数据 文本挖掘 数据预处理 词频统计 
一种缓解分类面交错的样本点扩散方法
《计算机科学》2017年第9期286-289,295,共5页梁路 龚奔龙 黎剑 滕少华 
国家863计划重大项目(2013AA01A212);国家自然科学基金资助项目(6127206761104156;61402118);广东省自然科学基金(9451009001002777)资助
固定的相似性度量使得学习器无法结合先验信息揭示数据本身固有的统计规律,对于分类面交错严重的数据集,难以取得较好的学习效果。为了缓解分类面交错,提高分类准确度,将边界和样本点扩散结合起来,通过统计样本标签信息和位置信息得到...
关键词:度量学习 样本点扩散 数据预处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部