SPARK

作品数:1925被引量:5216H指数:24
导出分析报告
相关领域:自动化与计算机技术交通运输工程机械工程更多>>
相关作者:朱永利梁毅于炯胡峰熊安萍更多>>
相关机构:北京邮电大学中国科学院大学重庆邮电大学华中科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划河北省自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用研究x
条 记 录,以下是1-10
视图:
排序:
基于Spark Streaming的海量GPS数据实时地图匹配算法
《计算机应用研究》2024年第5期1338-1342,共5页陈艳艳 李四洋 张云超 
国家重点研发计划资助项目(2022YFB2602104)。
浮动车GPS数据作为交通信息处理的基础,随着被监控车辆数量的高速增长,产生了海量GPS数据,对地图匹配提出了挑战。为了解决传统匹配方法难以满足匹配效率和精度的不足,提出一种针对海量GPS数据的实时并行地图匹配算法,能够同时保证较高...
关键词:海量 GPS 并行计算 地图匹配 实时计算 SPARK 
基于互信息和融合加权的并行深度森林算法被引量:1
《计算机应用研究》2024年第2期473-481,共9页毛伊敏 李文豪 
广东省重点领域研发计划资助项目(2022B0101020002);广东省重点提升项目(2022ZDJS048)。
针对大数据环境下并行深度森林算法中存在不相关及冗余特征过多、多粒度扫描不平衡、分类性能不足以及并行化效率低等问题,提出了基于互信息和融合加权的并行深度森林算法(parallel deep forest algorithm based on mutual information ...
关键词:Spark框架 并行深度森林 互信息 负载均衡 
基于Spark和NRSCA策略的并行深度森林算法
《计算机应用研究》2024年第1期126-133,共8页毛伊敏 刘绍芬 
广东省重点提升项目(2022ZDJS048);韶关市科技项目(220607154531533);科技创新2030-“新一代人工智能”重大项目(2020AAA0109605)。
针对并行深度森林在大数据环境下存在冗余及无关特征过多、两端特征利用率过低、模型收敛速度慢以及级联森林并行效率低等问题,提出了基于Spark和NRSCA策略的并行深度森林算法——PDF-SNRSCA。首先,该算法提出了基于邻域粗糙集和Fisher ...
关键词:并行深度森林算法 Spark框架 邻域粗糙集 正弦余弦算法 多粒度扫描 
基于Spark和AMPSO的并行深度卷积神经网络优化算法被引量:3
《计算机应用研究》2023年第10期2957-2966,共10页刘卫明 罗全成 毛伊敏 彭喆 
科技创新2030-“新一代人工智能”重大项目(2020AAA0109605);广东省重点提升项目(2022ZDJS048);韶关市科技计划资助项目(220607154531533)。
针对并行DCNN算法在大数据环境下存在冗余参数过多、收敛速度慢、容易陷入局部最优和并行效率低的问题,提出了基于Spark和AMPSO的并行深度卷积神经网络优化算法PDCNN-SAMPSO。首先,该算法设计了基于卷积核重要性和相似度的卷积核剪枝策...
关键词:并行DCNN算法 Spark框架 PDCNN-SAMPSO算法 负载均衡策略 
基于Spark的大规模网络结构发现算法
《计算机应用研究》2021年第2期409-413,共5页柴变芳 欧朋成 胡吉朝 
国家自然科学基金资助项目(61503260);河北省自然科学基金资助项目(F2019403070)。
当今社会处于大数据时代,现实中的网络数据越来越多,其结构复杂、规模庞大,有效分析其结构对了解、应用其提供的信息具有重要作用。基于混合模型的网络结构发现算法可挖掘网络中的多类型聚类结构,但不能有效处理大规模网络。基于Graph ...
关键词:大规模网络 网络结构发现 并行图计算 SPARK 
基于Spark的转录组大数据并行处理方法被引量:2
《计算机应用研究》2020年第S02期176-180,共5页于建涛 刘圣东 赖灵伟 吕同轩 王嘉浩 高小雨 惠毅翔 侯君瑶 殷童 郭茂祖 
国家自然科学基金资助项目(61532014,61571163);大学生创新创业训练计划资助项目(201810712092);陕西省引进博士专项配套经费资助项目;西北农林科技大学基本科研业务费专项资金资助项目(2452015060)
转录组大数据RNA-seq是考察基因表达、研究生命规律的重要来源。分析转录组的序列比对软件TopHat及统计分析软件Cufflinks常见于在单机上以串行方式运行,或者基于分布式计算框架MapReduce在Hadoop集群上以并行方式运行,尚未见其部署于Sp...
关键词:Spark集群 并行处理 转录组 序列比对 差异表达 
Spark中一种高效RDD自主缓存替换策略研究被引量:4
《计算机应用研究》2020年第10期3043-3047,共5页魏赟 丁宇琛 
国家自然科学基金资助项目(61170277,61472256);上海市科委科研计划资助项目(16111107502)。
由于并行计算框架Spark缓存替换算法的粗糙性,LRU(least recently used)算法并未考虑RDD的重复使用导致易把高重用数据块替换出内存且作业执行效率较低等问题。通过优化权重模型和改进替换策略,提出了一种高效RDD自主缓存替换策略(effic...
关键词:SPARK 弹性分布式数据集 缓存替换 内存资源利用 
基于Spark的并行社区发现算法被引量:1
《计算机应用研究》2020年第8期2255-2260,共6页刘东江 黎建辉 
国家重点研发计划资助项目(2016YFB1000600);中国科学院战略性先导科技专项资肋项目(XDA06010307)。
针对大规模图数据顶点聚类进行研究,提出了一种基于Spark的并行社区发现算法,其在基于极值优化的串行社区发现算法的基础上设计而成。此外还针对该串行算法在簇调整时因选择顶点数量过少而影响算法运行效率的问题,提出了一种多个顶点选...
关键词:社区发现 SPARK 并行算法 图聚类 图数据 
Spark环境下K-means初始中心点优化研究综述被引量:9
《计算机应用研究》2020年第3期641-647,共7页行艳妮 钱育蓉 南方哲 赵京霞 
国家自然科学基金资助项目(61562086,61462079,61966035);新疆维吾尔自治区教育厅创新团队资助项目(XJEDU2016S035);自治区研究生创新项目(XJ2019G072,XJ2019G069,XJ2019G071)。
为了能够及时了解Spark环境下经典聚类算法K-means的最新研究进展,把握K-means算法当前的研究热点和方向,针对K-means算法的初始中心点优化研究进行综述。首先介绍了内存计算框架Spark和K-means算法,并分析了K-means算法聚类不稳定性的...
关键词:K-均值算法 分布式内存计算框架 算法优化 聚类算法 
基于Spark的改进K-means算法的并行实现被引量:13
《计算机应用研究》2020年第2期434-436,497,共4页杜佳颖 段隆振 段文影 卜秋瑾 
国家自然科学基金资助项目(61070139,81460769).
针对K-means聚类算法存在的不足,提出了改进K-means来提高算法的性能,利用简化后的轮廓系数作为评估标准衡量K-means算法中k值,采用K-means++完成K-means算法初始中心点的选择。设置好k值以及初始中心点后使用形态学相似距离作为相似度...
关键词:聚类算法 简化轮廓系数 形态学相似距离 相似性度量 
检索报告 对象比较 聚类工具 使用帮助 返回顶部