SPARK

作品数:1925被引量:5216H指数:24
导出分析报告
相关领域:自动化与计算机技术交通运输工程机械工程更多>>
相关作者:朱永利梁毅于炯胡峰熊安萍更多>>
相关机构:北京邮电大学中国科学院大学重庆邮电大学华中科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划河北省自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机系统应用x
条 记 录,以下是1-10
视图:
排序:
场站飞行保障数据可视化平台设计与应用被引量:1
《计算机系统应用》2023年第5期67-76,共10页刘君阳 朱世松 
军内科研重点项目(BKJ19C025)。
为提升航空兵场站信息化建设过程中的数据应用与管理能力,提出了一种基于Spark的场站飞行保障大数据可视化平台.以场站信息化系统和物联网络数据采集数据为基础,利用Spark计算引擎集成Kafka消息队列,使用Hive完成数据列表库的建立和存储...
关键词:飞行保障 大数据 大数据处理平台 数据可视化 SPARK 态势感知 数据分析 
Spark效用感知的检查点缓存并行清理策略
《计算机系统应用》2022年第4期253-259,共7页宋一鑫 于俊洋 何欣 王锦江 
河南省科技研发项目(212102210078)。
针对Spark检查点缓存数据清理需要等待作业运行完成后由编程人员清理,可能导致产生失效数据累积占用内存问题,本文分析检查点执行机制,建模推导出随着检查点数量增多,检查点缓存清理方法不可扩展,提出使用检查点缓存效用熵模型感知检查...
关键词:缓存清理 SPARK 效用熵 失效检查点 并行清理 大数据 
基于节点负载的数据动态分区
《计算机系统应用》2021年第12期299-307,共9页孟令伍 杨阳朝 黄晓明 练丽萍 
一种基于节点负载的数据动态分区系统,主要考虑节点CPU、内存、带宽负载情况,首先采用二次平滑法预测节点的负载,再结合AHP和熵值指标权重法得到每个节点的处理能力,最后针对不同应用场景动态地调整系统的负载均衡性,提高应用的响应速度...
关键词:负载均衡 动态分区机制 SPARK Elasticsearch 
基于Apache Spark的地震观测数据噪声功率谱计算被引量:2
《计算机系统应用》2021年第8期126-132,共7页郭凯 黎建辉 温亮明 韩振华 
国家重点研发计划(2018YFC1504500);中国地震局监测、预报、科研三结合课题(3JH-20200207)。
为解决单机环境下海量地震观测数据计算和分析效率低下的问题,提出一种基于分布式架构的地震观测数据的存储、计算和分析处理方法,选择噪声功率谱复杂计算过程的应用场景进行实现.基于Hadoop在海量数据处理上的性能优势,在分布式文件存...
关键词:地震观测数据 噪声功率谱 SPARK HADOOP 分布式 
基于流量摘要的僵尸网络检测被引量:4
《计算机系统应用》2021年第8期186-193,共8页肖喜生 龙春 杜冠瑶 魏金侠 赵静 万巍 
国家重点研发计划网络空间安全重点专项(2017YFB0801902);中国科学院“十四五”网信专项先期建设项目(WX145XQ11)。
随着僵尸网络的日益进化,检测和防范僵尸网络攻击成为网络安全研究的重要任务.现有的研究很少考虑到僵尸网络中的时序模式,并且在实时僵尸网络检测中效果不佳,也无法检测未知的僵尸网络.针对这些问题,本文提出了基于流量摘要的僵尸网络...
关键词:僵尸网络 机器学习 SPARK 流量摘要 
基于Spark的航空信息服务平台
《计算机系统应用》2021年第4期77-81,共5页颜廷龙 李瑛 王凤芹 
针对大数据时代下,海军航空部队存在的种种数据治理问题,设计了一种基于Spark的航空信息服务平台,平台实现了航空数据的存储,分析与挖掘等功能.平台采用4层体系架构,使用了HDFS分布式文件存储框架和Hive数据仓库工具实现了数据的存储和...
关键词:航空数据 SPARK 大数据 数据管理 数据仓库 
面向股票交易分析场景的流式大数据系统测试框架被引量:1
《计算机系统应用》2020年第4期76-83,共8页史凌云 郑莹莹 谭励 许利杰 王伟 魏峻 
北京市自然科学基金(4172013);北京市自然科学基金-海淀原始创新联合基金(L182007);国家自然科学基金(61802377,61702020)及其配套项目(PXM2018_014213_000033);国家重点研发计划(2016YFD0401104)。
分布式集群环境使得数据实时计算更为复杂,流式大数据处理系统的正确性难以保障.现有的大数据基准测试框架可以测试流式大数据处理系统的性能表现,但是普遍存在应用场景设计简单、评价指标不充分等不足.针对这一挑战,本文构造了一个面...
关键词:流式大数据处理 系统性能 基准测试 APACHE SPARK STREAMING 
基于Spark的出租车轨迹处理与可视化平台被引量:3
《计算机系统应用》2020年第3期64-72,共9页杨卫宁 邹维宝 
长安大学研究生科研创新实践项目(300103002086)。
大数据技术在分析与挖掘交通大数据方面扮演着越来越重要的角色.为了快速有效地对出租车的运营模式与载客策略进行分析,设计效益指数模型对出租车效益进行量化排序,以高效益出租车为研究对象,基于Spark大数据框架开发一个轨迹数据处理...
关键词:出租车轨迹 大数据 SPARK 可视化 城市交通 
基于Spark并行化改进混合地点推荐被引量:1
《计算机系统应用》2019年第10期86-91,共6页蒲鑫 孟祥茹 高岑 王美吉 刘锦扬 
推荐算法是数据挖掘中最重要的算法之一.地点推荐是推荐系统的重要研究内容.针对目前地点推荐面临的数据稀疏、冷启动、个性化程度低等问题,设计并实现了基于Spark并行化处理的改进混合地点推荐模型.该算法融合了基于内容的推荐和基于...
关键词:地点推荐 混合模型 数据填充 协同过滤 SPARK 
基于Spark的改进蚁群算法对带时间窗车辆路径问题的求解被引量:8
《计算机系统应用》2019年第7期9-16,共8页李奕颖 秦刚 
为应对大数据时代对带时间窗车辆路径问题(VRPTW)的实时求解要求,提出基于Spark平台的改进蚁群算法.在算法层面,利用改进的状态转移规则和轮盘赌选择机制构建初始解,结合k-opt邻域搜索进行路径构建优化,改进最大最小蚁群算法中的信息素...
关键词:带时间窗车辆路径问题 Spark平台 蚁群算法 邻域搜索 
检索报告 对象比较 聚类工具 使用帮助 返回顶部