SPARK

作品数:1925被引量:5216H指数:24
导出分析报告
相关领域:自动化与计算机技术交通运输工程机械工程更多>>
相关作者:朱永利梁毅于炯胡峰熊安萍更多>>
相关机构:北京邮电大学中国科学院大学重庆邮电大学华中科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划河北省自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机科学x
条 记 录,以下是1-10
视图:
排序:
基于混合内存的Apache Spark缓存系统实现与优化被引量:3
《计算机科学》2023年第6期10-21,共12页魏森 周浩然 胡创 程大钊 
之江实验室开放课题(K2022PI0AB01);湖北珞珈实验室专项基金资助项目(220100016)。
随着大数据时代数据规模的激增,内存计算框架得到了长足发展。主流内存计算框架Apache Spark使用内存来缓存中间结果,大幅度地提升了数据处理速度。同时,具有较快的读写速度和较大容量的非易失性存储器NVM在内存计算领域展现出了巨大的...
关键词:SPARK 缓存管理策略 NVM 混合内存 
基于Spark的舆情情感大数据分析集成方法被引量:12
《计算机科学》2021年第9期118-124,共7页戴宏亮 钟国金 游志铭 戴宏明 
国家社会科学基金项目(18BTJ029)
随着移动互联技术的不断发展,社交媒体成为了公众分享观点和抒发情感的主要平台,在重大社会事件下对社交媒体文本进行情感分析能够有效监控舆情。针对现有中文社交媒体情感分析算法的准确性能和运行效率较低的问题,提出了一种基于Spark...
关键词:情感分析 舆情 中文社交媒体 SPARK STACKING 
基于Spark的车联网分布式组合深度学习入侵检测方法被引量:9
《计算机科学》2021年第S01期518-523,共6页俞建业 戚湧 王宝茁 
国家重点研发计划政府间国际科技创新合作重点专项(2016YFE0108000);工业和信息化部网络安全技术应用试点示范项目:智能网联车路协同通信安全研究应用平台;江苏省重点研发计划(产业前瞻与共性关键技术)项目(BE2017163);江苏省交通运输科技项目(2018Y45)。
随着5G等技术在车联网领域中被广泛应用,入侵检测作为车联网信息安全重要的检测工具发挥着越来越重要的作用。由于车联网结构变化快,数据流量大,入侵形式复杂多样,传统检测方法无法确保其准确性和实时性要求,不能直接被应用到车联网。...
关键词:入侵检测 车联网 CNN LSTM Apache Spark 
面向预测性维护的工业设备管理系统被引量:15
《计算机科学》2020年第S02期667-672,677,共7页禹鑫燚 施甜峰 唐权瑞 殷慧武 欧林林 
国家重点研发计划(2018YFB1308400)。
为了解决制造业中工业设备管理混乱、维护成本高昂等问题,以工业机器人、数控车床等工业设备为管理对象,开发面向预测性维护的设备管理系统。基于SpringBoot框架和Vue前后端分离模式对系统进行开发,降低其耦合性;根据实际生产需求设计...
关键词:设备管理 SPARK 机器学习 大数据处理 预测性维护 
Spark平台中的并行化FP_growth关联规则挖掘方法被引量:5
《计算机科学》2020年第12期139-143,共5页朱岸青 李帅 唐晓东 
广州市专利技术产业化项目(201601010207);国家自然科学基金面上项目(61672077);国家重点研发计划(2017YFF0106407);2017国家自然科学基金青年基金项目(61702026)。
为了提高关联规则挖掘效率,文中提出了一种适用于Spark平台的并行化FP_growth关联规则挖掘方法。首先,利用Spark平台在分布式系统中的所有节点的内存RDD中完成遍历扫描运算,得到频繁集,以便生成FP_Table并更新FP_Tree。然后,引入时间序...
关键词:Spark平台 FP_GROWTH算法 关联规则挖掘 频繁集 负载均衡 
一种改进的DBSCAN算法在Spark平台上的应用被引量:7
《计算机科学》2020年第S02期425-429,443,共6页邓定胜 
四川民族学院自然科学重点项目(XYZB19001ZA);四川省教育厅自然科学重点项目(17ZA0295);四川民族学院2017年应用型示范课程项目(sfkc201705);国家自然科学基金项目(11461058)。
针对DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法内存占用率较高的问题,文中将改进的DBSCAN聚类算法与Spark平台并行聚类计算理论相结合,对海量数据采用分而治之的办法进行聚类处理,大幅减小了算法...
关键词:并行计算 DBSCAN 聚类算法 SPARK 聚类加速比 
基于Spark Streaming的流式并行文本校对被引量:5
《计算机科学》2020年第4期36-41,共6页杨宗霖 李天瑞 刘胜久 殷成凤 贾真 珠杰 
国家自然科学基金(61573292);四川省科技服务业示范项目(2016GFW0167)。
互联网的高速发展催生了海量网络文本,这对传统的串行文本校对算法提出了新的性能挑战。尽管近年来文本自动校对任务受到了较多关注,但相关研究工作多集中于串行算法,鲜有涉及校对的并行化。文中首先对串行校对算法进行泛化,给出一种串...
关键词:自动校对 流式计算 并行计算 多线程 SPARK 
基于智能可穿戴设备的个性化健康监管平台的构建被引量:22
《计算机科学》2019年第B06期566-570,共5页贾宁 李瑛达 
智能健康监管平台设计项目资助
由于以“预防、保健、预诊”为主导的社区医疗模式易受到专业知识、信息技术等诸多因素的限制,为辅助非专业医护人员及时获取健康信息,文中设计了基于可穿戴设备的个性化健康监管平台。该平台涉及新型健康领域,将专业医疗信息与物联网...
关键词:可穿戴设备 心率检测 健康监管平台 SPARK HADOOP 
基于RDD非序列化本地存储的Spark存储性能优化被引量:5
《计算机科学》2019年第5期143-149,共7页赵俊先 喻剑 
Spark框架被越来越多的企业用作大数据的计算框架,但随着现有服务器的可用内存资源增加,Spark并不能与新环境相匹配。Spark运行在Java虚拟机上,随着堆空间内存被大量使用,Java虚拟机通过回收内存来为新对象提供空间(垃圾回收机制,GC)的...
关键词:SPARK 垃圾回收 序列化 存储系统 本地内存 
DFTS:面向大数据集的Top-k Skyline查询算法被引量:3
《计算机科学》2019年第5期150-156,共7页魏亮 林子雨 赖永炫 
国家自然科学基金(61672441);深圳市基础研究计划(JCYJ20170818141325209)资助
Top-k Skyline查询结合了Top-k与Skyline的特性,可以在数据集中找到最好的点。但是,现有的算法在大数据环境下具有较高的时间开销。文中提出一种新的算法DFTS,其可以高效地在大数据集中进行Top-k Skyline查询。DFTS包括3个步骤:首先,利...
关键词:SKYLINE TOP-K APACHE SPARK 
检索报告 对象比较 聚类工具 使用帮助 返回顶部