国家科技重大专项(2009ZX01028-002-003-005)

作品数:27被引量:57H指数:4
导出分析报告
相关作者:顾乃杰任开新黄章进张颖楠张旭更多>>
相关机构:中国科学技术大学安徽省计算与通讯软件重点实验室中国科学院华东电子工程研究所更多>>
相关期刊:《中国科学技术大学学报》《计算机系统应用》《计算机应用与软件》《小型微型计算机系统》更多>>
相关主题:龙芯多核龙芯3A负载均衡自动向量化更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
VLIW DSP处理器下累加计算优化方法被引量:1
《小型微型计算机系统》2015年第8期1915-1920,共6页杨阳朝 顾乃杰 任开新 赵增 
国家"核高基"重大专项项目(2009ZX01028-002-003-005)资助;国家自然科学基金项目(60833004)资助
当今VLIW DSP处理器拥有的指令种类越来越多,它们大多利用单一指令来完成一组复杂的计算,从而提高相关操作的执行效率.无论是在现有数字信号处理程序中,还是使用各种优化手段之后的程序代码中,累加计算在VLIW DSP处理器运算的程序中总...
关键词:VLIW DSP 累加 编译器 BWDSP 
龙芯3B处理器上FFT算法向量化研究被引量:7
《小型微型计算机系统》2015年第7期1639-1643,共5页张杰 顾乃杰 张明 
国家"核高基"重大专项项目(2009ZX01028-002-003-005)资助;高等学校学科创新引智计划项目(B07033)资助
龙芯3B处理器是龙芯3号多核处理器的第二款产品,主要面向高性能计算、高端嵌入式等应用领域.快速傅里叶变换(Fast Fourier Transform,FFT)作为数字信号处理、图像处理等领域的基本研究工具,其在龙芯3B处理器上的高效实现是必不可少的....
关键词:龙芯3B 优化算法 FFT 向量化 
一种多核平台下的用户级实时多任务库被引量:3
《小型微型计算机系统》2015年第7期1438-1443,共6页吴志强 黄章进 顾乃杰 张旭 
国家"核高基"重大专项项目(2009ZX01028-002-003-005)资助;高等学校学科创新引智计划项目(B07033)资助
针对Linux系统中线程的创建、调度、同步开销较大而无法满足一些实时应用的问题,在ARM和X86多核平台下设计实现了一种基于优先级位图调度且可抢占的多任务库(Utask).该库通过在用户态为实时任务提供任务的创建、优先级位图调度、快速的...
关键词:用户级多任务 上下文切换 实时性 多核平台 位图调度 
一种多网卡环境的Linux流量控制算法
《小型微型计算机系统》2015年第6期1214-1218,共5页王凌睿 顾乃杰 任开新 
"核高基"重大专项项目(2009ZX01028-002-003-005)资助;高等学校学科创新引智计划项目(B07033)资助
流量控制是网络管理中用于保证服务质量的常见手段,令牌桶算法是常用的的流量控制算法之一.使用令牌桶算法在多网卡环境下进行流量控制时存在业务分类的问题,目前,缺少在这种场景下根据业务优先级进行剩余带宽利用的流量控制算法.本文...
关键词:流量控制 令牌桶算法 带宽 多网卡Linux内核 
基于多GPU的深度神经网络训练算法被引量:8
《小型微型计算机系统》2015年第5期1042-1046,共5页顾乃杰 赵增 吕亚飞 张致江 
核高基重大专项项目(2009ZX01028-002-003-005)资助
深度学习由于出色的识别效果在模式识别及机器学习领域受到越来越多的关注.作为深度神经网络算法的重要组成部分,误差反向传播算法的执行效率已经成为制约深度学习领域发展的瓶颈.提出一种基于Tesla K10 GPU的误差反向传播算法,该算法...
关键词:深度学习 神经网络 GPGPU 并行算法 
一种面向多核系统的Linux任务调度算法被引量:4
《计算机工程》2015年第2期36-40,46,共6页曹越 顾乃杰 任开新 张旭 吴志强 
"核高基"重大专项(2009ZX01028-002-003-005);高等学校学科创新引智计划基金资助项目(B07033)
针对Linux任务调度算法在多核系统中交互性能差的问题,提出一种分组任务调度算法GFS。根据多核系统硬件特性,自动配置物理距离近的一组CPU共享一个任务运行队列,通过平衡组内CPU对任务运行队列的访问竞争与任务迁移的代价,实现组间任务...
关键词:多核系统 调度算法 交互性能 自动配置 唤醒任务 负载均衡 
一种多核ARM平台下用户态定时器的实现被引量:1
《计算机工程》2015年第1期19-23,30,共6页喻诗祥 顾乃杰 张旭 曹越 
"核高基"重大专项(2009ZX01028-002-003-005);高等学校学科创新引智计划基金资助项目(B07033)
在ARM平台下,系统提供的posix-timer误差较大,难以满足实时要求,而且传统的Linux用户态定时器通过系统调用及信号传递的方式向进程提供定时服务,当定时器使用规模较大时,进程会在内核态用户态间频繁切换。针对上述问题,提出并实现一种...
关键词:Linux用户态 定时器 多核 ARM平台 时间轮 共享内存 
基于轴对齐变形的视频缩放技术的研究
《计算机应用与软件》2014年第8期213-218,256,共7页宁兰芳 黄章进 郭利财 
核高基重大专项(2009ZX01028-002-003-005);高等学校学科创新引智计划项目(B07033);中央高校基本科研业务费专项资金(WK0110000030)
多样化的显示设备对视频显示的适应性提出越来越高的要求。提出并实现一种基于轴对齐变形的内容感知视频缩放方法。首先根据梯度、人脸和运动的信息对视频进行分析,然后结合相邻帧信息建立二次规划系统进行变形求解。实验表明,求解方法...
关键词:轴对齐变形 内容感知 视频分析 视频缩放 
SCC上FFT的高效并行实现及其扩展性研究
《小型微型计算机系统》2014年第6期1207-1211,共5页汪清 顾乃杰 何颂颂 杨阳朝 
国家"核高基"重大专项(2009ZX01028-002-003-005)资助;国家自然科学基金项目(60833004)资助
针对SCC(Single-Chip Cloud Computer,单芯片云计算机)体系结构,通过通信路由的改进、消息传递的预处理以及数据处理的再划分这三种手段来提升FFT并行实现效率并以此来研究SCC的扩展性.实验结果表明,SCC上改进后的FFT在一定规模内,双核...
关键词:FFT SCC RCCE 并行化 加速比 扩展性 
LAPACK线性方程求解函数在龙芯3A上的并行化被引量:1
《小型微型计算机系统》2014年第5期1085-1089,共5页刘斌斌 顾乃杰 任开新 张杰 
国家"核高基"重大专项项目(2009ZX01028-002-003-005)资助
针对龙芯3A体系结构,该文通过变量代换或消除、简化依赖关系、增加热点数据副本、并行流水等方法对BLAS函数和LAPACK函数做并行化,基于原LAPACK库的结构层次实现了线性方程求解函数的并行化版本,用户只需设定核数重新编译出LAPACK的多...
关键词:LAPACK BLAS 龙芯3A 多核 
检索报告 对象比较 聚类工具 使用帮助 返回顶部