可重构视频阵列处理器簇内存储结构设计与实现  被引量:2

Design of Cluster Memory Structure for Reconfigurable Cideo Array Processor

在线阅读下载全文

作  者:郭佳乐[1] 蒋林[1] 山蕊[1] 崔朋飞[1] 武鑫[1] 

机构地区:[1]西安邮电大学电子工程学院,陕西西安710121

出  处:《微电子学与计算机》2017年第9期116-120,125,共6页Microelectronics & Computer

基  金:国家自然科学基金资助项目(61272120;61634004;61602377);陕西省自然科学基金资助项目(2015JM6326);陕西省科技统筹创新工程项目(2016KTZDGY02-04-02)

摘  要:提出了一种簇内高效并行访问存储结构.该结构采用"逻辑共享、物理分布"多个存储块并行存储的方法,实现了4×4视频阵列处理器的并行访问.实验结果表明,在无冲突情况下,该结构支持16个轻核处理元的同时读/写操作,最高频率200 MHz,访存峰值带宽6.25GB/s.最后对8×8二维离散余弦变换算法进行映射实现和性能比较发现,簇内存储结构能够为该算法提供312.2Msamples/s的数据访存带宽,相较于同类型阵列结构,执行周期数降低了31.67%,工作频率提高了一倍,访存带宽增加了192.60%.A high efficient and parallel access memory structure is proposed. The architecture adopts the method of " logical sharing, physical distribution" and parallel storage of multiple memory blocks, which realizes the parallel access of 4 x 4 video array processors. The experimental results show that the proposed architecture can support simultaneous read/write operations of 16 light nuclear processing elements, the highest frequency is 200 MHz, access to the peak bandwidth of 6. 25 GB/s. Finally, the 8X 8 two-dimensional discrete cosine transform algorithm is mapped and compared. It is found that the cluster memory structure can provide data storage bandwidth of 312.2 Msamples/s. Compared with the same type of array structure, the number of execution cycles decreased 31.67%, frequency doubled, memory bandwidth is increased by 192. 60%.

关 键 词:阵列处理器 存储结构 并行存储 视频编解码 

分 类 号:TP302[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象