检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郭佳乐[1] 蒋林[1] 山蕊[1] 崔朋飞[1] 武鑫[1]
机构地区:[1]西安邮电大学电子工程学院,陕西西安710121
出 处:《微电子学与计算机》2017年第9期116-120,125,共6页Microelectronics & Computer
基 金:国家自然科学基金资助项目(61272120;61634004;61602377);陕西省自然科学基金资助项目(2015JM6326);陕西省科技统筹创新工程项目(2016KTZDGY02-04-02)
摘 要:提出了一种簇内高效并行访问存储结构.该结构采用"逻辑共享、物理分布"多个存储块并行存储的方法,实现了4×4视频阵列处理器的并行访问.实验结果表明,在无冲突情况下,该结构支持16个轻核处理元的同时读/写操作,最高频率200 MHz,访存峰值带宽6.25GB/s.最后对8×8二维离散余弦变换算法进行映射实现和性能比较发现,簇内存储结构能够为该算法提供312.2Msamples/s的数据访存带宽,相较于同类型阵列结构,执行周期数降低了31.67%,工作频率提高了一倍,访存带宽增加了192.60%.A high efficient and parallel access memory structure is proposed. The architecture adopts the method of " logical sharing, physical distribution" and parallel storage of multiple memory blocks, which realizes the parallel access of 4 x 4 video array processors. The experimental results show that the proposed architecture can support simultaneous read/write operations of 16 light nuclear processing elements, the highest frequency is 200 MHz, access to the peak bandwidth of 6. 25 GB/s. Finally, the 8X 8 two-dimensional discrete cosine transform algorithm is mapped and compared. It is found that the cluster memory structure can provide data storage bandwidth of 312.2 Msamples/s. Compared with the same type of array structure, the number of execution cycles decreased 31.67%, frequency doubled, memory bandwidth is increased by 192. 60%.
分 类 号:TP302[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222