检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:许强[1] 陈杰[1] 刘建[1] 王云[1] 胡哲琨[1]
出 处:《微电子学与计算机》2013年第11期27-30,34,共5页Microelectronics & Computer
基 金:国家自然科学基金(61234003)
摘 要:为了提高嵌入式图形处理器的纹理单元效率,提出了一种多端口纹理高速缓存(Texture Cache)结构。该结构采用了基于块的光栅化和块交错的纹理内存组织,能够充分发掘数据间相关性,提高了Cache命中率;此外该结构采用Cache预取技术,有效隐藏了访存延迟;为了进一步提高数据吞吐率,设计了4个读端口,可支持并行读取4个纹素。仿真结果表明,设计的Cache可达到92%左右命中率,访存性能可达到零延迟内存系统的90%,数据吞吐率是单端口Cache的3~4倍。In order to improve GPU's texture unit efficiency ,a multiported texture cache architecture is proposed . The architecture employs a tiling rasterization order and a block interleaving memory organization ,which can fully exploit the data locality and improve cache hit rate . In addition , the architecture employs cache prefetching technology ,which can hide memory latency . In order to further improve data throughput , four read ports supporting 4 parallel reading are designed .Simulation results show that the hit rate of the proposed cache is about 92% and can attain 90% of the performance of a zero latency memory system .The data throughput is about 3~4 times of the single ported cache .
关 键 词:图形处理器 光栅化 纹理高速缓存 分层细化 预取 多端口
分 类 号:TN402[电子电信—微电子学与固体电子学]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.163.142