检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘鹤 季宇 韩建辉 张悠慧[1] 郑纬民[1] Liu He;Ji Yu;Han Jianhui;Zhang Youhui;Zheng Weimin(Deparment of Computer Science and Technology,Tsinghua University,Beijing 100084;Institute of Microelectronics,Tsinghua University,Beijing 100084)
机构地区:[1]清华大学计算机科学与技术系,北京100084 [2]清华大学微电子学研究所,北京100084
出 处:《计算机研究与发展》2019年第6期1182-1191,共10页Journal of Computer Research and Development
基 金:国防科技创新特区项目~~
摘 要:长短期记忆(long short-term memory,LSTM)网络是一种循环神经网络,其擅长处理和预测时间序列中间隔和延迟较长的事件,多用于语音识别、机器翻译等领域.然而受限于内存带宽的限制,现今的多数神经网络加速器件的计算模式并不能高效处理长短期记忆网络计算;而阻变存储器交叉开关结构能够以存内计算形式完成高效、高密度的向量矩阵乘运算,从而成为一种高效处理长短期记忆网络的极具潜力的加速器设计模式.研究了面向阻变存储器的长短期记忆神经网络加速器模拟工具以及相应的神经网络训练算法.该模拟工具能够以时钟驱动的形式模拟设计者提出的以阻变存储器交叉开关结构为核心加速部件的长短期记忆加速器微体系结构,从而进行设计空间探索;同时改进了神经网络训练算法以适应阻变存储器特性.这一模拟工具基于System-C实现,且对于核心计算部分实现了图形处理器加速,可以提高阻变存储器器件的仿真速度,为探索设计空间提供便利.Long short-term memory(LSTM)is mostly used in fields of speech recognition,machine translation,etc.,owing to its expertise in processing and predicting events with long intervals and long delays in time series.However,most of existing neural network acceleration chips cannot perform LSTM computation efficiently,as limited by the low memory bandwidth.ReRAM-based crossbars,on the other hand,can process matrix-vector multiplication efficiently due to its characteristic of processing in memory(PIM).However,a software tool of broad architectural exploration and end-to-end evaluation for ReRAM-based LSTM acceleration is still missing.This paper proposes a simulator for ReRAM-based LSTM neural network acceleration and a corresponding training algorithm.Main features(including imperfections)of ReRAM devices and circuits are reflected by the highly configurable tools,and the core computation of simulation can be accelerated by general-purpose graphics processing unit(GPGPU).Moreover,the core component of simulator has been verified by the corresponding circuit simulation of a real chip design.Within this framework,architectural exploration and comprehensive end-to-end evaluation can be achieved.
关 键 词:阻变存储器 长短期记忆网络 训练算法 仿真框架 神经网络
分 类 号:TP389.1[自动化与计算机技术—计算机系统结构] TP391.9[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229