检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李荣春[1,2] 周鑫 乔鹏 王庆林 LI Rongchun;ZHOU Xin;QIAO Peng;WANG Qinglin(College of Computer Science and Technology,National University of Defense Technology,Changsha 410073,China;National Key Laboratory of Parallel and Distributed Computing,National University of Defense Technology,Changsha 410073,China)
机构地区:[1]国防科技大学计算机学院,湖南长沙410073 [2]国防科技大学并行与分布计算全国重点实验室,湖南长沙410073
出 处:《国防科技大学学报》2024年第1期141-148,共8页Journal of National University of Defense Technology
基 金:国家自然科学基金资助项目(61902415,62002365)。
摘 要:提出了一种基于图形处理单元(graphic processing unit,GPU)的5G软件无线电准循环低密度奇偶校验(low density parity check,LDPC)码译码器,为了节省片上和片下带宽,采用码字缩短和打孔技术、两级量化和数据打包方案,以提升数据带宽的利用率。实验基于Nvidia RTX 2080Ti GPU平台实现了高码率情况下的最小和近似译码算法的并行译码,通过分析GPU上的最优线程设置,将码率为5/6的(2080,1760)LDPC算法的译码吞吐率提升至1.38 Gbit/s,译码吞吐率性能优于现有其他基于GPU的LDPC译码器。A GPU(graphic processing unit)based 5G software radio quasi cyclic LDPC(low-density parity check)code decoder was proposed.In order to save on chip and off chip bandwidth,code word shortening and punching techniques,two-stage quantization,and data packaging schemes were adopted to improve the utilization of data bandwidth.The experiment was based on the Nvidia RTX 2080Ti GPU platform to achieve parallel decoding of minimum and approximate decoding algorithms under high bit rates.By analyzing the optimal thread settings on the GPU,the decoding throughput of the 5/6(2080,1760)LDPC algorithm is improved to 1.38 Gbit/s,and the decoding throughput performance is better than other GPU based LDPC decoders.
分 类 号:TN014[电子电信—物理电子学]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.43