汉字熵值计算及其科学意义  

Calculation of Chinese Characters Entropy and Its Scientific Significance

在线阅读下载全文

作  者:冯志伟[1] FENG Zhiwei

机构地区:[1]教育部语言文字应用研究所,北京100010

出  处:《北华大学学报(社会科学版)》2024年第1期17-25,150,共10页Journal of Beihua University(Social Sciences)

摘  要:汉字的熵值计算是确定计算机汉字编码形式的前提和基础。汉字熵值计算是交叉学科性质的研究。字符的熵值计算需要借助信息论理论、概率理论和香农推导出的计算英文字母熵的公式。汉字编码的依据是“信道编码定理”。世界首次计算出汉字的熵值是在20世纪70年代中期,由中国学者冯志伟通过手工操作完成的。该研究具有重要的科学意义。为后来的多八位双字节汉字编码提供了语言学理据,为中国的计算机中文信息处理技术的飞速发展作出了重要贡献。The calculation of entropy of Chinese characters is the prerequisite and foundation for determining the encoding form of Chinese characters.The calculation of entropy of Chinese characters is a cross disciplinary research.The calculation of entropy of characters needs to rely on the information theory,probability theory and Shannon’s formula for calculation of the entropy of English letter.The basis of Chinese character encoding is the“channel coding theorem”.The first calculation of the entropy of Chinese characters was carried out in the mid-1970s by Chinese scholar Feng Zhiwei through manual operation.This research has important scientific significance.It provides linguistic evidence for the later multi-octal double byte encoding of Chinese character.And it has made important contributions to the rapid development of Chinese information processing technology in China.

关 键 词:信息论 信道编码定理 汉字的熵值 汉字编码 

分 类 号:H127[语言文字—汉语] TP391.11[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象