检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孔超 刘娟 KONG Chao;LIU Juan(School of Literature,Shandong University,Ji'nan 250100,China)
机构地区:[1]山东大学文学院语言科学实验中心,山东省济南市250100
出 处:《外语教学与研究》2022年第3期362-374,479,共14页Foreign Language Teaching and Research
摘 要:人类语言在形式上纷繁多样,但作为信息传递工具,不同语言都使用发音–听觉信道完成信息传递。本文对覆盖49.8亿人口的61种语言的大规模语音、文本语料库数据进行了计算研究,以探讨不同语言信息传递的速率和策略。计算结果发现人类语言信息传递的速率和策略具有很强的共性:61种不同语言中,语言传递信息的速率都分布在14比特每秒左右,同时在词这一级单位上,不同语言有非常一致的信息密度(约6.8比特每词)和平均语速(约2词每秒),这意味着在词这一级单位上不同语言使用了完全一致的编码策略和信息速率。而不同语言在信息编码问题上的多样性主要体现在音节这一层级上。Human languages are diverse in form,but as an information transmission tool,all languages use vocal-auditory channels to complete information transmission.This paper conducts a computational study of large-scale speech and text corpora of 61 languages spoken altogether by a population of 4.98 billion to explore the rates and strategies of information transmission in different languages.The results show that the rates and strategies of human language information transmission have a strong commonality:Among the 61 languages,the information transmission rate is around 14 bits/s,and at the word level,different languages have very consistent information densities(≈6.8 bits/word) and average speech rates(≈2 words/s),which indicates that different languages use the same coding strategy and information rate at the word level.The diversity of information coding in languages mainly appears at the syllable level.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7