汉语辞书词条自动编纂调查研究--以ChatGPT为例  

A Survey on Automatic Compilation of Chinese Dictionary Entries:A Case Study of ChatGPT

在线阅读下载全文

作  者:张永伟[1,2] 刘婷 Zhang Yongwei;Liu Ting

机构地区:[1]中国社会科学院大学文学院,北京102488 [2]中国社会科学院辞书编纂研究中心,北京102488

出  处:《辞书研究》2024年第5期20-33,I0001,I0002,共16页Lexicographical Studies

基  金:中国社会科学院语言研究所主题教育调研项目“自然语言生成模型对语文辞书释义带来的机遇与挑战”(主持人:白晓丽编审);中国社会科学院学科建设“登峰战略”资助计划(项目编号DF2023TS05)的成果之一;国家社会科学基金重大项目“辞书编纂用大型多功能语料库建设与研究”(项目编号23&ZD314)。

摘  要:文章以ChatGPT为例,借助问卷考察了大语言模型在汉语辞书词条自动编纂中的表现。研究选取40个词目作为样本,充分考虑词性、词长、义项数的多样性,借助ChatGPT生成释文,并与《现代汉语词典》第7版进行对比分析。问卷调查显示,ChatGPT编纂的词条中有37.5%获得了更多受访者的认可,但整体质量距离全面超越传统辞书仍有差距。ChatGPT在单音字、单一词性词语的标注和单义项词语的释义方面具有优势,但对多音字、兼类词、多义词以及特殊语体词的词条编纂效果明显下降,也暴露出义项遗漏、释义不准确、举例模式化等问题。总体而言,ChatGPT在辞书编纂中展现了生成新义、快速编纂等优势,但严谨性、系统性不足,难以独立完成编纂任务。大语言模型正在不断升级中,未来宜持续关注并将其用作辞书编纂的辅助工具,通过人机互助提高辞书编纂速度,提升辞书编纂质量,推动汉语辞书智能化发展。This article investigates the performance of large language models in the automatic compilation of Chinese dictionary entries,using ChatGPT as an example.The study selects 40 word samples covering different dimensions such as the part of speech,word length,and number of senses.ChatGPT is used to generate explanations,which are then compared and analyzed with entry definitions in the 7th edition of the Modern Chinese Dictionary.A questionnaire survey shows that 37.5%of the ChatGPT-compiled entries gained more recognition from respondents.However,the overall quality still lags behind traditional dictionaries in terms of comprehensiveness.ChatGPT has both advantages and disadvantages in the treatment of pronunciations,part-of-speech tagging,sense division,definition,and entry examples.Overall,ChatGPT demonstrates advantages in generating new explanations and in the rapid compilation of dictionary entries,but lacks rigor and systematicity,making it difficult to complete the compilation task independently.As large language models continue to upgrade,it is advisable to continuously monitor and use them as auxiliary tools for compilation in the future.Human-machine collaboration can improve the speed and quality of dictionary compilation and promote the intelligent development of Chinese dictionaries.

关 键 词:辞书 词条 自动编纂 大语言模型 ChatGPT 

分 类 号:H164[语言文字—汉语] TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象