主题建模方法在俄语文学文本分析中的应用  

Computer Modeling as a Tool for Literary Text Analysis

在线阅读下载全文

作  者:A.V.Kolmogorova Y.D.Zalevskaya 牟松妍(译) A.V.Kolmogorova;Y.D.Zalevskaya

机构地区:[1]不详 [2]黑龙江大学俄语学院,哈尔滨150080

出  处:《外语学刊》2024年第6期23-31,共9页Foreign Language Research

基  金:国家社会科学基金重大项目“新华现汉俄译工程”(19ZDA317);国家社科基金项目“(俄汉)抗战翻译语境适应机制及其价值研究”(19BYY207);黑龙江省省属高等学校基本科研业务费项目“中国古建筑术语俄译研究”(2023-KYYWF-1592)的阶段性成果。

摘  要:本研究探讨了基于计算机辅助的主题建模方法在文学文本分析中的应用潜力。我们采用LDA算法对两个虚构文本子语料库进行分析,旨在探索不同文本之间母题(мотив)的互文关联。这两个语料库分别是:谢尔盖·多瓦托夫(以下简称多瓦托夫)创作的62篇不同体裁的文本(包括短篇小说、随笔、中篇小说和评论性文章)和31部多瓦托夫认为对他产生了深远影响的文学作品。基于LDA算法分析结果,研究者识别出20个主题,根据主题与文本之间的关联度,将所有文本归入相应主题。每一个主题都由相关词链(цепочкаслов)构成,词链中包含的词语按照其与主题的相关程度(权重)排列,共同反映了该主题的语义内涵。分析结果显示,在20个主题中,有3个主题分别同时出现在多瓦托夫创作的文本和其他作家的文本中,由此出现了3个具有关联性的“文本—主题”(текст—тема)对应关系:(1)鲍里斯·皮利尼亚克的长篇小说《荒年》和多瓦托夫的短篇小说《在河边》;(2)赫伯特·乔治·威尔斯的长篇小说《时间机器》、海明威的中篇小说《老人与海》和多瓦托夫的短篇小说《移民》;(3)亚历山大·格林的短篇小说《港口司令》和多瓦托夫的随笔《我们说着不同的语言》。分析表明,上述对应的虚构文本之间存在着母题交叉现象。基于机器学习的计算机辅助方法可以作为文本分析的探索性工具,帮助研究者从大型语料库中获得文本研究的潜在方向和线索,从而更有效地利用自身专业知识进行深入考察①。

关 键 词:文本分析 计算机辅助主题建模方法 母题 互文性 俄语 

分 类 号:H030[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象