基于数字人文视域下机器学习的古诗文关键词抽取  

在线阅读下载全文

作  者:王琛[1,2] 

机构地区:[1]齐鲁工业大学(山东省科学院) [2]山东省科学院情报研究所

出  处:《数字技术与应用》2024年第10期223-226,共4页Digital Technology & Application

摘  要:数字人文将计算机技术有机融合于人文学科研究之中,旨在深入、全面地探索、理解和挖掘人文内涵。基于数字人文视域,利用TextRank、TF-IDF(词频-逆文档频率)和LDA算法对辛弃疾的诗词进行关键词抽取探究。通过Pooling的评价方法发现,TextRank算法抽取的关键词结果更好,准确率能达到76.67%,而传统的TF-IDF和LDA算法准确率分别为63.33%和53.33%。同时,根据抽取的关键词,还可以发现辛弃疾诗词的内容主要围绕青山、英雄、江山等关键词进行描述。

关 键 词:数字人文 古诗文 关键词抽取 机器学习 计算机技术 人文视域 人文学科 评价方法 

分 类 号:I206.2[文学—中国文学] TP181[自动化与计算机技术—控制理论与控制工程] TP391.1[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象