数字人文视域中的古籍文本标注方法研究——以MARKUS为例  被引量:6

Research on text annotation method of ancient works from the perspective of digital humanities:a case study on MARKUS

在线阅读下载全文

作  者:于亚秀[1] 李欣 YU Yaxiu;LI Xin(East China Normal University Library,Shanghai 200062,China;School of Data Science and Engineering,East China Normal University,Shanghai 200062,China)

机构地区:[1]华东师范大学图书馆,上海200062 [2]华东师范大学数据科学与工程学院,上海200062

出  处:《大数据》2022年第6期15-25,共11页Big Data Research

基  金:中央高校基本科研业务费项目(No.2022ECNU-XWK-ZX05)。

摘  要:文本标注是文本分析挖掘中的重要一步,面对大规模古籍资源,人工标注无法满足人文研究需求,且古籍语法结构和语言特点特殊,现代文本标注技术很难直接用于古籍研究。在分析人文研究者进行古籍文本标注中面临的难点和痛点的基础上,提出普适性的古籍标注标准流程,给出基于MARKUS的文本标注模型,并通过具体实践,探索基于该模型的古籍文本标注方法,旨在助推借助数字人文工具改变古籍人文研究方式,拓宽研究规模的应用深度。Text annotation is an important step in text analysis and mining.Manual labeling can no longer meet the needs of humanistic research faced with large-scale text resources,and due to the special grammatical structure and language characteristics of ancient works,the text annotation technology on modern corpora cannot be directly applied to the ancient works.Based on the analysis of the challenges faced by humanities researchers,a universal standard text annotation process of ancient works was proposed,and a model based on MARKUS was given.And ancient works annotation method based on this model through specific example was explored,to promote using tools to change the research methods in digital humanities and to expand the scale of research.

关 键 词:数字人文 古籍 文本标注 MARKUS 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] G255.1[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象