检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张琪 王东波[2] 黄水清[2] 李斌[3] 孟凯 邓三鸿[1,5] ZHANG Qi;WANG Dongbo;HUANG Shuiqing;LI Bin;MENG Kai;DENG Sanhong
机构地区:[1]南京大学信息管理学院,南京210023 [2]南京农业大学信息管理学院,江苏21095 [3]南京师范大学文学院,南京210023 [4]南京农业大学马克思主义学院,南京210095 [5]江苏省数据工程与知识服务重点实验室,南京210023
出 处:《图书情报知识》2022年第1期51-60,147,共11页Documentation,Information & Knowledge
基 金:国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(21&ZD331);国家自然科学基金面上项目“基于典籍引得的句法级汉英平行语料库构建及人文计算研究”(71673143)的研究成果之一。
摘 要:[目的/意义]本文从数字人文的视角出发,试图探究一套具体的技术方法解决古汉语时间描述所存在的省略、共指、歧义、模糊等问题,使得读者可以跨越纪传体、国别体、纪事本末体等体裁壁垒,获取不同史书中关于某一时间段的所有史料。[研究设计/过程]在梳理古汉语时间描述类型与特征的基础上,提出一套以时间为线索自动重组史书全文的方法。该方法首先识别古汉语时间描述并进行语义解析,继而识别事件句并将事件句关联至时间描述,最后将提出的方法应用于纪传体史书《史记》和国别体史书《国语》的重组中,检验方法的有效性。[结论/发现]本研究所提出的方法能够有效实现纪传体、国别体史书以时间为线索的重组问题,在有效减少人工标注的前提下达到了较高的准确率。[创新/价值]针对古汉语时间描述存在的歧义与共指等问题,提出一套完整的以时间为线索自动重组史书全文的方法,并通过实验验证了方法的有效性。[Purpose/Significance]Under the perspective of digital humanities, we aimed to propose a solution to deal with the problems of ancient Chinese time expressions — ellipsis, coreference, ambiguity, and vagueness. Our research will make readers obtain the historical records of a period from kinds of history books written in biographical style, national style, and chronicle style.[Design/Methodology]Based on summarizing the types and features of ancient Chinese temporal expressions, this paper puts forward a fulltext time-line reorganization system for historical books. The method firstly recognizes the ancient Chinese time description and performs semantic analysis, then identifies the event sentences and associates them with time description. Finally, the proposed method is applied to the recombination of The Records of the Grand Historian(Shi Ji), a biographical historical book, and Discourses of the States(Guo Yu), a national historical book, to test the validity of the method.[Findings/Conclusion]The method proposed in this article could realize the reorganization of historical books by time which were written in biographical style and national style. It could also achieve high accuracy while reducing manual labeling.[Originality/Value]Orienting to the characteristics of ambiguity and common reference in the ancient Chinese time expressions, this paper proposes a system to automatically reorganize the contents of historical books based upon time, and verifies the validity of the system through experiments.
关 键 词:数字人文 史书 古汉语时间信息处理 古汉语时间表达式消歧 事件时间语义关联
分 类 号:G250[文化科学—图书馆学] TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117