文本作者身份识别研究综述  被引量:2

Review on Text Authorship Identification

在线阅读下载全文

作  者:祁瑞华[1] 霍跃红[2] 胡润波 

机构地区:[1]大连外国语大学计算机教研部,大连116044 [2]大连外国语大学英语学院,大连116044 [3]中国大连高级经理学院,大连116024

出  处:《图书情报工作》2015年第16期143-148,共6页Library and Information Service

基  金:国家社会科学基金一般项目"典籍英译国外读者网上评论观点挖掘研究"(项目编号:15BYY028);教育部人文社会科学研究规划青年基金项目"基于多层面特征分析的在线信息作者身份识别研究"(项目编号:11YJCZH131)研究成果之一

摘  要:[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。[ Purpose/significance ] The traditional authorship identification methods are not applicable to web text. In this paper some typical methods and the key problems in recent years are reviewed in order to provide new ideas for fur- ther research. [ Method/process ] We objectively analyzed the authorship stylistic features selection, the authorship model- ing and the performance evaluation indexes respectively, presenting the latest development of the related areas and trends. [Result/conclusion ] Authorship identification should adapt to short, non- standard, mass, high -dimensional, sparse and multilingual text. More efficient multidimensional features models and corresponding authorship identification methods are required. The latest achievements in information retrieval, machine learning and natural language processing are the prom- ising solutions to improve the efficiency and accuracy of authorship identification.

关 键 词:身份识别 文体特征 作者身份 建模性能 评价指标 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] G254[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象