检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]大连外国语大学计算机教研部,大连116044 [2]大连外国语大学英语学院,大连116044 [3]中国大连高级经理学院,大连116024
出 处:《图书情报工作》2015年第16期143-148,共6页Library and Information Service
基 金:国家社会科学基金一般项目"典籍英译国外读者网上评论观点挖掘研究"(项目编号:15BYY028);教育部人文社会科学研究规划青年基金项目"基于多层面特征分析的在线信息作者身份识别研究"(项目编号:11YJCZH131)研究成果之一
摘 要:[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。[ Purpose/significance ] The traditional authorship identification methods are not applicable to web text. In this paper some typical methods and the key problems in recent years are reviewed in order to provide new ideas for fur- ther research. [ Method/process ] We objectively analyzed the authorship stylistic features selection, the authorship model- ing and the performance evaluation indexes respectively, presenting the latest development of the related areas and trends. [Result/conclusion ] Authorship identification should adapt to short, non- standard, mass, high -dimensional, sparse and multilingual text. More efficient multidimensional features models and corresponding authorship identification methods are required. The latest achievements in information retrieval, machine learning and natural language processing are the prom- ising solutions to improve the efficiency and accuracy of authorship identification.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249