面向图书采选的语义化查重策略  被引量:1

Semantic Duplicate Checking Strategy for Book Acquisition

在线阅读下载全文

作  者:漆月[1] 石璐 QI Yue;SHI Lu(Southwest University,Chongqing 400715,China;Nokia Shanghai Bell Co.Engeneering Department,Beijing 100010,China)

机构地区:[1]西南大学图书馆,重庆400715 [2]上海诺基亚贝尔股份有限公司研发部,北京100010

出  处:《数字图书馆论坛》2019年第11期61-66,共6页Digital Library Forum

基  金:重庆市教育科学“十三五”规划2019年度规划课题“面向碎片化学习的生态型智慧教学平台构建研究”(编号:2019-GX-306)资助

摘  要:现有图书馆采选查重系统只能实现对书号、题名的重复检查,但图书出版同质化日益严重,针对异号相似图书查重困难的问题,构建基于自然语言处理技术的查重策略。首先选择主题词、内容提要和目录作为图书内容特征的指标进行建模,利用Word2Vec和WMD技术实现不同长度特征文本语义化相似度计算;然后,采用AHP方法计算特征相似度的权系数,得到图书相似度的综合评价指标;最后以西南大学图书馆数据为实验对象,验证查重策略的可行性。s and catalogues are chosen as the evaluation elements to build model with library.Then,calculate the semantic similarity of context with Word2Vec and WMD,get the weight of similarity by AHP method.Then get comprehensive evaluation of book similarity.Finally,verify the duplication checking strategy with the library data of Southwest University.

关 键 词:采选查重 文本相似度 语义分析 评价指标体系 

分 类 号:G25[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象