检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘萍[1,2] 彭小芳 Liu Ping;Peng Xiaofang(School of Information Management,Wuhan University,Wuhan 430072,China;Institute for Digital Library,Wuhan University,Wuhan 430072,China)
机构地区:[1]武汉大学信息管理学院,武汉430072 [2]武汉大学数字图书馆研究所,武汉430072
出 处:《数据分析与知识发现》2020年第5期66-74,共9页Data Analysis and Knowledge Discovery
基 金:国家自然科学基金项目“基于个性化知识地图的交互式信息检索系统研究—从用户认知的角度”(项目编号:71573196)的研究成果之一。
摘 要:【目的】在文献层和词汇层之间加入主题层,研究一种新的词汇相似度计算方法。【方法】阐述基于形式概念分析(FCA)的主题定义和表示模型,将词汇项映射到主题层级,提出一种基于主题相似度定量刻画词汇相似度的计算方法。【结果】以信息检索领域为例,以SIGIR会议2006-2016年收录的论文数据为样本进行评测,结果表明本文方法的精确率与召回率比FastText方法有显著提高,最大提升幅度分别达到30%和21%。【局限】该方法依赖文献关键特征词抽取的质量。【结论】基于形式概念分析的词汇相似度计算方法有效利用了词汇对应的主题语义关系,能更好地反映词语之间的关联性。[Objective] This paper tries to add a topic layer between document and word layers, aiming to calculate word similarities effectively. [Methods] First, we proposed a topic defintion and representation model based on the theory of formal concept analysis. Then, we mapped words to the topic layer. Finally, we developed an algorithm to calculate word similarities with the help of topic-to-topic relationship. [Results] We analyzed papers of SIGIR conference from 2006 to 2016 with the proposed method to calculate word similarities in the field of information retrieval. The precision and recall of the proposed method were up to 30% and 21% higher than those of the FastText method. [Limitations] The proposed method relies on the quality of extracted feature words of documents. [Conclusions] The proposed method utilizes the semantic relations among associated topics,and effectively calculate word similarities.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222