检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李轲禹 王昊[1,2] 龚丽娟 唐慧慧 Li Keyu;Wang Hao;Gong Lijuan;Tang Huihui(School of Information Management,Nanjing University,Nanjing 210023,China;Jiangsu Key Laboratory of Data Engineering and Knowledge Service,Nanjing 210023,China)
机构地区:[1]南京大学信息管理学院,南京210023 [2]江苏省数据工程与知识服务重点实验室,南京210023
出 处:《数据分析与知识发现》2020年第6期91-108,共18页Data Analysis and Knowledge Discovery
基 金:国家自然科学基金青年项目“面向学术资源的TSD与TDC测度及分析研究”(项目编号:71503121);南京大学人文社会科学双一流建设“百层次”项目“多粒度学术对象区分性测度和分析研究”(项目编号:JY-001)的研究成果之一。
摘 要:【目的】对学术数据库中研究主题的索引术语的质量进行测度并探究其分布特点。【方法】从Web of Science、CNKI中采集来自人文、社会和自然科学领域的研究主题的索引术语,构建主题、领域和数据库层次的术语空间,将术语区分能力(Term Discriminative Capacity,TDC)作为术语质量评价指标,采用ANOVA分析方法探究不同数据库、领域的研究主题的术语质量分布特点。【结果】不同领域的研究主题的术语质量在字段分布上均满足:"Abstract">平均水平>"Keyword";CNKI的"Title"(Web of Science的"Keyword Plus")与平均水平相比在不同领域中有所差异,但均低于"Abstract";Web of Science的"Title"与"Abstract"相比在不同领域中有所差异,但均高于平均水平。【局限】研究主题不够丰富。【结论】TDC测度方法具有稳定性和可靠性;通过探究研究主题的术语质量分布特点,可以为选择检索字段入口和提高术语质量提供方向与依据。[Objective]This paper measures the quality of index terms from research topics in academic databases and explores their distribution characteristics.[Methods]We collected the index terms of research topics in humanities,society and natural sciences from Web of Science and CNKI.Then,we constructed terminology spaces based on research topics,domains and databases.Third,we used term discriminative capacity(TDC)to evaluate their quality.Finally,we conducted ANOVA testing to explore the distribution characteristics of index terms quality from different databases/domains.[Results]The index term quality of research topics followed the rules of“Abstract”>average level>“Keyword”.The“Title”of CNKI(“Keyword Plus”in Web of Science)were lower than“Abstract”,while the“Title”in WoS were lower than average.[Limitations]The amount of research topics in this study needs to be expanded.[Conclusions]The TDC measure method is stable and reliable,which helps us improve the information retrieval services and terms quality.
关 键 词:索引术语 术语区分能力 ANOVA分析 检索字段 术语质量分布特点
分 类 号:TP391[自动化与计算机技术—计算机应用技术] G35[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15