基于向量空间模型的标签树构建方法研究  被引量:4

Research on Construction of Label Tree Based on Vector Space Model

在线阅读下载全文

作  者:李艳[1] 贾君枝[2] 

机构地区:[1]西安工业大学图书馆,西安710021 [2]山西大学经济与管理学院,太原030006

出  处:《情报学报》2014年第3期277-283,共7页Journal of the China Society for Scientific and Technical Information

基  金:国家社科基金“叙词表与分众分类系统的集成研究”的研究成果,项目编号:11BTQ006

摘  要:分众分类系统标签具有语义模糊、不精确、随意的缺点,导致用户信息发现和分享效率低下。论文借助受控词表教育类高频主题词作为分众分类系统的检索入口词,Del.icio.us网站中用户、标签、资源三元组数据作为数据源,充分考虑用户、资源、标签三者之间的关系,使用资源数表示标签向量,并对标签进行相似性计算,运用系统聚类法计算其聚类系数,构建适合的标签簇,依据资源数量的大小建立标签层次结构,形成标签树。旨在提高标签检索效率,为进一步标签语义挖掘打好基础。It leads to low efficiency of information discovery and sharing for users owing to the disadvantage of tags of semantic ambiguity, inaccuracy and indiscretion in the folksonomy. The paper calculates similarity using the number of resources as tag vector and clustering Coefficient using the system clustering through taking high-frequency subject words "Classified Chinese Thesaurus" (education) , Del. icio. us data( users, tags, resources) as the data source, It has built a small "tags tree" (the tags hierarchy) combining the tag of the similarity coefficient with tags clustering structure in order to provide a good foundation for further label semantic mining and improve efficency of tags retrieval.

关 键 词:分众分类 受控词表 标签聚类 标签树 

分 类 号:G350[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象