检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:韩冬雷[1] 金花[2] 朱亚涛[2,3] 刘金刚[1,3]
机构地区:[1]首都师范大学计算机科学联合研究院,北京100048 [2]河北农业大学信息科学与技术学院,河北保定071001 [3]中国科学院计算技术研究所,北京100190
出 处:《计算机应用与软件》2014年第10期49-52,共4页Computer Applications and Software
基 金:国家自然科学基金项目(60903139);国家自然科学基金面上项目(61173008);河北省高等学校科学技术研究青年基金项目(Z2012142);河北农业大学理工基金项目(LG20120604)
摘 要:面对短文本信息内容稀疏、上下文语境提取困难的挑战,基于维基百科的结构化信息特征,提出一种利用NMF算法来扩展短文本语义的方法。通过自动识别与短文本信息语义特征相关的维基百科概念来丰富它的内容,从而有效提高短文本信息数据挖掘和分析的效果。实验结果表明与已有方法相比,应用此方法可以进一步提高短文本信息语义扩展的效率和准确率。Facing the challenges of the sparsity of short-text content and the difficulty in extracting linguistic context, we propose a solution based on the structured information feature of Wikipedia to expand the semantics of short-text using NMF algorithm. It enriches the semantic feature of the short-text information by automatically identifying the concepts in Wikipedia that are pertinent to it. Thereby, it can effectually improve the effects of data mining and analysis on short-text information. Experimental results demonstrate that compared with existed methods, the use of method is able to further improve the efficiency and accuracy of the semantic extension of short-text information.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.41