检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]武汉科技大学管理学院,湖北武汉430081 [2]武汉大学信息管理学院,湖北武汉430072
出 处:《现代情报》2013年第2期21-23,124,共4页Journal of Modern Information
基 金:湖北省教育厅人文社科项目"云计算环境下图书馆信息服务模型研究"(2012Q190)研究成果之一
摘 要:在分析现有文本表示法的基础之处,提出一种以段落、语句、词语为层次结构的文本表示方法———文本空间表示模型,并在此模型基础上探讨一种以文本段落为基本单位的相似文本计算算法,以实现相似文本检测目标。最后建立测试集并在测试集上执行检测实验,结果表明此方具有较好的相似文本发现效果。Based on the analysis of existing text representation methods, a new model for text representation that decompose text to paragraphs, sentences and phrases hierarchically is introduced in this study contrast with the inadequacy of existing text representation methods. With the help of this model we propose a text similarity computing method on the unit of paragraph of text. The following experiments carried on the testing set proved a better effect by this method.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3