检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华大学自动化系,北京100084
出 处:《计算机工程与应用》2003年第15期68-70,共3页Computer Engineering and Applications
基 金:国家自然科学基金项目"虚拟样机环境下复杂产品多领域协同建模方法研究"(课题编号:NSFC60274044)
摘 要:文本索引词权重计算方法决定了文本分类的准确率。该文提出一种文本索引词项相对权重计算方法,即文本索引词项权重根据索引词项在该文本中的出现频率与在整个文本空间出现的平均频率之间的相对值进行计算。该方法能有效地提高索引词对文本内容识别的准确性。The text classification accuracy depends on item frequency weighting.This paper proposes a relative text item frequency weighting Method.Namely,the weight of a term in a document is given by the difference of the term frequency in the document relative to the average frequency of the term over the documents.The new approach can effectively increase the accuracy of the terms identifying the document.
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229