检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]山西大学,太原030006
出 处:《电脑开发与应用》2004年第2期5-6,共2页Computer Development & Applications
基 金:山西省回国留学人员基金资助 (2 0 0 2 0 0 4 )
摘 要:文本自动分类系统是信息处理的重要研究方向。针对文本分错类和相似度低找不到合适类别等两种错误 ,提出一种迭代的学习算法 ,它利用分错的文本向量来提高或降低相应类别向量的权重 ,从而纠正分类错误 ,提高了分类准确率 ,并且最终得到了较精确的类别描述向量和较优的分类器。The text categorization system is an important research aspect of information processing.On text error categorization and low similarity that can't find the adaptable class,etc.,this paper presents an iterative learning algorithm,which adopts error text vector to improve or decrease the weight of relative class vector to correct the error categorization,and improve category accuracy.Finally a more accuracy category description vector and better classifier has been obtained.
关 键 词:迭代学习 文本分类器 信息处理 度量函数 特征抽取
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249