检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]解放军理工大学通信工程学院,南京210007 [2]解放军理工大学训练部,南京210007
出 处:《电子科技大学学报》2007年第1期86-89,共4页Journal of University of Electronic Science and Technology of China
基 金:国家自然科学基金资助项目(60303024)
摘 要:针对数据稀疏问题,采用适应度函数较灵活的遗传算法做语义的自动标注;以《同义词词林》的层次式结构为依据,提出了利用语义层次的提升来改善适应度函数中参数的估计质量;定义了语义层次的两个基本概念;阐述了语义提升的原理,并采用选择受限策略来解决因语义提升而引起的模型辨别力下降问题;实现了用于语义标注的遗传算法。实验表明该算法在语义标注中能适应不同训练数据量,具有一定的可行性。A genetic algorithm with adaptive evaluation function is presented to deal with data sparseness problem in automatic semantic tagging. Taking advantage of the hierarchy structure of Synonymy Thesaurus, semantic induction is used to improve the quality in estimating the parameters of the function in genetic algorithm. Based on the definitions of two fundamental concepts, the principle of semantic induction is described. Restrictive selection policy is applied to reverse the decline of model's discernment caused by the induction. Finally, the genetic algorithm is implemented and testing results show that the algorithm is feasible to different training data sizes.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229