检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:顾益军[1] 于江德[1] 刘群[2] 樊孝忠[1]
机构地区:[1]北京理工大学计算机系,北京100081 [2]中科院计算所,北京100080
出 处:《计算机工程与应用》2004年第1期58-59,70,共3页Computer Engineering and Applications
基 金:国家973重点基础研究发展规划项目(编号:G1998030507-4)
摘 要:该文尝试利用领域知识库,实现受限领域中文文本内容主题概念识别,并尝试利用领域概念建立特征向量,实现受限领域文本与主题概念的相关度计算。其中,利用领域知识库进行主题特征识别,利用知识库中概念间的关系进行特征项权重的计算,并利用knn算法进行文本与主题概念的相关度计算。实现了基于词汇分析技术和基于领域知识计算相结合的方式下,受限领域中文文本内容主题概念的识别和文本与主题概念的相关度计算。实验结果显示,主题识别平均正确率为79%文本与主题概念的相关度计算的正确率达到62%。This paper tries to use domain knowledge to realize the id entification of Chinese textual topic in domain-dependent ,tries to use domain knowledge to build characteristic vector,and achieves relevancy computation be tween text and topic in domain-dependent.According to using domain knowledge t o identify topic feature,and utilizing relevancy among concepts in domain knowl edge to calculate feature weight ,we have accomplish to identify Chinese textu al topic,computing the relevancy between text and topic by KNN algorithm to imp rove the effect of the relevancy computation.The identification and relevancy c omputation is based on the combination of lexical analysis and domain knowledge analysis.Experiment results show that the average accuracy of topic identifica tion reaches79%,and relevancy computation reaches62%by this approach.
分 类 号:TP391.06[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.137.142.253