检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:晋耀红[1]
出 处:《计算机工程与应用》2004年第16期36-39,共4页Computer Engineering and Applications
基 金:国家973重点基础研究发展规划项目资助"图象;语音;自然语言理解与知识挖掘"(编号:G1998030506)
摘 要:介绍了一种新的文本形式化的语义模型———语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)三个侧面。在语境框架的基础上,设计实现了文本相似度计算算法。算法从概念层面入手,充分考虑了文本的领域和对象的语义角色对相似度的影响,重点针对文本中的歧义、多义、概念组合现象,以及语言中的褒贬倾向,实现了文本间语义相似程度的量化。算法已经应用到文本过滤系统中,用以比较用户过滤要求和待过滤文本之间的相似度。实际应用中取得了比较满意的效果。A model of semantic-based text formalization,Context Framework Model(CFM)which is three-coordinate,de-scribes the text as domain,situation and background,is presented in this paper.Based on the Context Framework,the se-mantic frame of text is designed and the algorithm of computing semantic frame is developed.The algorithm,dealing with the domain of the text and the semantic role of the object,computes the synonymy ,polysemy ,and the combination a-mong concepts,and focus on the confusion of commendatory and derogatory.The algorithm is applying to the similarity computing between the queries and the texts in a system of text filtering.As a result,the algorithm can improve the ef-ficiency of text filtering.
关 键 词:文本相似度 语境框架 领域 情景 背景 文本语义结构 褒贬
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.187