基于语境框架的文本相似度计算  被引量:27

Text Similarity Computing Based on Context Framework Model

在线阅读下载全文

作  者:晋耀红[1] 

机构地区:[1]中国科学院声学研究所,北京100080

出  处:《计算机工程与应用》2004年第16期36-39,共4页Computer Engineering and Applications

基  金:国家973重点基础研究发展规划项目资助"图象;语音;自然语言理解与知识挖掘"(编号:G1998030506)

摘  要:介绍了一种新的文本形式化的语义模型———语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)三个侧面。在语境框架的基础上,设计实现了文本相似度计算算法。算法从概念层面入手,充分考虑了文本的领域和对象的语义角色对相似度的影响,重点针对文本中的歧义、多义、概念组合现象,以及语言中的褒贬倾向,实现了文本间语义相似程度的量化。算法已经应用到文本过滤系统中,用以比较用户过滤要求和待过滤文本之间的相似度。实际应用中取得了比较满意的效果。A model of semantic-based text formalization,Context Framework Model(CFM)which is three-coordinate,de-scribes the text as domain,situation and background,is presented in this paper.Based on the Context Framework,the se-mantic frame of text is designed and the algorithm of computing semantic frame is developed.The algorithm,dealing with the domain of the text and the semantic role of the object,computes the synonymy ,polysemy ,and the combination a-mong concepts,and focus on the confusion of commendatory and derogatory.The algorithm is applying to the similarity computing between the queries and the texts in a system of text filtering.As a result,the algorithm can improve the ef-ficiency of text filtering.

关 键 词:文本相似度 语境框架 领域 情景 背景 文本语义结构 褒贬 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象