一个基于语境框架的文本特征提取算法  被引量:15

An Algorithm of Extracting Text Character Based on a Model of Context Framework

在线阅读下载全文

作  者:晋耀红[1] 苗传江[2] 

机构地区:[1]中国科学院声学研究所,北京100080 [2]北京语言大学语言信息处理研究所,北京100083

出  处:《计算机研究与发展》2004年第4期582-586,共5页Journal of Computer Research and Development

基  金:国家"九七三"重点基础研究发展规划基金项目 (G19980 3 0 5 0 6)

摘  要:介绍了一种新的文本语义形式化模型———语境框架 语境框架是一个三维的语义描述 ,它把文本内容抽象成领域(静态范畴 )、情景 (动态描述 )、背景 (褒贬、参照等 ) 3个框架 在语境框架的基础上 ,设计实现了文本特征提取算法 算法从语义入手 ,实现了 4元组表示的领域提取算法、以领域句类为核心的情景提取算法和以对象语义立场网络图为基础的褒贬判断 算法可以有效地处理语言中的褒贬倾向、同义、多义等现象 。A model of semantic based text formalization, the context framework model(CFM) is presented in this paper, which is three coordinate and describes the text as domain, situation and background Based on the context framework, a text character extracting algorithm is developed The algorithm includes domain extracting which uses 4 element array, situation extracting which is triggered by domain sentence category, and background extracting which focuses on the confusion of the commendatory and derogatory based on object semantic stand net As a result, the CFM is a very good model for text retrieval, and the algorithm can remarkably improve the efficiency of text retrieval

关 键 词:文本特征提取 语境框架模型 领域 情景 背景 领域句类 对象语义立场网络 褒贬 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP391[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象