基于柔性匹配的中文文本特征提取方法  被引量:3

Feature Extraction Method in Chinese Text Based on Flexible Matching

在线阅读下载全文

作  者:帅正化[1] 周学广[1] 

机构地区:[1]海军工程大学电子工程学院,武汉430033

出  处:《计算机工程》2010年第16期63-64,70,共3页Computer Engineering

摘  要:针对含有变形关键词的不良信息过滤问题,提出一种基于柔性匹配的中文文本特征信息提取方法。该方法采用柔性匹配技术识别和提取变形关键词,改进向量空间模型中特征项权重的计算方法,对具有变形形式的关键词赋予较高权重,从而提高特征信息的提取效率。实验结果表明,该方法可在保证过滤准确率的前提下,获得较高的召回率。Aiming at the problem of filtering malicious information which contains transformed keyword,this paper presents a feature extraction method in Chinese text based on flexible matching.The method adopts flexible matching technology to identify transformed keyword,improves the computational method of feature term weight in Vector Space Model(VSM).The keyword which has transmutative form is endowed high weight to enhance extraction efficiency for feature information.Experimental result shows that the method of feature information extraction for filtering has high recall in the condition of ensuring precision.

关 键 词:柔性匹配 特征信息提取 变形关键词 特征项权重 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象