一种对聊天文本进行特征选取的方法研究  

A Study on the Method of Feature Selection in Chat Text

在线阅读下载全文

作  者:李盛瑜[1] 何文[1] 

机构地区:[1]重庆工商大学

出  处:《计算机科学》2007年第5期202-204,共3页Computer Science

摘  要:由于网络聊天文本具有结构松散、简短、上下文相关等特点,对其进行特征选取时使用传统的TFIDF(Term Frequency Inverse Document Frequency)算法存在较大缺陷。针对这个问题,本文提出了一种通过聊天主题来确定聊天文本的特征选取范围的方法,并通过实验验证了该方法的有效性。Because online chat text is loosely and briefly organized and is context dependent, there are some defects to select features by using traditional TFIDF (Term Frequency Inverse Document Frequency). Aiming at solving the problem, this paper presents a method that the range of feature selection in chat text is obtained by using chat subjects, and the validity of the method is verified through experiment.

关 键 词:文本挖掘 聊天文本 TFIDF 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象