基于短文本信息流的回顾式话题识别模型  被引量:3

Retrospective Topic Identification Model for Short Text Information Flow

在线阅读下载全文

作  者:周泓[1] 刘金岭[1] 王新功[2] 

机构地区:[1]淮阴工学院计算机工程学院,江苏淮安223005 [2]沧州师范学院计算机系,河北沧州061000

出  处:《中文信息学报》2015年第1期111-117,132,共8页Journal of Chinese Information Processing

基  金:河北省科技支撑计划项目(10213581);淮安市社会发展项目(HASZ2012046);淮安市科技支撑计划(工业)项目(HAG2012086)

摘  要:近几年来,短文本信息流广泛应用于一些全民媒体,它在公开传递信息同时携带了丰富且具有极大价值的信息资源。该文提出了一种回顾式话题识别模型,改进了权值计算方法,有效提取了具有较强分辨话题能力的关键词,在聚类过程中将BIC值作为话题类别合并依据,提高了聚类的准确率。通过进行时间段分隔和去掉孤立点信息提高了算法的效率。实验结果表明,该方法有效地提高了短文本信息流的话题检测准确率和效率。In recent years, the short text information flow has occured in some public media. For this kind of data, a retrospective topic identification model is presented with an improved weight estimation. It employes the value of BIC for clustering to improve the clustering accuracy. By dividing the time segments and removing isolated information point, the efficiency of the algorithm is further improved. The experimental results show that this method achieves good accuracy and efficiency in the topic detection of the short text information flow.

关 键 词:短文本 信息流 话题识别 聚类 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象