手机短信文本信息流的自动文摘生成  被引量:4

Automatic Abstracting Generating Based on Mobile Short Message Text Information Flow

在线阅读下载全文

作  者:刘金岭[1] 倪晓红[2] 王新功[2] 

机构地区:[1]淮阴工学院计算机工程学院,淮安223003 [2]沧州师范学院计算机系,沧州061001

出  处:《现代图书情报技术》2013年第2期43-49,共7页New Technology of Library and Information Service

基  金:河北省科技支撑计划项目"手机垃圾短信语义识别与分类"(项目编号:10213581);淮安市社会支撑基金项目"基于数据挖掘的淮安市人力资源及就业状况研究"(项目编号:HASZ2012046)的研究成果之一

摘  要:针对手机短信文本信息流的特点,设计一种自动文摘生成模型。该模型利用词共现定义语义相似度,根据TF-IDF定义特征词权值以及文摘候选句权值。算法通过清除孤立点、根据权值筛选文摘句以及文摘句排序,生成冗余度较小且可读性较好的短信文本信息流文摘。相关数据实验证明,文摘句的生成质量和算法效率都比较高。Due to the characteristics of mobile short message text information flow in the practical application, an auto- matic digest generation model is designed. The model uses word co- occurrence to define the semantic similarity. Using the TF - IDF, weights of feature words and abstracts candidate sentence weights are defined in the model. By removing iso- lated points, the algorithm generates smaller redundancy and more readable short text messages flow digest according to the weight screening abstract and abstract sort. Experiments of the relevant data show that the model has better quality and higher efficiency in abstract generation.

关 键 词:手机短信文本 信息流 文摘 权值 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象