检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]淮阴工学院计算机工程学院,淮安223003 [2]沧州师范学院计算机系,沧州061001
出 处:《现代图书情报技术》2013年第2期43-49,共7页New Technology of Library and Information Service
基 金:河北省科技支撑计划项目"手机垃圾短信语义识别与分类"(项目编号:10213581);淮安市社会支撑基金项目"基于数据挖掘的淮安市人力资源及就业状况研究"(项目编号:HASZ2012046)的研究成果之一
摘 要:针对手机短信文本信息流的特点,设计一种自动文摘生成模型。该模型利用词共现定义语义相似度,根据TF-IDF定义特征词权值以及文摘候选句权值。算法通过清除孤立点、根据权值筛选文摘句以及文摘句排序,生成冗余度较小且可读性较好的短信文本信息流文摘。相关数据实验证明,文摘句的生成质量和算法效率都比较高。Due to the characteristics of mobile short message text information flow in the practical application, an auto- matic digest generation model is designed. The model uses word co- occurrence to define the semantic similarity. Using the TF - IDF, weights of feature words and abstracts candidate sentence weights are defined in the model. By removing iso- lated points, the algorithm generates smaller redundancy and more readable short text messages flow digest according to the weight screening abstract and abstract sort. Experiments of the relevant data show that the model has better quality and higher efficiency in abstract generation.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.91