检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]淮阴工学院计算机工程学院,江苏淮安223003
出 处:《计算机工程与应用》2012年第7期132-134,共3页Computer Engineering and Applications
基 金:淮安科技计划项目(No.HAG09061);淮阴工学院重点基金项目(No.HGA0907)
摘 要:提出一种基于词汇链的中文短信文本主题的抽取方法。该方法首先通过构造多条词汇链来表达短信文本的叙事线索,并从多条词汇链中抽取出富含主题信息的词汇链,将其作为构造短信文本主题语句的关键词序列。实验表明该方法抽取的短信文本主题能够更全面地覆盖短信文本的信息,并能消除多个关键词序列表达同一主题信息的冗余。其效果明显优于采用统计信息进行短信文本主题抽取的方法。An algorithm for Chinese SMS text topic extraction based on lexical chain is proposed. By constructing lexical chains for each SMS text, the article’s multiple depiction clews can be reflected, and some strong lexical chains with high quality can be extracted to represent main content of this article, and as the subject phrase SMS text structure sequence. Experiments demonstrate that SMS text topic from this algorithm can cover SMS text information more completely. This algorithm can remove redundancy that different keyword sequence reflect same meanings. This method outperforms the method which uses statistics to perform extraction.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.149.239.180