检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]信息工程大学,河南郑州450001
出 处:《信息工程大学学报》2017年第1期103-110,共8页Journal of Information Engineering University
基 金:国家自然科学基金资助项目(61309007);国家863计划资助项目(2012AA012902);国家科技支撑计划资助项目(2012BAH47B01)
摘 要:近年来,微博凭借着自身的特点发展成为社会公共舆论的重要平台,对国家安全和社会发展产生了深远的影响,由此对微博文本主题提取显得格外重要。目前,文本主题挖掘的主流技术是主题概率模型。为此,首先对主题概率模型中LDA模型进行了详细地介绍;其次分析了微博的数据特点,从存在噪音词汇、微博文本短小以及微博的时序性等3个方面综述了主题概率模型在微博主题挖掘方面的研究;近一步又综述了利用主题模型发现基于主题的社团关系的研究;最后总结了未来主题模型在挖掘微博主题方面存在的挑战。In recent years, microblog has become an important platform of social public opinion with its own characteristics, which can influence national security and social development. As such, mi- croblog topic mining is of particular significance. Currently, the main technology of topic mining in text is probability topic model. First, the LDA topic model was introduced briefly. Next, the paper analyzed the characteristics of the microblog data and summarized the research works on application of probability topic model in microblog topic mining from three aspects: short text, noise removal and the timing of microblog text. In addition, the application of probability topic model in mieroblog community discovery was introduced. Finally, some existing challenges were pointed out.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.70