检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈迪[1] 代艳君[1] 王志锋[1] CHEN Di;DAI Yanjun;WANG Zhifeng(School of Educational Information Technology, Central China Normal University, Wuhan 430000, China)
机构地区:[1]华中师范大学教育信息技术学院,武汉430000
出 处:《计算机工程与应用》2017年第16期36-44,共9页Computer Engineering and Applications
基 金:国家自然科学基金(No.61501199);国家科技支撑计划(No.2015BAK33B02)
摘 要:伴随着互联网大数据时代的来临,网络论坛数据呈爆炸式增长,这类数据具有社会性、随意性、分散性等特点,难以被直接使用。而论坛主题挖掘技术能从复杂的论坛数据中识别出用户集中讨论的文本内容,并从中提取主题,以达到提炼论坛主要论点的目的。对论坛主题挖掘进行了问题描述和任务框架梳理,并依照任务框架对现有技术进行了分类,基本类型为论坛文本预处理、主题挖掘算法和主题建模,详细阐述了以上三类论坛主题挖掘技术的基本特征和典型方法,进行了比较与总结,对论坛主题挖掘当前存在的问题及其发展趋势进行了分析与讨论。With the advent of the big data age,network forum data which is social,randomness and decentralized is exploding and difficult to be used directly.Forum topic mining can refine the main forum argument yet.It can identify the content of the user’s discussion from the complex forum data and extract the theme.This paper describes the problem and the framework of the forum topic mining,and classifies of existing technologies,basic types as forum text preprocessing,topic mining algorithm and topic modeling.Then,the basic characteristics and typical methods of the above three kinds of topic mining technology are described,compared and summarized in detail.At the end of the paper,discusses and analyzes the current problems and development trend of the forum topic mining.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.186