检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈默[1,2] 杨小平[1] 柳增[1] 孙丹雯[2]
机构地区:[1]中国人民大学信息学院,北京100872 [2]北京联合大学商务学院,北京100025
出 处:《计算机系统应用》2014年第8期1-9,共9页Computer Systems & Applications
基 金:国家自然科学基金(71271209);北京市优秀人才培养项目(2012D005022000013);北京市教育委员会社科计划面上项目(SM201311417008);北京联合大学人才强校计划人才资助项目(BPHR2012A02)
摘 要:随着大数据时代的到来,对网络信息的时效性进行评价已成为当今研究的热点.将以Web新闻作为研究对象,对大数据环境下的Web信息提取和中文分词处理等技术进行研究,并在此基础上,提出一种基于Web语义信息提取的网络信息时效性评价算法.实验结果将充分体现算法实现的有效性,既可引导网络用户关注更有价值的Web信息,也可帮助网站管理者构建一个时效性更高的网站.With the arrival of the big data era, the currency evaluation of network information has become a spot for today’s research. This paper will take Web news as the object of study and study the technology of Web information extraction and Chinese word segmentation in big data environment. On the basis of the above, this paper proposes an algorithm of network information currency evaluation based on Web semantic extraction method. The experimental results fully reflect the validity of the algorithm implementation. The study of technology plays a very important role in leading network users pay attention to more valuable Web information and helping Web site managers build a higher currency network.
关 键 词:Web语义提取 网络信息时效性 语义相似度 语义距离
分 类 号:TP393.092[自动化与计算机技术—计算机应用技术] TP391.1[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28