广东省科技计划工业攻关项目(2010B010600017)

作品数:3被引量:38H指数:3
导出分析报告
相关作者:王振宇吴泽衡唐远华胡方涛郭力更多>>
相关机构:华南理工大学更多>>
相关期刊:《计算机工程与设计》《计算机工程》《计算机工程与科学》更多>>
相关主题:知网词语HOWNETPMI互信息更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-3
视图:
排序:
基于HowNet和PMI的词语情感极性计算被引量:32
《计算机工程》2012年第15期187-189,193,共4页王振宇 吴泽衡 胡方涛 
广东省科技计划基金资助项目"基于情感极性分析的互联网敏感信息监控系统项目号"(2010B010600017)
基于语料库的点互信息(PMI)计算方法依赖于语料库的完善性,基于HowNet的计算方法则依赖于知网相似度计算的准确性。为克服2种方法的局限性,提出一种HowNet和PMI相融合的词语极性计算方法,利用知网进行同义词扩展,降低情感词在语料库中...
关键词:情感分析 点互信息 知网 同义词扩展 相似度 
面向分层结构的网页分类与抓取被引量:3
《计算机工程与科学》2012年第11期1-6,共6页王振宇 唐远华 郭力 
广东省科技计划基金资助项目(2010B010600017)
传统网络爬虫为基于关键字检索的通用搜索引擎服务,无法抓取网页类别信息,给文本聚类和话题检测带来计算效率和准确度问题。本文提出基于站点分层结构的网页分类与抽取,通过构建虚拟站点层次分类树并抽取真实站点分层结构,设计并实现了...
关键词:网络爬虫 网页分类 领域知识库 知网 
基于多向量和二次聚类的话题检测被引量:3
《计算机工程与设计》2012年第8期3214-3218,共5页王振宇 吴泽衡 唐远华 
广东省科技计划基金项目(2010B010600017)
话题检测技术是互联网新闻热点挖掘的基础,为解决基于传统的话题检测较少利用报道中的类别信息以及命名实体信息来提高检测效果,提出一种基于多向量相似度计算和二次聚类的话题检测方法。将报道按照其所在的站点层次关系进行层次分类,...
关键词:话题检测 新闻热点 命名实体 相似度计算 聚类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部