王弘蔚

作品数:8被引量:126H指数:3
导出分析报告
供职机构:北京拓尔思信息技术股份有限公司更多>>
发文主题:NATIVE检索引擎全文检索引擎HU不变矩RSS更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《中文信息学报》《计算机工程与应用》《北京信息科技大学学报(自然科学版)》《情报学报》更多>>
所获基金:国家自然科学基金北京市教委科技发展计划北京市属高等学校人才强教计划资助项目国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-8
视图:
排序:
机械设计图像检索研究
《北京信息科技大学学报(自然科学版)》2013年第3期34-38,共5页方乃伟 吕学强 王弘蔚 林春雨 
国家自然科学基金项目(61271304);北京市教委科技发展计划项目(KM201110772021);国家科技支撑计划课题(2011BAH11B03)
基于内容的机械设计图像检索目前尚无针对性的研究,提出利用形状特征作为图像检索的标准,根据机械设计图像的特点,对3种不同的形状特征描述子的检索性能进行研究,分别提取图像库中各个图像的傅里叶描述子、Hu不变矩和距离分布直方图特征...
关键词:机械设计图 傅里叶描述子 HU不变矩 距离直方图 
基于加权距离的机械设计图像异步检索方法被引量:5
《计算机应用》2013年第5期1406-1410,共5页方乃伟 吕学强 张丹 王弘蔚 
国家自然科学基金资助项目(61271304);北京市教委科技发展计划重点项目(KZ201311232037);国家科技支撑计划项目(2011BAH11B03)
根据机械设计图像的形状特征,提出一种利用加权距离实现的多特征异步检索方法。首先利用机械设计图像的外接圆距离特征进行初步检索,再结合初步检索结果集的位置计算输入图像和初步检索结果集的加权Hu不变矩特征距离,并据此获得最终的...
关键词:机械设计图像 外接圆距离 HU不变矩 加权距离 异步检索 
基于信息熵与词语活跃度的领域词抽取被引量:1
《北京信息科技大学学报(自然科学版)》2011年第5期49-52,58,共5页王成 吕学强 王弘蔚 王涛 
核高基项目(2010ZX01042-002-002);国家自然科学基金项目(60872133);北京市自然科学基金项目(4092015)
提出了一种基于信息墒和词语活跃度的领域词抽取方法,通过对语料进行预处理,提取出候选领域词,计算所有候选领域词的正规化类间分布(NCD)和正规化类内分布(NDD),设置阈值对候选领域词过滤,最后分析了双字候选领域词中包含的常见噪音词语...
关键词:领域词抽取 领域词过滤 信息熵 词语活跃度 知识获取 自然语言处理 
基于关键名词短语聚类的中文搜索结果聚类被引量:1
《计算机工程与应用》2009年第31期118-121,共4页麻雪云 肖诗斌 王弘蔚 施水才 
国家高技术研究发展计划(863)No.2006AA010105;国家自然科学基金No.60772081;北京市属市管高校人才强教计划项目(No.PXM2007_014224_044677;No.PXM2007_014224_044676);北京市教委科技发展计划项目(No.KM200710772010)~~
目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,...
关键词:搜索结果聚类 关键名词短语抽取 C-Value算法 CHAMELEON算法 
基于新型主题信息量化方法的Web主题信息提取研究被引量:1
《现代图书情报技术》2008年第12期48-53,共6页吕聚旺 都云程 王弘蔚 施水才 
国家863计划重点项目“跨媒体搜索关键技术研究及服务产品开发”(项目编号:2006AA010105);国家自然科学基金项目“基于语义的中文文本聚类研究”(项目编号:60772081);北京市属市管高校人才强教计划项目“创新团队-智能搜索引擎和文本挖掘”(项目编号:PXM2007_014224_044677)的研究成果之一
针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采...
关键词:网页主题信息信息抽取信息块语义信息IB—DOM树 
一种改进的基于《知网》的词语语义相似度计算被引量:109
《中文信息学报》2008年第5期84-89,共6页江敏 肖诗斌 王弘蔚 施水才 
国家863计划重点资助项目(2006AA010105);国家自然科学基金资助项目(60772081);北京市属市管高校人才强教计划项目(PXM2007_014224_044677,PXM2007_014224_044676);北京市教委科技发展计划项目(KM200710772010)
中科院刘群的基于《知网》的词语相似度计算是当前比较有代表性的计算词语相似度的方法之一。在测试中我们发现对一些存在对义或反义的词语与同义、近义词语一样具有较高的相似度,一些明显相似的词反而相似度较低,如"美丽"与"贼眉鼠眼"...
关键词:计算机应用 中文信息处理 知网 词语相似度 义原 词语极性识别 
基于RSS的分布式新闻博客搜索引擎设计被引量:3
《现代图书情报技术》2007年第1期29-32,共4页刘峰 施水才 肖诗斌 王弘蔚 
国家自然科学基金项目"Web数据挖掘技术研究"(项目编号:60272084);北京市教育委员会科技发展计划重点项目"面向大规模真实文本的数据挖掘技术"(项目编号:KZ200310772013);北京市教委项目"中文垃圾邮件过滤和追踪技术研究"(项目编号:KM200510772008);"数字内容的安全身份认证与版权保护技术研究"(项目编号:KM200610772008)的研究成果之一
针对传统搜索引擎对频繁更新的新闻和博客网站的搜索实时性较差的现状,提出利用RSS提供的结构化数据,通过Pastry协议,实现索引的分布式存储和传输,同时使用Bloom filter数据结构压缩索引文件,构建一个基于RSS的P2P分布式的新闻博客搜索...
关键词:RSS PASTRY BLOOM filter分布式搜索引擎 
一种基于Native XML的全文检索引擎被引量:6
《情报学报》2003年第5期550-556,共7页王弘蔚 肖诗斌 
随着XML的日益流行,基于XML的全文检索应用需求也迅速扩大.在这些应用中,native-XML数据库是发展方向.虽然商业化的native-XML数据库已经出现,但其全文检索的性能还不尽人意.本文提出一种方法:在传统的倒排索引的框架下,对XML的标记建...
关键词:NATIVE-XML数据库 全文检索 倒排索引 全文数据库 检索引擎 
检索报告 对象比较 聚类工具 使用帮助 返回顶部