北京市属高等学校人才强教计划资助项目(PXM2007014224044677)

作品数:6被引量:143H指数:3
导出分析报告
相关作者:施水才吕学强王弘蔚都云程王涛更多>>
相关机构:北京信息科技大学北京拓尔思信息技术股份有限公司更多>>
相关期刊:《计算机工程与应用》《中文信息学报》《情报学报》更多>>
相关主题:条件随机场词语语义词语相似度《知网》相似度计算更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-6
视图:
排序:
基于多尺度条件随机场的文本图像二值化
《现代图书情报技术》2009年第4期79-81,共3页刘坤 吕学强 王涛 施水才 
863计划重点项目"跨媒体搜索关键技术研究及服务产品开发"(项目编号:2006AA010105);北京市属高等学校人才强教计划项目"创新团队-智能搜索引擎和文本挖掘"(项目编号:PXM2007_014224_044677);国家自然科学基金项目"基于语义分析和统计的自动主题标引研究"(项目编号:60872133)的研究成果之一
提出一种基于多尺度条件随机场(简称mCRF)的图像二值化算法。该算法将对图像的二值化看作一个标注过程,利用mCRF模型对图像中每个像素点进行标记,从而实现对整幅图像的二值化。mCRF模型属于判别式模型,可以容纳任意的非独立特征,从而充...
关键词:文本图像 二值化 多尺度条件随机场 特征函数 
基于条件随机场的英文地理行政实体识别被引量:5
《现代图书情报技术》2009年第2期51-55,共5页宗萍 施水才 王涛 吕学强 
“863”计划重点项目“跨媒体搜索关键技术研究及服务产品开发”(项目编号:2006AA010105);国家自然科学基金项目“基于语义分析和统计的自动主题标引研究”(项目编号:60872133);北京市属高等学校人才强教计划项目“创新团队-智能搜索引擎和文本挖掘”(项目编号:PXM2007_014224_044677)的研究成果之一
采用基于条件随机场的方法,对ACE评测的英文语料中的地理行政类型实体(Geographical Political Enti-ties,GPE)及其子类型进行识别。提出一种从ACE语料中选取的特征集,并根据不同的特征组合对GPE识别的贡献与其它特征集进行比较,实验表...
关键词:ACE评测 地理行政实体 实体识别 条件随机场 特征选择 
基于多层条件随机场的中文命名实体识别被引量:25
《计算机工程与应用》2009年第1期163-165,227,共4页胡文博 都云程 吕学强 施水才 
国家高技术研究发展计划(863);北京市属市管高校人才强教计划项目(No.PXM2007_014224_044677,No.PXM2007_014224_044676);北京市教委科技发展计划项目(No.KM200710772010)~~
命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识...
关键词:条件随机场 命名实体识别 命名实体 
基于新型主题信息量化方法的Web主题信息提取研究被引量:1
《现代图书情报技术》2008年第12期48-53,共6页吕聚旺 都云程 王弘蔚 施水才 
国家863计划重点项目“跨媒体搜索关键技术研究及服务产品开发”(项目编号:2006AA010105);国家自然科学基金项目“基于语义的中文文本聚类研究”(项目编号:60772081);北京市属市管高校人才强教计划项目“创新团队-智能搜索引擎和文本挖掘”(项目编号:PXM2007_014224_044677)的研究成果之一
针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采...
关键词:网页主题信息信息抽取信息块语义信息IB—DOM树 
句子重述技术在中文文本摘要中的应用被引量:3
《情报学报》2008年第6期897-901,共5页周强 施水才 李渝勤 吕学强 
863计划重点项目(2006AA010105);北京市教委科技发展计划项目(KM200710772010);北京市属市管高校人才强教计划项目(PXM2007_014224_044677,PXM2007_014224_044676).
本文提出了一种对中文文本摘要中抽取出的句子进行重述的方法。首先使用基于统计的方法对文本进行特征统计,计算词和句子的权重,摘取出权值较高的句子;然后对这些句子应用一种基于向量相似度计算的算法进行指代消解,同时提出一种新...
关键词:中文文本摘要 权重 相似度 信息处理 指代消解 句子重述技术 
一种改进的基于《知网》的词语语义相似度计算被引量:109
《中文信息学报》2008年第5期84-89,共6页江敏 肖诗斌 王弘蔚 施水才 
国家863计划重点资助项目(2006AA010105);国家自然科学基金资助项目(60772081);北京市属市管高校人才强教计划项目(PXM2007_014224_044677,PXM2007_014224_044676);北京市教委科技发展计划项目(KM200710772010)
中科院刘群的基于《知网》的词语相似度计算是当前比较有代表性的计算词语相似度的方法之一。在测试中我们发现对一些存在对义或反义的词语与同义、近义词语一样具有较高的相似度,一些明显相似的词反而相似度较低,如"美丽"与"贼眉鼠眼"...
关键词:计算机应用 中文信息处理 知网 词语相似度 义原 词语极性识别 
检索报告 对象比较 聚类工具 使用帮助 返回顶部