国家自然科学基金(60773027)

作品数:6被引量:161H指数:4
导出分析报告
相关作者:孙乐李文波张大鲲冯元勇诺明花更多>>
相关机构:中国科学院软件研究所中国科学院研究生院更多>>
相关期刊:《电子学报》《通信学报》《中文信息学报》《计算机学报》更多>>
相关主题:自然语言处理计算机应用中文信息处理中文命名实体识别条件随机场更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-4
视图:
排序:
基于小规模尾字特征的中文命名实体识别研究被引量:26
《电子学报》2008年第9期1833-1838,共6页冯元勇 孙乐 张大鲲 李文波 
国家自然科学基金(No.60773027,60736044);863重点项目(No.2006AA010108);国家242项目计划(No.2006A40)
本文针对难度最大的两类命名实体(地名和机构名)在条件随机场框架下首次引入了小规模的常用尾字特征.实验表明,该特征与词类特征具有一定的互补性,联合使用可以以较小的训练代价显著提高专有名词的识别性能,特别是机构名的识别精度.该...
关键词:中文命名实体识别 小规模尾字特征 条件随机场 自然语言处理 机器学习 
基于Labeled-LDA模型的文本分类新算法被引量:103
《计算机学报》2008年第4期620-627,共8页李文波 孙乐 张大鲲 
国家自然科学基金项目(60773027);国家自然科学基金重点项目(60736044);国家“八六三”高技术研究发展计划重点项目基金(2006AA010108)资助~~
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种能够提取文本隐含主题的非监督学习模型.通过在传统LDA模型中融入文本类别信息,文中提出了一种附加类别标签的LDA模型(Labeled-LDA).基于该模型可以在各类别上协同计算隐含主题...
关键词:文本分类 图模型 隐含狄利克雷分配 变分推断 
基于核方法的敏感信息过滤的研究被引量:8
《通信学报》2008年第4期57-62,共6页李文波 孙乐 诺明花 吴健 
国家自然科学基金资助项目(60773027,60736044);国家高技术研究发展计划(“863”计划)基金资助项目(2006AA010108);国家信息安全计划(“242”计划)基金资助项目(2005A18,2006A40)~~
在深入分析敏感信息过滤任务的特点和难点的基础上,针对现有一般的信息过滤方法的不足,提出了一种利用敏感词的组合信息来改进过滤效果的思想。进而,研究了在核方法的框架下特征共现行为建模的原则并提出了复合ANOVA核来刻画特征组合行...
关键词:信息过滤 内容安全 核方法 特征空间 
基于单字提示特征的中文命名实体识别快速算法被引量:25
《中文信息学报》2008年第1期104-110,共7页冯元勇 孙乐 李文波 张大鲲 
国家自然科学基金资助项目(60773027,60736044);国家863计划重点资助项目(2006AA010108);国家242计划资助项目(2006A40);国家语委资助项目(MZ115-021)
近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降...
关键词:计算机应用 中文信息处理 中文命名实体识别 条件随机场 自然语言处理 机器学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部