未登录词识别

作品数:52被引量:729H指数:12
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周蕾黄德根曾依灵许洪波朱巧明更多>>
相关机构:中国科学院苏州大学大连理工大学南京师范大学更多>>
相关期刊:《常熟理工学院学报》《烟台大学学报(自然科学与工程版)》《测绘科学》《情报杂志》更多>>
相关基金:国家自然科学基金江苏省自然科学基金国家重点基础研究发展计划江苏省教育厅自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=国家重点基础研究发展计划x
条 记 录,以下是1-4
视图:
排序:
网络文本主题词的提取与组织研究被引量:14
《中文信息学报》2008年第3期64-70,80,共8页曾依灵 许洪波 白硕 
国家973“大规模文本内容计算”课题资助项目(2004CB318109)
网络信息的指数爆炸给人们获取与掌控信息带来了困扰,为了挖掘海量信息中的关键因子并以恰当的方式进行组织,本文设计了网络文本主题词提取和组织算法。该算法基于多级滤噪的切分词拼接,利用特定的噪音库与滤噪策略严格控制拼接过程,在...
关键词:计算机应用 中文信息处理 主题词提取 未登录词识别 切分词拼接 主题词聚类 
网络热点信息发现研究被引量:29
《通信学报》2007年第12期141-146,共6页曾依灵 许洪波 
国家重点基础研究发展计划("973"计划)基金资助项目(2004CB318109)~~
为了有效挖掘海量网络数据中的热点信息,设计了网络热点信息发现算法。基于多级滤噪进行切分词拼接,利用特定的噪声库与多级滤噪策略严格控制拼接过程,挑选合理的收录策略,提取出能够准确反映海量网络数据中热门事件的热点信息串。在TD...
关键词:热点信息发现 未登录词识别 切分词拼接 
基于层叠隐马模型的汉语词法分析被引量:198
《计算机研究与发展》2004年第8期1421-1429,共9页刘群 张华平 俞鸿魁 程学旗 
国家"九七三"重点基础研究发展规划项目 (G19980 3 0 5 0 7 4;G19980 3 0 5 10 ) ;中国科学院计算技术研究所领域前沿青年基金项目( 2 0 0 2 6180 2 3 )
提出了一种基于层叠隐马模型的汉语词法分析方法 ,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中 在分词方面 ,采取的是基于类的隐马模型 ,在这层隐马模型中 ,未登录词和词典中收录的普通词一样处理 ...
关键词:汉语词法分析 分词 词性标注 未登录词识别 层叠隐马模型 ICTCLAS 
基于决策树的汉语未登录词识别被引量:23
《中文信息学报》2004年第1期14-19,共6页秦文 苑春法 
国家自然科学基金资助项目 (6 9975 0 0 8);国家重点基础研究 973资助项目 (G19980 30 5 0 7)
未登录词识别是汉语分词处理中的一个难点。在大规模中文文本的自动分词处理中 ,未登录词是造成分词错识误的一个重要原因。本文首先把未登录词识别问题看成一种分类问题。即分词程序处理后产生的分词碎片分为‘合’(合成未登录词 )和...
关键词:人工智能 自然语言处理 未登录词识别 数据挖掘 决策树 C4.5算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部