未登录词识别

作品数:52被引量:729H指数:12
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周蕾黄德根曾依灵许洪波朱巧明更多>>
相关机构:中国科学院苏州大学大连理工大学南京师范大学更多>>
相关期刊:《常熟理工学院学报》《烟台大学学报(自然科学与工程版)》《测绘科学》《情报杂志》更多>>
相关基金:国家自然科学基金江苏省自然科学基金国家重点基础研究发展计划江苏省教育厅自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 机构=中国科学院x
条 记 录,以下是1-4
视图:
排序:
基于分词提取重复串的未登录词遗漏量化模型被引量:5
《中文信息学报》2011年第2期122-128,共7页张海军 史树敏 丁溪源 黄河燕 
国家自然科学基金资助项目(60672149);国家863计划重点资助项目(2006AA010109)
基于重复串构造候选词集合是未登录词识别(UWI)的重要方法,目前有两种策略用于重复串提取:基于字符和基于分词。该文针对这两种策略实施了大量对比研究,并提出了基于分词提取重复串的未登录词遗漏量化模型,用以评估未登录词漏召问题。...
关键词:未登录词识别 重复串 条件随机域模型 中文分词 
网络文本主题词的提取与组织研究被引量:14
《中文信息学报》2008年第3期64-70,80,共8页曾依灵 许洪波 白硕 
国家973“大规模文本内容计算”课题资助项目(2004CB318109)
网络信息的指数爆炸给人们获取与掌控信息带来了困扰,为了挖掘海量信息中的关键因子并以恰当的方式进行组织,本文设计了网络文本主题词提取和组织算法。该算法基于多级滤噪的切分词拼接,利用特定的噪音库与滤噪策略严格控制拼接过程,在...
关键词:计算机应用 中文信息处理 主题词提取 未登录词识别 切分词拼接 主题词聚类 
网络热点信息发现研究被引量:29
《通信学报》2007年第12期141-146,共6页曾依灵 许洪波 
国家重点基础研究发展计划("973"计划)基金资助项目(2004CB318109)~~
为了有效挖掘海量网络数据中的热点信息,设计了网络热点信息发现算法。基于多级滤噪进行切分词拼接,利用特定的噪声库与多级滤噪策略严格控制拼接过程,挑选合理的收录策略,提取出能够准确反映海量网络数据中热门事件的热点信息串。在TD...
关键词:热点信息发现 未登录词识别 切分词拼接 
基于层叠隐马模型的汉语词法分析被引量:198
《计算机研究与发展》2004年第8期1421-1429,共9页刘群 张华平 俞鸿魁 程学旗 
国家"九七三"重点基础研究发展规划项目 (G19980 3 0 5 0 7 4;G19980 3 0 5 10 ) ;中国科学院计算技术研究所领域前沿青年基金项目( 2 0 0 2 6180 2 3 )
提出了一种基于层叠隐马模型的汉语词法分析方法 ,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中 在分词方面 ,采取的是基于类的隐马模型 ,在这层隐马模型中 ,未登录词和词典中收录的普通词一样处理 ...
关键词:汉语词法分析 分词 词性标注 未登录词识别 层叠隐马模型 ICTCLAS 
检索报告 对象比较 聚类工具 使用帮助 返回顶部