恽佳丽

作品数:2被引量:7H指数:1
导出分析报告
供职机构:北京交通大学更多>>
发文主题:抽取算法基于语料库统计学数据挖掘语料库更多>>
发文领域:自动化与计算机技术语言文字更多>>
发文期刊:《北京交通大学学报》《计算机工程与科学》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
领域知识在文本聚类应用中的机遇和挑战被引量:7
《计算机工程与科学》2010年第6期88-91,121,共5页景丽萍 恽佳丽 于剑 
国家973计划资助项目(2007CB311002);国家自然科学基金资助项目(90820013;60875031;60905028)
最近几年,越来越多学者意识到单靠数据驱动的无监督聚类方法很难满足用户对富含语义信息的文本数据的处理需求。领域知识,如领域本体的人工或自动构建、百科全书Wikipedia的网上公布为文本处理带来了新的希望和美好的前景。本文主要阐...
关键词:领域知识 文本聚类 知识表示 文本表示模型 
基于语料库的多词单位抽取算法
《北京交通大学学报》2009年第5期121-125,131,共6页恽佳丽 何军 黄厚宽 
分析了研究者们在多词单位抽取算法中的一些工作,包括多词单位的评分和选择.将评分算法根据它们的设计依据划分为3类,对它们进行总结分析,并用实验进行了验证.本文还分析了多种评分算法的组合方法,使用这些组合方法可以互补各种评分算法...
关键词:多词单位 语料库 统计学 抽取算法 数据挖掘 
检索报告 对象比较 聚类工具 使用帮助 返回顶部