基于小规模标注语料的机器学习方法研究被引量：7

Analysis and Prospect Machine Learning Methods Based on Limited Corpus

机构地区：[1]清华大学智能技术与系统国家重点实验室,北京100084 [2]香港中文大学系统工程与工程管理学系

出　　处：《计算机应用》2004年第2期56-58,共3页journal of Computer Applications

摘　　要：文中通过讨论机器学习和自然语言处理之间的关系,论述了语料库语言工程中机器学习的困境,概述分析了应用半监督学习的现状,研究有限样本下结合未标注样本的方法和统计学习理论框架的结合前景。Many difficulties exist when applying machine learning techniques to statistical natural language processing. This paper surveys the status of semi-supervised machine learning methods combined with the unlabeled data and gives a prospect of method based on the semi-supervised and statistical learning theory under limited data, which can be break through the bottleneck to some degree.

关键词：机器学习语料库未标注样本 CO-TRAINING 主动学习统计学习理论

分类号：TP311[自动化与计算机技术—计算机软件与理论] TP181[自动化与计算机技术—计算机科学与技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于小规模标注语料的机器学习方法研究被引量：7

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于小规模标注语料的机器学习方法研究 被引量：7

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于小规模标注语料的机器学习方法研究被引量：7