基于小规模标注语料的机器学习方法研究  被引量:7

Analysis and Prospect Machine Learning Methods Based on Limited Corpus

在线阅读下载全文

作  者:李庆中[1] 苑春法[1] 黄锦辉[2] 

机构地区:[1]清华大学智能技术与系统国家重点实验室,北京100084 [2]香港中文大学系统工程与工程管理学系

出  处:《计算机应用》2004年第2期56-58,共3页journal of Computer Applications

摘  要:文中通过讨论机器学习和自然语言处理之间的关系,论述了语料库语言工程中机器学习的困境,概述分析了应用半监督学习的现状,研究有限样本下结合未标注样本的方法和统计学习理论框架的结合前景。Many difficulties exist when applying machine learning techniques to statistical natural language processing. This paper surveys the status of semi-supervised machine learning methods combined with the unlabeled data and gives a prospect of method based on the semi-supervised and statistical learning theory under limited data, which can be break through the bottleneck to some degree.

关 键 词:机器学习 语料库 未标注样本 CO-TRAINING 主动学习 统计学习理论 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论] TP181[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象