中文信息处理评测资源建设现状与问题研究  被引量:1

Current Situation and Problems of Constructing Evaluative Sources for Chinese Information Processing

在线阅读下载全文

作  者:朱琦[1] 王敬[1] 

机构地区:[1]北京师范大学中文信息处理研究所,北京100875

出  处:《曲靖师范学院学报》2016年第2期72-77,共6页Journal of Qujing Normal University

基  金:国家语委"十二五"科研规划项目"语言资源建设规划研究"(YB125-124)

摘  要:自然语言处理任务复杂,并且涉及庞大的数据量,需要在同一数据集上进行可重复的测试来比较不同研究方法的优劣。因此,技术评测一直都是自然语言处理技术发展的重要驱动。本研究从多维度调研了国内影响力较大的自然语言处理技术评测,并同国际上的评测语言资源在语料来源、语料规模、语料库建设方法等进行了对比分析,总结了国内评测语言资源存在的不足,分析了评测语言资源的建设方向和发展趋势。Processing natural language,a complicated task,which involves in enormous data amount,requires to repeat the test on the same data set to compare the adcvantages and disadvantages of the research methods. The test of technology,therefore,is aways the important drive for the development of the processing techonology of natural language. The research is to investigate the domestic influential test of technology from diverse dimensions and compare them with the international ones from the aspects of corpus sources,corpus size and the methods for the construction of the corpus so that the shortcomings of the domestic technology can be found to know the tendency of the technology.

关 键 词:评测 语言资源 中文信息处理 

分 类 号:H08[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象