基于数据选择和局部伪标注的跨领域语义依存分析研究  

Domain Adaptation of Dependency Parsing Based on Data Selection and Partial Pseudo Annotation

在线阅读下载全文

作  者:毛达展 喻快 邵艳秋[1] MAO Dazhan;YU Kuai;SHAO Yanqiu(National Language Resources Monitoring and Research Center(CNLR)Print Media Language Branch,School of Information Science,Beijing Language and Culture University,Beijing 100083,China)

机构地区:[1]北京语言大学信息科学学院国家语言资源监测与研究平面媒体中心,北京100083

出  处:《中文信息学报》2023年第6期15-24,共10页Journal of Chinese Information Processing

基  金:国家自然科学基金(61872402);教育部人文社科规划基金(17YJAZH068);北京语言大学校级项目(中央高校基本科研业务费专项资金)(18ZDJ03)。

摘  要:语义依存分析要走向实用,模型从单领域迁移到其他领域的领域适应能力至关重要。近年来,对抗学习针对领域适应任务取得了较好的效果,但对目标领域的无标注数据利用率并不高。该文使用自训练方法用来提高无标注数据的利用效率,弥补对抗学习方法的不足。但传统的自训练方法效率和性能并不好,为此该文针对跨领域语义依存分析任务,尝试强化学习数据选择器,提出了局部伪标注的标注策略,实验结果证明,该文所提出的模型优于基线模型。Domain adaptation is crucial to the application of dependency parsing,and the recent solution is the adversarial learning.To better utilize the unlabeled data in the target domain,we proposes to combine the adversarial learning and self-training,and design a strategy of data selection plus partial pseudo annotation for domain adaptation of dependency parsing.The experimental results prove the proposed method is superior to baseline model.

关 键 词:语义依存分析 领域适应 自训练方法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象