基于子词的化学术语嵌入表示研究  

在线阅读下载全文

作  者:孙瑜 史普润[2] SUN Yu;SHI Purun

机构地区:[1]江苏大学计算机科学与通信工程学院,江苏镇江212013 [2]南京航空航天大学经济与管理学院,江苏南京210016

出  处:《信息技术与信息化》2022年第7期50-57,共8页Information Technology and Informatization

基  金:国家社会科学基金一般规划项目“大数据时代支持创新设计的多维度多层次专利文本挖掘研究”(项目编号:17BTQ059)研究成果之一。

摘  要:针对基于词嵌入模型不能准确表征低频化学术语嵌入的问题,提出了基于子词的化学术语嵌入表示方法,以提高低频化学术语嵌入表示的准确性。首先,引入化学术语词典,利用字节对编码方法,自动生成子词词表;其次,根据生成的子词词表,对化学术语进行编码,使用子词表示化学术语;最后,利用改进的词嵌入模型训练相关文本语料,根据子词嵌入计算化学术语嵌入,最终得到化学术语嵌入表示。实验结果表明,与已有的方法相比,方法能够有效地提高化学术语嵌入表示的准确性,特别是低频化学术语嵌入表示的准确性。

关 键 词:化学术语 嵌入表示 子词 

分 类 号:O6-0[理学—化学] TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象