基于球面自编码器的文本分类  

A Text Classification Method Based on Spherical Auto-Encoder

在线阅读下载全文

作  者:赵书安 ZHAO Shu’an(School of Information Engineerin,Jiangsu Open University,Nanjing Jiangsu 210065,China;School of Electronic and Optical Engineering,Nanjing University of Science and Technology,Nanjing Jiangsu 210094,China)

机构地区:[1]江苏开放大学信息工程学院,江苏南京210065 [2]南京理工大学电子工程与光电技术学院,江苏南京210094

出  处:《电子器件》2021年第6期1417-1420,共4页Chinese Journal of Electron Devices

摘  要:针对变分自编码器在文本分类应用中经常发生的后验塌陷问题,提出了一种基于球面自编码器的文本分类方法。首先,将变分自编码器中隐变量所服从的分布由多元高斯分布替换为冯米塞斯-费舍尔球面分布,从理论上解决了后验塌陷,得到了高质量的文本特征表示。在三个文本分类数据集上的实验结果表明,所提出的方法优于原始的变分自编码器文本分类方法。Aiming at the posterior collapse problem that often occurs in the text classification application of the Variational auto-encoder, a text classification method based on the spherical auto-encoder is proposed. First, the distribution of the hidden variables in the Variational auto-encoder is replaced by the multivariate Gaussian distribution with the von Mises-Fisher spherical distribution, which theoretically solves the posterior collapse and obtains a high-quality text feature representation. Experimental results on three text classification data sets show that the proposed method is better than the original Variational auto-encoder text classification method.

关 键 词:文本分类 变分自编码器 冯米塞斯-费舍尔分布 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象