基于神经网络的生物序列分类探析  

在线阅读下载全文

作  者:郭育洲 周小安[1] 林洋[1] 

机构地区:[1]深圳大学电子与信息工程学院

出  处:《数字技术与应用》2024年第11期152-156,共5页Digital Technology & Application

摘  要:生物序列分类是生物信息学研究中的一个重要领域,生物序列数据的快速增长增加了生物序列分类的难度,而深度学习的发展则有助于生物序列的分类。广泛使用的监督BP神经网络需要标记大量的样本,而现实中得到的往往是没有标记的数据集,且标记的工作也变得十分烦琐。针对此问题,本文提出了一种基于词频-逆文档频率算法(Term Frequency-Inverse Document Frequency,TF-IDF)提取生物序列特征后输入BP神经网络,再通过半监督自训练环节多次迭代以增加数据集的规模。实验表明,该方法与传统的滑动窗口法在准确度、召回率、精确率、F1分数和AUC-ROC曲线下的面积值都有明显的提升,同时也减轻了标记的工作量,对深入研究生物序列的分类有一定的参考价值。

关 键 词:BP神经网络 生物序列 滑动窗口法 ROC曲线 序列分类 深度学习 DOCUMENT 训练环节 

分 类 号:TP183[自动化与计算机技术—控制理论与控制工程] Q811.4[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象