检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]深圳大学电子与信息工程学院
出 处:《数字技术与应用》2024年第11期152-156,共5页Digital Technology & Application
摘 要:生物序列分类是生物信息学研究中的一个重要领域,生物序列数据的快速增长增加了生物序列分类的难度,而深度学习的发展则有助于生物序列的分类。广泛使用的监督BP神经网络需要标记大量的样本,而现实中得到的往往是没有标记的数据集,且标记的工作也变得十分烦琐。针对此问题,本文提出了一种基于词频-逆文档频率算法(Term Frequency-Inverse Document Frequency,TF-IDF)提取生物序列特征后输入BP神经网络,再通过半监督自训练环节多次迭代以增加数据集的规模。实验表明,该方法与传统的滑动窗口法在准确度、召回率、精确率、F1分数和AUC-ROC曲线下的面积值都有明显的提升,同时也减轻了标记的工作量,对深入研究生物序列的分类有一定的参考价值。
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49