检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国人民大学档案学院
出 处:《中国档案》2023年第3期71-71,共1页China Archives
摘 要:文章针对大规模政府开放公文的主题分类标注问题,提出一种基于多分类模型的政府开放公文主题分类自动标注方法。第一,公文主题分类标注的需求。针对主题分类标注不一致问题。开放公文所涉领域广泛,可以采用预训练模型(如BE RT)对公文提取词向量,从而保证文本分类的一致性。针对主题分类标注深度问题。自动主题分类方法需要针对公文全文,但考虑不同公文的全文长度存在极大差异,需要能够在全文本中抓住中心句以及中心词,并经过提炼后对其进行归类。
关 键 词:文本分类 主题分类 词向量 多分类模型 不一致问题 公文 全文本 一致性
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.117.252.33