检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王梦涵 贺辉宗 厉建祥 贺伟东 李绪延 辛一男 石秀丽[3] Wang Menghan;He Huizong;Li Jianxiang;He Weidong;Li Xuyan;Xin Yinan;Shi Xiuli(SINOPEC Research Institute of Safety Engineering Co.,Ltd.,Shandong,Qingdao,266104;SINOPEC Management System Certification(Qingdao)Co.,Ltd.,Shandong,Qingdao,266071;SINOPEC Marketing Beijing Company,Beijing,100022)
机构地区:[1]中石化安全工程研究院有限公司,山东青岛266104 [2]中石化管理体系认证(青岛)有限公司,山东青岛266071 [3]中国石化北京石油分公司,北京100022
出 处:《安全、健康和环境》2022年第12期18-23,共6页Safety Health & Environment
基 金:中国石油化工股份有限公司炼油事业部项目(CLY22047),炼化企业HSE管理体系审核平台开发与应用。
摘 要:HSE管理体系审核不符合项文本语义关系复杂,包含专业术语及缩略语,且同一不符合项往往具有多个分类标签,分类通常依赖人工分析,处理效率较低。针对此问题,利用自然语言处理技术,研究体系审核不符合项文本自动分类方法,准确进行文本分类和识别。根据业务和管理流程梳理审核不符合项分类关键词标签,划分四级结构,选取某石化公司HSE管理体系信息化审核系统不符合项数据作为初始语料库,构建辅助分类规则与专业词典,优化关键词提取算法,对比分析多种机器学习分类模型,优选最佳模型,取得了较好的分类效果。Using the information audit data and natural language processing technology, this paper studied the text classification method of non-conformance items in system audit. According to the business and management process, a keyword tag system for audit nonconformance items was established. The problem database of information audit system of HSE management system of a petrochemical company was selected as the initial corpus, and the tag system was divided into four layers as classification categories. Constructing auxiliary classification rules, were used respectively to optimize keywords calculation method, methods of building professional dictionaries, less settlement system audit nonconformities database sample size, more labels, sample characteristics is not obvious, and contrast analysis of the logistic regression, polynomial naive bayes and support vector machine model of the effect of text categorization.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28