检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨金庆[1,2] 李嘉琦 杨儒汉 罗星雨 程秀峰 YANG Jinqing;LI Jiaqi;YANG Ruhan;LUO Xingyu;CHENG Xiufeng(School of Information Management,Central China Normal University,Wuhan 430079,China;Key Laboratory of Rich-media Knowledge Organization and Service of Digital Publishing Content,Beijing 100038,China)
机构地区:[1]华中师范大学信息管理学院,武汉430079 [2]富媒体数字出版内容组织与知识服务重点实验室,北京100038
出 处:《情报工程》2024年第5期73-84,共12页Technology Intelligence Engineering
基 金:富媒体数字出版内容组织与知识服务重点实验室开放基金项目“基于深度语义理解的技术谱系自动构建研究”(ZD2023/11-03);中央高校基本业务费项目“基于技术要素深度语义理解的创新路径识别及引导策略研究”(CCNU24ZZ140);中央高校基本业务项目“基于知识网络科学知识角色转变研究”(CCNU23XJ013)。
摘 要:[目的/意义]从细粒度视角理解“技术—知识”关联实体,构建专利文献中技术要素与知识要素识别的实现方案。[方法/过程]选取传统机器学习模型HMM、CRF,深度学习模型BiLSTM-CRF、BERT-Softmax、BERT-CRF和BERTBiLSTM-CRF进行任务训练学习,以便确定性能最优的细粒度技术与知识实体识别模型。[结果/结论]为了验证所构建技术与知识实体识别的理论框架,以出版印刷领域文本作为实验验证场景,从专利文本中随机抽取7853条有效语料句,标注了71626个实体,通过训练学习确定BERT-BiLSTM-CRF为性能较好的实体识别模型,其对知识与技术实体识别综合性能F1值为0.82。此外,运用训练出的最优模型从66665篇专利文本的第一权利要求、权利要求、独立权利要求和技术功效中识别出4769296对知识与技术实体关联组合体,并分析了技术演化路径和“技术—知识”关联网络结构的演化规律。[Objective/Significance]Understand the“technology-knowledge”related entities from a fine-grained perspective,and construct a implementation scheme for identifying technology elements and knowledge elements in patent documents.[Methods/Processes]The traditional machine learning models HMM and CRF,and the deep learning models BiLSTM-CRF,BERT-Softmax,BERT-CRF,and BERT-BiLSTM-CRF are selected for the task training and learning in order to identify the fine-grained technology with optimal performance and the knowledge entity recognition model.[Results/Conclusions]In order to validate the theoretical framework of technology and knowledge entity recognition,this paper takes the text in the field of publishing and printing as the experimental validation scenario,randomly selects 7853 valid corpus sentences from patent texts,and annotates 71626 entities,and determines that the BERT-BiLSTM-CRF is the entity recognition model with better performance through training,and the F1 value of its comprehensive performance for knowledge and technology entity recognition is 0.82.In addition,this paper applies the trained optimal model to identify 4769296 pairs of knowledgetechnology entity association combinations from the first claim,claims,independent claims and technical effects of 66665 patents,and analyzes the technology evolution paths and the evolution pattern of the“technology-knowledge”association network structure.We also analyzed the technology evolution path and the evolution law of“technology-knowledge”association network structure.
分 类 号:G35[文化科学—情报学] TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.144.80