检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:乔波 袁铨 周子濠 Qiao Bo;Yuan Quan;Zhou Zihao(College of Information and Intelligence,Hunan Agricultural University Hunan Changsha 410128,China)
机构地区:[1]湖南农业大学信息与智能科学技术学院,长沙410128
出 处:《黑龙江科学》2024年第24期84-88,共5页Heilongjiang Science
基 金:2022年度湖南省社会科学成果评审委员会课题成果(XSP22YBZ024)。
摘 要:在自然语言处理领域,属性抽取技术面临着精度不高、大规模训练数据获取困难等问题。针对这些问题提出一种基于BERT-CRF的中药材属性抽取方法,将属性抽取任务转化为序列标注任务,结合预训练语言模型BERT的丰富语义信息与条件随机场CRF对上下文特征的理解能力,有效提升属性抽取的精度,通过书籍与网络数据构建了一个中药材属性抽取数据集,将BERT-CRF属性抽取方法用于公开数据集MSRA和中药材属性抽取数据集上。结果显示,该模型在精确率、召回率和F1分数等方面相比于其他序列标注模型均表现出了显著的优势,证实了其在中药材属性抽取任务中的有效性。In the current domain of natural language processing,attribute extraction techniques are confronted with issues,such as low accuracy and the challenge of obtaining large-scale training data.Addressing this issue,the study proposes a method for attribute extraction from Chinese herbal medicines based on the BERT-CRF framework.This approach transforms the attribute extraction task into a sequential labeling task,leveraging the rich semantic information provided by the pre-trained language model BERT and the context feature understanding capability of CRF to enhance the precision of attribute extraction.This research also constructs a dataset for attribute extraction from Chinese herbal medicines with book and web data,and applies the BERT-CRF attribute extraction method to publicly available datasets like MSRA and the dataset for Chinese herbal medicine attributes.The results demonstrate that the proposed model outperforms other sequential labeling models in precision,recall,and F1 score,thereby validates its effectiveness in the task of attribute extraction for Chinese herbal medicines.
关 键 词:自然语言处理 属性抽取 预训练语言模型 条件随机场
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222