面向检索结果集的结构化综述智能生成研究  被引量:4

Research on Intelligent Generation of Structured Review for Retrieval Result Set

在线阅读下载全文

作  者:孟旭阳 陈阳 白海燕[1] Meng Xuyang;Chen Yang;Bai Haiyan(Institute of Scientific and Technical of Information of China,Beijing 100038)

机构地区:[1]中国科学技术信息研究所,北京100038

出  处:《图书情报工作》2024年第6期129-141,共13页Library and Information Service

基  金:国家重点研发计划项目“科技文献内容深度挖掘及智能分析关键技术和软件”(项目编号:2022YFF0711900);中国科学技术信息研究所创新研究基金青年项目“面向检索结果集的结构化综述研究”(项目编号:QN2023-11)研究成果之一。

摘  要:[目的/意义]在学术文献检索与阅读场景下,当前学术信息量已远超用户信息处理能力,造成信息堆积。为应对用户阅读效率与知识吸收难题,面向学术文献检索结果集开展内容的综合挖掘揭示。[方法/过程]一方面从阅读体验出发,针对文献检索场景的特点,进行结构化综述表达设计;另一方面从技术方法与内容质量提升出发,利用基于深度学习的文本自动生成技术,构建科技文献数据集,训练并优化文本摘要模型,在此基础上利用大语言模型技术实现结构化的综述文本生成。[结果/结论]训练优化后的摘要模型在各指标的召回率和F1值上平均增长2.07%。基于大模型的结构化综述生成,在实际测评中能够有效地提炼、总结和归纳内容要点,验证本文技术路线和应用实践的可行性,为进一步提升学术文献的知识化服务水平、智能辅助阅读与语义内容综合挖掘揭示等方面提供应用实践指南。model has an average increase of 2.07%in the recall rate and F1 value of each indicator after training.Structured review generation based on the big model can effectively extract and summarize the main points of the content in the actual evaluation,which verifies the feasibility of the technology roadmap and application practice,and provides a guide for the knowledge-based service level of academic literature,intelligent assisted reading and comprehensive mining and disclosure of semantic content.

关 键 词:文献检索 结构化综述 大语言模型 文本自动生成 

分 类 号:G254[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象