中文专利

作品数:66被引量:287H指数:11
导出分析报告
相关领域:自动化与计算机技术文化科学更多>>
相关作者:吕学强翟东升王昊王裴岩马文姗更多>>
相关机构:北京信息科技大学南京大学北京工业大学沈阳航空航天大学更多>>
相关期刊:《计算机工程与设计》《哈尔滨理工大学学报》《常熟理工学院学报》《竞争情报》更多>>
相关基金:国家自然科学基金国家社会科学基金北京市自然科学基金国家科技支撑计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
中文专利文本结构信息提取方法
《计算机工程与设计》2025年第3期665-672,共8页吕国燕 戴佳呈 吕学强 游新冬 
国家自然科学基金项目(62171043);北京市自然科学基金项目(4212020);国家语委基金项目(ZDI145-10);北京市教育委员会科学研究计划基金项目(KM202111232001)。
专利文本的主体-行为-客体(SAO)结构提取直接影响着专利相似性计算、专利聚类与分类等专利文本挖掘下游任务的应用与效果,但目前存在效率低下和提取结构信息不充分等问题。对此进一步提取中文专利文本的技术方法F和功能效果E。为解决这...
关键词:主体-行为-客体结构 中文专利 技术方法 功能效果 词嵌入 双向长短期记忆 多头注意力 
结合关键词指导与大语言模型近端策略优化的专利关键句抽取
《北京信息科技大学学报(自然科学版)》2025年第1期20-29,共10页万甜 吕学强 马登豪 
国家自然科学基金项目(62171043);北京市自然科学基金项目(4232025);青海省创新平台建设专项(2022-ZJ-T02)。
针对现有专利关键句抽取方法对标注数据依赖性强以及大语言模型训练成本高的问题,提出了一种结合关键词指导(keyword guidance,KG)与大语言模型近端策略优化(proximal policy optimization,PPO)的关键句抽取方法KG-PPO。首先,构建关键词...
关键词:关键句抽取 大语言模型 联合匹配模型 近端策略优化 中文专利 
一种两阶段的中文专利语义检索方法被引量:1
《小型微型计算机系统》2024年第10期2378-2383,共6页吕学强 梁虎 赵颖 游新冬 
国家自然科学基金项目(62171043)资助;北京市自然科学基金项目(4212020)资助;国家语委项目(ZDI145-10,YB145-3)资助;北京市教育委员会科学研究计划项目(KM202111232001)资助.
专利检索系统主要以传统的术语匹配方式提供检索服务,语义扩展性不足,使得具有语义相似的专利在Top_N的检出率较低.为了提升相似专利的Top_N检出率,该文提出了一种两阶段的中文专利语义检索方法.第1阶段基于Sentence-BERT进行语义编码,...
关键词:专利检索 语义检索 难负例采样 白化转换 
基于BERT-Graphormer的中文专利文本分类模型研究被引量:1
《情报探索》2024年第6期27-33,共7页李永忠 吕菲 黄种标 
[目的/意义]随着专利申请量不断增长和专利分类类别的复杂化,针对提高专利分类工作效率、审查质量、节约人力资源的需求,构建中文专利文本分类模型。[方法/过程]通过微调Graphormer模型对专利标签的结构及信息进行建模,利用建模后的标...
关键词:专利分类 层次分类 注意力机制 BERT 
基于ERNIE的中文专利分类研究被引量:1
《信息技术与信息化》2023年第9期116-119,共4页雷海卫 李帆 李成奇 
山西省重点研发计划项目“大数据技术在专利分析中的应用研究”(201903D121166)。
依据中文专利文本内容实现专利的自动分类,可以为专利申请审查快速匹配一个或多个IPC分类号,以提升该工作的自动化水平。在对文本分类中的文本表示模型技术分析后,提出基于ERNIE并结合CNN和RNN构建用于中文专利自动分类的模型。模型以...
关键词:专利分类 ERNIE 文本表示 IPC 随机掩码 
基于BERT-BiGRU的中文专利文本自动分类被引量:10
《郑州大学学报(理学版)》2023年第2期33-40,共8页刘燕 
河南省高校人文社会科学研究项目(2023-ZDJH-589);河南省哲学社会科学规划年度项目(2021BZH015)。
针对中文发明专利文本的文字描述专业性强、人工分类耗时耗力等问题,提出一种基于BERT-BiGRU模型的中文专利文本自动分类方法,利用预训练的BERT模型完成对中文发明专利文本进行向量化语义表征,引入词嵌入和多头注意力机制等方法抽取专...
关键词:专利文本分类 BERT BiGRU 词嵌入 
基于SAO-Onto知识模型的中文专利语义搜索与评估方法被引量:1
《山西大学学报(自然科学版)》2023年第2期263-272,共10页滕昊 王楠 赵宏宇 王亚可 曹政 
国家自然科学基金(61671070);北京市自然科学基金(4212020);北京信息科技大学校科研基金项目(2021XJJ27);北京信息科技大学大学生创新创业训练计划项目(5112210832)。
文章提出了一种面向中文专利语义搜索的新方案。通过对涉及审查、无效、侵权等专利对比文件的挖掘,构建了用于语义搜索评估的匹配数据集和排序数据集。从SAO(Subject-Action-Object)三元组知识抽取出发,融合百科知识和HowNet语言知识库...
关键词:专利 SAO-Onto 语义搜索 HOWNET 
基于改进SVM的中文专利文本分类比较研究被引量:3
《武汉理工大学学报(信息与管理工程版)》2023年第2期292-298,303,共8页杨超宇 陈雯君 耿显亚 
国家自然科学基金项目(61873004);国家级大学生创新创业训练计划项目(202210361115X)。
为深入挖掘中文专利文本特征,使专利类别划分更清晰、技术联系更紧密。首先,从专利信息平台爬取智能家居领域专利,构建智能家居专利信息语料库并进行分词与去停用词处理;其次,通过TF-IDF-LDA和均值Word2Vec两种自然语言处理算法,分别对...
关键词:LDA主题模型 均值Word2Vec 支持向量机 产学研 中文专利分类 
中文专利数据可视化分析系统研究与设计被引量:1
《计算机应用与软件》2023年第1期24-29,共6页陈挺 徐胜捷 陈龙 陆间 张丽丽 
国家级大学生创新创业训练计划资助项目(201910294078)。
现有的专利分析系统在可视化方面存在诸多不足,针对中文专利的可视化分析工具更是少之又少。结合文本挖掘技术,设计并实现“中文专利数据可视化分析系统”,具有专利态势分析、专利聚类分析、专利引证分析三种分析功能,多角度分析了中文...
关键词:专利分析 可视化 文本聚类 系统设计 
基于预训练语言模型的中文专利自动分类研究被引量:2
《中华医学图书情报杂志》2022年第11期20-28,共9页马俊 吕璐成 赵亚娟 李聪颖 
目的:支撑大规模中文专利精准自动分类工作,利用改进中文专利文本表示的预训练语言模型实现专利的自动分类。方法:基于中文预训练语言模型RoBERTa,在大规模中文发明专利语料上分别使用单字遮盖策略和全词遮盖策略遮盖语言模型任务进行...
关键词:中文专利 文本表示 预训练语言模型 文本分类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部