谢志鹏

作品数:14被引量:62H指数:4
导出分析报告
供职机构:复旦大学计算机科学技术学院更多>>
发文主题:上下位关系自组织网络英文WEB页面结构相似度更多>>
发文领域:自动化与计算机技术文化科学语言文字电子电信更多>>
发文期刊:《北京大学学报(自然科学版)》《计算机工程与应用》《小型微型计算机系统》《计算机研究与发展》更多>>
所获基金:国家自然科学基金上海市自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
词元与上下文双路表征融合的小样本命名实体识别方法
《小型微型计算机系统》2025年第3期513-519,共7页曾鹏武 谢志鹏 
国家自然科学基金项目(62076072)资助.
现有的命名实体识别方法需要大量训练数据,在小样本场景下容易过拟合.针对该问题,提出一种基于预训练模型掩码预测的方法,引入上下文信息改善模型泛化能力.首先使用两路BERT(Bidirectional Encoder Representation from Transformers)...
关键词:小样本学习 命名实体识别 BERT 掩码预测 
基于最大影响力集合的主动学习方法
《计算机科学》2025年第1期289-297,共9页李雅和 谢志鹏 
随着深度学习技术的不断进步,其已经在许多领域广泛应用。但深度模型的训练需要消耗大量标注数据,时间与资源成本高,如何利用尽可能少的标注数据达到最佳模型效果成为一个重要的研究课题。主动学习的提出正是为了解决这一问题,其旨在选...
关键词:主动学习 深度学习 不确定性 
一种面向事件事实性预测的平行语料库构建方法研究
《小型微型计算机系统》2024年第7期1537-1544,共8页张禛 谢志鹏 
国家自然科学基金项目(62076072)资助.
事件事实性预测(Event Factuality Prediction,EFP)是将事实性评价(Factuality Assessment)问题建模为句子级别回归任务,判定句子中事件提及(event mention)的事实程度.EFP是自然语言处理中重要且具有挑战性的任务.与英文事件事实性语...
关键词:事件事实性 事实性评价 平行语料库 多任务学习 
基于预训练语言模型和标签指导的文本复述生成方法
《计算机科学》2023年第8期150-156,共7页梁佳音 谢志鹏 
国家自然科学基金(62076072)。
文本复述生成是自然语言处理中一项重要且具有挑战性的任务。最近很多工作将句子不同粒度的句法结构信息用于指导复述生成过程,取得了一定的效果,然而这些方法大多比较复杂,迁移使用困难。另外,预训练语言模型因学习到大量语言知识而在...
关键词:文本复述生成 预训练语言模型 数据增强 
基于混合专家模型的词语上下位关系判别方法被引量:1
《计算机科学》2023年第2期285-291,共7页曾楠 谢志鹏 
国家重点研发计划(2018YFB1005100);国家自然科学基金(62076072)。
词语的上下位关系判别是自然语言处理中一项基础且具有挑战性的任务。传统的有监督方法通常采用单个模型在整个语义空间中对所有上下位词对进行全局建模,并取得了一定的效果。然而,上下位关系的分布式语义表征具有相当的复杂性,在语义...
关键词:上下位关系判别 混合专家 局部模型 
大规模中文具体度词典的构建及推理技术
《北京大学学报(自然科学版)》2022年第1期1-6,共6页谢志鹏 毕冉 
国家重点研发计划(2018YFB1005100);国家自然科学基金(62076072)资助。
针对中文词语具体度资源的匮乏,提出一种自动的中文词语具体度词典构造方法。该方法充分利用已有的英文词语具体度资源,基于在线翻译工具和预训练词向量,训练出中文词语具体度的多层感知器回归模型,构造大规模的中文词语具体度词典。为...
关键词:词语具体度 具体度推理 多层感知器 自然语言处理 
基于BiLSTM模型的定义抽取方法被引量:9
《计算机工程》2020年第3期40-45,共6页阳萍 谢志鹏 
国家重点研发计划(2018YFC0830900)。
定义抽取是从非结构化文本中自动识别定义句的任务,定义抽取问题可建模为句子中术语及相应定义的序列标注问题,并利用标注结果完成抽取任务。针对传统的定义抽取方法在抽取定义特征过程中费时且容易造成错误传播的不足,提出一个基于双...
关键词:定义抽取 双向长短时记忆模型 序列标注 LSTM模型 深度神经网络 
基于图模型的Web表格中视觉并列关系的研究
《小型微型计算机系统》2014年第7期1567-1572,共6页李雯琴 谢志鹏 
国家自然科学基金项目(61170007)资助
Web不仅包含海量文本信息,还包含大量表格数据.与自由格式的文本信息相比,Web表格所包含的信息更为精练并且结构化,便于数据挖掘.Web表格挖掘已成为一个热点研究问题.为挖掘Web表格的行列结构、背景、颜色、文本字体、字号等视觉信息所...
关键词:Web表格挖掘 视觉要素 图模型 视觉并列关系 
语义关系相似度计算中的数据标准化方法比较被引量:16
《计算机工程》2012年第10期38-40,共3页王正鹏 谢志鹏 邱培超 
研究数据标准化处理对语义关系相似度计算的影响。从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算。实验结果表明,不做数据标准化、z-s...
关键词:语义关系 相似度 词法模式 词对-词法模式矩阵 数据标准化 WEB数据挖掘 
自组织网络有效的组合服务执行路径发现方法
《计算机工程与应用》2010年第1期77-80,133,共5页任刚 吴晶晶 谢志鹏 孙未未 
国家自然科学基金No.2006AA01Z234;No.60503025~~
无线自组织网络中的服务组合是指通过将几个简单的服务即原子服务组合成一个功能更强大的服务,来满足用户提出的复杂的请求。在无线自组织网络中,组合服务的执行首先要找到能够实现服务组合的执行路径,即确定网络中能够实现组合服务的...
关键词:自组织网络 服务合成 执行路径 
检索报告 对象比较 聚类工具 使用帮助 返回顶部