苏州大学计算机科学与技术学院自然语言处理实验室

作品数:19被引量:157H指数:7
导出分析报告
发文作者:胡亚楠鞠久朋戴敏王荣洋更多>>
发文领域:自动化与计算机技术语言文字更多>>
发文主题:中文篇章情感分析语料库构建评价对象抽取更多>>
发文期刊:《软件学报》《计算机工程》《模式识别与人工智能》《北京大学学报(自然科学版)》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金江苏省高校自然科学研究项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于提高伪平行句对质量的无监督领域适应机器翻译被引量:1
《计算机工程与科学》2022年第12期2230-2237,共8页肖妮妮 金畅 段湘煜 
神经机器翻译系统的良好性能依赖于大规模内领域双语平行数据,当特定领域数据稀疏或不存在时,领域适应是个很好的解决办法。无监督领域适应方法通过构建伪平行语料来微调预训练的翻译模型,然而现有的方法没有充分考虑语言的语义、情感...
关键词:神经网络 神经机器翻译 领域适应 模型优化 情感信息 
篇章视角的汉语零指代语料库构建被引量:5
《软件学报》2021年第12期3782-3801,共20页孔芳 葛海柱 周国栋 
国家自然科学基金(61876118,61751206);江苏高校优势学科建设工程。
零指代是汉语中普遍存在的一个现象,在汉英机器翻译、文本摘要以及阅读理解等众多自然语言处理任务中都起着重要作用,目前已成为自然语言处理领域的一个研究热点.提出了篇章视角的汉语零指代表示体系,从服务于篇章分析的角度出发,首先...
关键词:零指代 语料库构建 篇章分析 基本篇章单元 零元素 
基于最短依存路径和集成学习的化学物蛋白质关系抽取被引量:3
《中文信息学报》2021年第4期58-65,共8页程威 邵一帆 钱龙华 周国栋 
国家自然科学基金(61976147,61373096)。
化学物与蛋白质之间的相互作用关系抽取对精准医学和药物发现等方面的研究有着重要作用。该文提出了一种基于最短依存路径和注意力机制的双向LSTM模型,并将其应用于化学物蛋白质关系抽取。在特征上综合考虑了最短依存路径上的词性、位...
关键词:实体关系抽取 化学物蛋白质关系抽取 最短依存路径 注意力机制 
融合依存关系和篇章修辞关系的事件时序关系识别被引量:1
《模式识别与人工智能》2019年第12期1100-1106,共7页戴倩雯 张龙印 孔芳 
国家自然科学基金重点项目(No.61836007)、国家自然科学基金项目(No.61876118)资助~~
已有事件间时序关系识别只考虑两个事件所在上下文的局部信息,忽略事件间篇章视角的关联关系.针对这一问题,文中给出融合句子级依存关系和篇章层修辞关系的事件时序关系识别方法.将事件间关联关系分两部分进行表征:事件所在句子的依存...
关键词:时序关系 依存关系 篇章修辞关系 
汉语篇章理解研究综述被引量:6
《软件学报》2019年第7期2052-2072,共21页孔芳 王红玲 周国栋 
国家自然科学基金(61751206,61876118,61673290)~~
人们理解自然语言通常是在篇章级进行的,随着词汇级及句子级研究的日益成熟,自然语言处理研究的焦点已转向篇章级。篇章分析的主要任务就是从整体上分析出篇章结构及其构成单元之间的语义关系,并利用上下文理解篇章。根据不同的篇章分...
关键词:自然语言理解 篇章分析 篇章修辞结构 篇章话题结构 
多语言输入的神经语义分析方法研究被引量:5
《计算机工程》2019年第3期169-174,共6页柴强 李军辉 孔芳 周国栋 
国家自然科学基金(61333018;61472264)
多语言到语义表达式的语义分析,即将多个语义上等价的不同语言句子同时作为输入并解析为相应的语义表达式。在神经网络编码-解码的框架下,针对多语言输入,将不同语言输入相结合以建立双编码-解码模型。基于该模型,将2种不同自然语言作...
关键词:多语言 语义分析 双编码 解码 神经网络 
中文篇章零元素语料库构建被引量:2
《北京大学学报(自然科学版)》2019年第1期15-21,共7页盛晨 孔芳 周国栋 
国家自然科学基金(61472264;61751206);国家重点研发计划(2017YFB1002101)资助
针对中文零指代问题,从篇章视角进行理论分析,并完成中文篇章零元素语料库(ChineseDiscourse ZeroCorpus,CDZC)的构建工作。首先,整理和分析已有的理论研究以及语料资源,探究篇章层面中文零元素语料库标注的必要性。然后,采用自底向上...
关键词:中文零元素 篇章视角 语料库构建 中文篇章零元素语料库 
基于维基百科的中文嵌套命名实体识别语料库自动构建被引量:7
《计算机工程》2018年第11期76-82,共7页李雁群 何云琪 钱龙华 周国栋 
国家自然科学基金(61373096;61331011;61673290)
传统的监督学习方法需要标注一定规模的领域内语料库,限制了其领域适应性。为此,提出一种从中文维基百科条目中自动构建中文嵌套命名实体识别语料库的方法。对中文维基百科的条目进行实体分类,利用实体条目构造实体的嵌套结构,从而自动...
关键词:嵌套命名实体识别 信息抽取 维基百科 语料库 条件随机场 
基于文本与社交信息的用户群组识别被引量:7
《软件学报》2017年第9期2468-2480,共13页王中卿 李寿山 周国栋 
国家自然科学基金(61331011;61375073;61402314)~~
社交媒体上的个人群体信息对于理解社交网络结构非常有用,现有研究主要基于用户之间的链接和显式社交信息识别用户的个人群体,很少考虑使用文本信息与隐含社交信息.在显式社交信息缺乏时,隐含社交信息以及文本信息对于识别用户的群体是...
关键词:群组推荐 社交网络 隐含信息 矩阵分解 因子图模型 
汉语表述识别与指代消解被引量:3
《计算机工程》2016年第9期168-173,共6页黄学华 孔芳 周国栋 
国家自然科学基金资助项目(61333018;61472264)
使用传统的机器学习方法构建汉语指代消解基准平台,当引入表述识别二次分类器后,基准平台的性能并没有获得提升。针对该问题,提出一种改进的表述识别方法。改进的表述识别方法只针对代词、专有名词进行分类过滤,而对所有的普通名词短语...
关键词:指代消解 表述识别 机器学习 句法分析 语料 
检索报告 对象比较 聚类工具 使用帮助 返回顶部