语料

作品数:16970被引量:32016H指数:72
导出分析报告
相关领域:语言文字更多>>
相关作者:余正涛何安平陈建生周国栋王克非更多>>
相关机构:上海交通大学上海外国语大学北京外国语大学大连海事大学更多>>
相关期刊:更多>>
相关基金:国家社会科学基金教育部人文社会科学研究基金国家自然科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=国家重点基础研究发展计划x
条 记 录,以下是1-10
视图:
排序:
施事的语义分布考察与动词的语义特征被引量:2
《中文信息学报》2019年第1期1-9,共9页陈龙 詹卫东 
国家重点基础研究发展计划(973项目)(2014CB340504);教育部人文社科基地2015年重大项目(15JJD740002)
在自然语言处理中,语义角色标注是一个比较重要的任务。语义角色标注任务以语义角色理论为基础。语义角色标注任务和语言学的相关理论都要求同一个动词在不同语句中相应的语义角色成分保持一致。该文统计了北京大学973课题语义角色标注...
关键词:语义角色标注 语料库 施事 一致性 自主性 
近30年来中文语言知识资源发展及应用被引量:6
《语言战略研究》2018年第4期58-69,共12页詹卫东 
国家重点基础研究发展计划(2014CB340504);教育部人文社科重点研究基地重大项目(13JJD740001;15JJD740002)经费支持
本文利用互联网搜索引擎,调研了中国大陆和港台地区,以及北美、欧洲等多地的中文语言知识资源,包括语料库、知识库及相应的检索系统的现状。得益于经验主义研究范式在自然语言信息处理以及其他语言应用研究领域近30年来的快速发展,中文...
关键词:语言知识资源 语料库 知识库 检索系统 
基于多特征的语义角色标注一致性计算方法研究被引量:3
《北京大学学报(自然科学版)》2018年第3期475-480,共6页柯永红 朱永福 穗志方 俞士汶 
国家重点基础研究发展计划(2014CB340504)资助
综合语义角色标注语料的格式、标签结构、标签内容和用户可信度等多个特征,实现一种自动的语义角色标注一致性计算方法。实验证明,该方法对错误标注的召回率高,并且速度快,结果稳定,可以大幅度地提高语义角色标注一致性检查的效率。
关键词:语料库 多特征 一致性计算 语义角色标注 
在线多语种语音语料库平台的研究与实现被引量:3
《信息通信》2018年第4期150-153,共4页徐健 热依曼.吐尔逊 吾守尔.斯拉木 
新疆维吾尔自治区重点实验室专项(2015KL013);国家自然科学基金项目(U1603262);国家973计划项目(2014CB340506)
为解决多语种语音语料库方面的设计空缺以及传统的应用软件C/S架构的问题,提出了一种基于在线的多语种语音语料库平台。首先,研究多语种语音语料库的设计过程,包括语料库的规范、语音文本的设计、语音录制、语音库的标注以及平台总体设...
关键词:多语种 语音语料库 管理平台 录音软件 标注平台 
用于双语科技术语对齐的汉维文可比语料库构建被引量:2
《新疆大学学报(自然科学版)》2017年第3期316-321,共6页彭飞 吐尔根.依布拉音 艾山.吾买尔 米尔夏提.力提甫 
国家自然科学基金项目(61463048;61462083;61331011);国家重点基础研究发展计划(973)项目(2014cb340506)
面向汉文维吾尔文(以下简称汉维)双语科技术语抽取这一应用目标,本文提出新闻科技领域的汉维可比语料库设计方案并进行实验.将网络采集的汉维语料利用机器翻译系统进行初加工后映射到向量空间中并使用LSI算法计算出各向量间的相关性,利...
关键词:可比语料库 汉维可比语料库构建 双语术语抽取 LSI 
THUYG-20:免费的维吾尔语语音数据库被引量:13
《清华大学学报(自然科学版)》2017年第2期182-187,共6页艾斯卡尔·肉孜 殷实 张之勇 王东 艾斯卡尔·艾木都拉 郑方 
国家自然科学基金项目(61271389,61371136);国家“九七三”重点基础研究发展计划(2013CB329302)
语音数据资源是语音识别研究的基础。当前国内只有为数不多的开放的语音数据库供研究者免费使用,特别是在维吾尔语等少数民族语音识别方面,数据资源更为贫乏。该文发布一个完全免费的维吾尔语连续语音数据库,该数据库包括约20h的训练数...
关键词:语音识别 维吾尔语 语料库 深度神经网络(DNN) 
情感词典构建综述被引量:23
《中文信息学报》2016年第5期19-27,共9页梅莉莉 黄河燕 周新宇 毛先领 
国家重点基础研究发展计划(2013CB329303);国家自然科学基金(61402036;61132009)
文本情感分析是近年来迅速兴起的一个研究课题,具有显著的研究价值和应用价值。情感词典的构建在情感分析任务中发挥着越来越重要的影响力。该文对情感词典构建的研究进展进行了总结。首先重点介绍了情感词典构建的研究现状,将其归纳为...
关键词:情感分析 情感词典 评测 语料 综述 
一种基于情绪激励度的情绪词加权方法
《计算机工程与科学》2016年第2期386-394,共9页王世泓 牛耘 
国家自然科学基金(61202132;61170043);国家973计划(2013CD744904)
在不同的上下文中,情绪词对情绪的激励程度会发生变化。现有情绪词典中大多数只标注了情绪词的情绪类别而未涉及情绪词的激励度。在极少数标注情绪强度的词典中,所标注的强度未考虑上下文的影响。提出一种根据上下文形成的情境评估情绪...
关键词:情绪强度 情绪词典 语料上下文 情绪激励度 情绪权重 
基于排序方法的汉语句际关系树自动分析(英文)
《北京大学学报(自然科学版)》2016年第1期65-74,共10页吴云芳 万富强 徐艺峰 吕学强 
国家自然科学基金(61371129);国家重点基础研究发展计划(2014CB340504);国家社会科学基金重大项目(12&ZD227);网络文化与数字传播北京市重点实验室开放课题(ICDD201302)资助
提出一种自动分析汉语小句级句际关系树的新方法。在修辞结构理论体系下,构建一个汉语句际关系标注语料库。不同于传统的只关心相邻两个单元的方法,提出一种类排序模型(SVM-R),自动构建汉语句际关系的树结构,旨在把握相邻3个单元之间的...
关键词:句际关系树构建 排序方法 汉语句际关系语料库 
基于多策略过滤的汉日多词短语抽取和对齐被引量:4
《山东大学学报(理学版)》2015年第9期21-28,共8页唐亮 李倩 许洪波 易绵竹 
国家重点基础研究发展计划(973计划)项目(2014CB340400;2012CB316303);国家自然科学基金重点项目(61232010);国家自然科学基金面上项目(61173064);国家科技支撑计划项目(2012BAH39B04)
在跨语言文本分析任务中,多词短语比单个词汇歧义小,语义表达更加准确,有助于提高文本理解的准确性。现有方法主要关注单个词的跨语言对齐。将多词短语抽取和跨语言对齐相融合,提出了一种基于多策略过滤的汉日多词短语抽取和对齐的方法...
关键词:平行语料库 多词短语 词对齐 
检索报告 对象比较 聚类工具 使用帮助 返回顶部