标注语料库

作品数:34被引量:198H指数:9
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:亢世勇孙道功张春菊许小星张雪英更多>>
相关机构:南京师范大学鲁东大学烟台师范学院北京大学更多>>
相关期刊:《外语研究》《广西科学院学报》《北京理工大学学报》《电脑知识与技术》更多>>
相关基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划河南省科技攻关计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
中文糖尿病问题分类体系及标注语料库构建研究
《中文信息学报》2024年第12期54-63,共10页钱晓波 谢文秀 龙绍沛 兰牧融 慕媛媛 郝天永 
国家社会科学基金(19BYY125)。
作为一种典型慢性疾病,糖尿病已成为全球重大公共卫生挑战之一。随着互联网的快速发展,庞大的二型糖尿病患者和高危人群对糖尿病专业信息获取的需求日益突出,糖尿病自动问答服务在患者和高危人群的日常健康服务中也发挥着越来越重要的作...
关键词:糖尿病 问题分类 分类体系 语料库建设 
汉英中介语语言类型变化研究被引量:1
《现代外语》2023年第3期358-370,共13页欧阳静慧 蒋景阳 
教育部人文社会科学重点研究基地重大项目“数据驱动的外语能力发展研究”(22JJD740018)的阶段性成果。
中介语是处于本族语和目的语之间的语言系统,且具有渐进性,即不断地逐渐向目的语靠近。那么中介语在发展过程中,其语言类型是否会发生变化呢?本文基于自建的中国英语学习者标注语料库,使用依存方向这一计量来指标衡量中介语的语言类型...
关键词:汉英中介语 语言类型 标注语料库 依存方向 
基于依存句法标注语料库的中国大学生英语时间状语从句位置偏好研究被引量:1
《外语教学与研究》2023年第3期372-384,479,共14页欧阳静慧 蒋景阳 
刘海涛主持的教育部人文社会科学重点研究基地重大项目“数据驱动的外语能力发展研究”(22JJD740018)的阶段性成果。
在依存语法的理论框架下,本研究自建了中国大学生依存句法标注语料库,并基于兰卡斯特-奥斯陆-卑尔根语料库建立了英语本族语者依存句法标注语料库,采用平均依存距离(MDD)作为量度指标,对不同位置时间状语从句的加工难度进行量化分析,考...
关键词:英语时间状语从句 位置偏好 依存句法 依存距离 加工难度 
基于BERT的交互式地质实体标注语料库构建方法被引量:6
《地理与地理信息科学》2022年第4期7-12,共6页张春菊 张磊 陈玉冰 刘文聪 薄嘉晨 肖鸿飞 
自然资源部城市国土资源监测与仿真重点实验室开放基金项目(KF-2020-05-084);国家自然科学基金项目(42171453)。
地质实体识别是地质文本信息挖掘和地质知识图谱构建的重要基础,高质量的地质实体语料库是提高地质实体识别效果的重要因素,但目前用于中文地质实体识别的标注语料较少且内容局限于一定领域范围内,而传统的人工标注方法往往耗时耗力且...
关键词:BERT 地质实体识别 交互式 地质实体语料库 
基于情感词典和标注语料库的乌兹别克语短文本情感分析被引量:2
《中央民族大学学报(自然科学版)》2022年第2期5-12,共8页原伟 
国家社科基金重大项目(20&ZD120);国家社科基金重点项目(20AZD130);河南省哲学社会科学规划项目(2021BYY024)。
本文以中亚跨境民族语言乌兹别克语为研究对象,搭建了包含形容词、名词、动词、程度及否定副词、否定词、转折及递进连接词、复杂短语在内的情感词典(共6 451条);设计了情感标注体系,对包含6 000条网络评论的语料库进行情感类别、表达...
关键词:乌兹别克语 情感分析 情感词典 
古汉语词义标注语料库的构建及应用研究被引量:5
《中文信息学报》2022年第5期21-30,共10页舒蕾 郭懿鸾 王慧萍 张学涛 胡韧奋 
国家自然科学基金(62006021);北京市社会科学基金青年学术带头人项目(21DTR037)。
古汉语以单音节词为主,其一词多义现象十分突出,这为现代人理解古文含义带来了一定的挑战。为了更好地实现古汉语词义的分析和判别,该研究基于传统辞书和语料库反映的语言事实,设计了针对古汉语多义词的词义划分原则,并对常用古汉语单...
关键词:古代汉语 语料库 词义标注 词义消歧 
面向高等教育领域的命名实体标注语料库构建方法
《现代信息科技》2022年第5期95-97,共3页黄柯源 张浩军 李世龙 李大岭 王家慧 
国家第二批新工科研究与实践项目(E-CXCYYR20200937);国家自然科学基金面上项目(62073123);河南省科技攻关项目(212102210086);2020年河南省新工科研究与实践项目(2020JGLX037)。
文章以高等教育政策文件为语料,在领域专家指导下结合高等教育政策文件文本特点,制定了一套标注体系和标注规范,开展了大规模的语料标注工作,构建了一个面向高等教育领域的标注语料库。该语料库共标注了137篇政策文件,包含5102个句子和3...
关键词:高等教育 命名实体 标注规范 语料库构建 
大湾区多语种政府新闻标注语料库建设研究
《文化创新比较研究》2022年第9期62-66,共5页姜嬴 杨静 朱哲宇 林佳莹 
2021年广东省科技创新战略专项(攀登计划)(项目编号:pdjh2021a0607);国家语委科研项目(项目编号:YB135-123);粤港澳大湾区国际教育示范区建设研究项目(项目编号:2020WQYB030);广州市社科规划课题(项目编号:2019GZY26);广东省哲学社会科学规划项目(项目编号:GD19CYY01)。
粤港澳大湾区是中国开放程度最高、经济活力最强的区域之一,在“一国两制”政策实施的背景下,广东、香港、澳门地区的语言文化(普通话、粤语、英语、葡萄牙语等)呈现出了多样性状态,使得语言规则变得复杂,目前尚未存在同时支持针对粤港...
关键词:粤港澳大湾区 多语种语料库 分词标注策略 
海量标注语料库智能构建系统的设计与实现
《现代计算机》2021年第33期87-92,共6页杨静 姜赢 朱哲宇 
广东省哲学社会科学规划项目(GD19CYY01);全国科技名词委科研项目(YB2020003);粤港澳大湾区国际教育示范区建设研究项目(2020WQYB030);国家语委科研项目(YB135-123);珠海市哲学社会科学规划课题(2019YB051)。
构建了一个基于海量语料库的智能标注系统,用于大规模语料数据的标注处理,系统主要用户角色分为管理员、众包标注用户和专家标注用户。采用三级标注的方法来保证语料标注的效率和准确度,众包标注用户在已经由算法预标注过的语料基础上...
关键词:语料库 标注系统 众包 
题元角色句法配位的词汇语义制约被引量:2
《南京师范大学文学院学报》2020年第4期181-188,共8页张黎 孙道功 
国家哲学社会科学基金项目“现代汉语句法-语义接口的语用制约研究”(编号:20BYY168);江苏省哲学社会科学基金项目“‘词汇–句法语义’链接知识库的开发与应用研究”(编号:19YYB008);教育部人文社科规划基金项目“基于语义知识库的名核结构的‘句法–语义’接口研究”(编号:19YJA740048)。
题元角色的句法配位是“句法–语义”接口的重要环节。本文基于标注语料库,以三种不同价类的典型动词为研究对象,考察了基本题元角色句法配位的词汇语义制约特点。结论认为:(1)同一价类动词所关涉的基本题元角色类型和数量通常具有一致...
关键词:题元角色 句法配位 语义制约 标注语料库 
检索报告 对象比较 聚类工具 使用帮助 返回顶部