文本标注

作品数:32被引量:109H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄杰王勇赵立军郝志峰蔡瑞初更多>>
相关机构:深圳市腾讯计算机系统有限公司北京百度网讯科技有限公司平安科技(深圳)有限公司北京明略软件系统有限公司更多>>
相关期刊:《大数据》《法律方法》《现代制造工程》《自动化技术与应用》更多>>
相关基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划江苏省高校优势学科建设工程资助项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
大型语言模型在法律文本零样本语义标注中不可思议的有效性
《法律方法》2024年第2期247-276,共30页 凯文·阿什利 孙自豪(译) 
2018年度国家社科基金重大项目“新兴学科视野中的法律逻辑及其拓展研究”子课题“基于大数据的智能法律检索”(项目号18ZDA034)的阶段性研究成果
ChatGPT的出现使得包括法律界在内的公众认识到大型语言模型(LLMs)的潜在用途(如文件起草、问题回答和摘要)。尽管该技术在以法律文本为重点的各种语义注释任务中表现良好,但随着更新、功能更强(GPT-4)或更具成本效益(GPT-3.5-turbo)的...
关键词:法律文本分析 大型语言模型(LLM) 零样本分类 语义标注 文本标注 
面向烟草领域的文本标注语料库构建
《烟草科技》2024年第6期99-106,共8页王永胜 刘亚丽 宗国浩 王迪 王锐 王金棒 李丰霖 贾楠 冯伟华 
河南省科技攻关项目“基于知识图谱的烟草病虫害专家系统构建技术研究”(232102210073);中国烟草总公司重大专项项目“烟草关联学科文献信息资源融合汇通平台研究与构建”[110202101031(SJ-02)];中国烟草总公司重点研发项目“烟草产业关键核心技术需求及技术预见研究”(110202102048);郑州烟草研究院青年人才托举工程项目“基于烟草科技文献的文本分析技术的研究”(602020CR0360)。
为快速获取烟草科技文献中的知识信息,通过交互式迭代学习的烟草知识实体标注与识别方法,构建了面向烟草领域的文本标注语料库,设计了适用于烟草领域的文本标注规范,并利用BERT+CRF(Bidirectional Encoder Representations from Transfo...
关键词:烟草 文本标注 语料库 文本分析 知识服务 
文本标注的历史性跨跃与改进空间——以“中国民族语言语法标注文本丛书”为例
《民族语文》2024年第2期3-18,共16页刘丹青 
国家社科基金特别委托项目“中国大百科全书第三版”(21@ZH015)子项目语言文字卷、深圳市孔雀鹏城学者启动项目支持。
本文指出在中国民族语言记录描写中,文本的语法标注是一个薄弱环节,而“中国民族语言语法标注文本丛书”采用基于类型学语言多样性而设计的多行标注法,更充分、更精准地提供了句子结构的句法语义信息,显著提升了文本的语言学价值,实现...
关键词:民族语言 文本标注 逐词标注 语法素 
无监督的财经新闻情感标注和情绪指数生成被引量:1
《海南大学学报(人文社会科学版)》2023年第3期84-95,共12页邵元海 何洋 吕孝敬 
国家自然科学基金委面上项目(11871183);国家自然科学基金委地区项目(61866010);海南省自然科学基金高层次人才项目(120RC449)。
财经新闻报道作为金融市场重要的信息来源,其情感倾向与市场走势有着密切联系。然而财经新闻具有专业性、客观性、无标注的特点,对其情感倾向进行精准量化往往十分困难。因此,本文设计了两阶段的财经新闻情绪指数提取方法,在第一阶段,...
关键词:财经新闻 无监督文本标注 情绪指数 注意力机制 
数字人文视域中的古籍文本标注方法研究——以MARKUS为例被引量:6
《大数据》2022年第6期15-25,共11页于亚秀 李欣 
中央高校基本科研业务费项目(No.2022ECNU-XWK-ZX05)。
文本标注是文本分析挖掘中的重要一步,面对大规模古籍资源,人工标注无法满足人文研究需求,且古籍语法结构和语言特点特殊,现代文本标注技术很难直接用于古籍研究。在分析人文研究者进行古籍文本标注中面临的难点和痛点的基础上,提出普...
关键词:数字人文 古籍 文本标注 MARKUS 
基于Web的众包文本标注平台构建与应用被引量:4
《计算机应用》2022年第S01期1-6,共6页项威 刘文卓 王邦 
国家自然科学基金资助项目(62172167)。
针对现有文本标注工具中缺乏复杂类型标注功能和众包质量检测方法等问题,构建了一个基于Web的众包文本标注平台。一方面,平台采用浏览器/服务器(B/S)的开发架构和前后端分离的开发方式,实现了复杂类型文本标注的需求,提供序列标注、单...
关键词:文本标注 自然语言处理 众包 WEB 一致性检测 
《隐喻、癌症和生命终结:一项基于语料库的研究》述评
《语料库语言学》2021年第1期157-162,共6页张慧 林正军 
国家社科基金重点项目“认知教学语法的构建与应用研究”(13AYY010);吉林省社科基金项目“构式语法视角下的翻译单位研究”(2018B26)阶段性研究成果
Elena Semino et al.2018.Metaphor,Cancer and the End of Life:A Corpus-Based Study.New York:Routledge.vi+308 pp.1引言ElenaSemino等学者合著的《隐喻、癌症和生命终结:一项基于语料库的研究》(2018)是Routledge Advances in Corp...
关键词:隐喻模式 《隐喻、癌症和生命终结:一项基于语料库的研究》 生命终结 基于语料库的研究 临终关怀 基于语义 文本标注 
基于机器阅读与文本标注的语文阅读理解试题智能化管理系统
《自动化技术与应用》2021年第6期177-180,共4页周颖 
本文提出了一种解决阅读理解测试中的答题问题的方法。系统以语文文档作为输入,回答有关该文档的多项选择问题,通过使用Lucene信息检索引擎通过附加的自动语言处理(例如词干、回指解析和词性标记)进行信息提取。通过比较Lucene为每个问...
关键词:阅读理解 Lucene信息检索引擎 自然语言处理 语料库 
面向问题意图识别的深度主动学习方法被引量:2
《中文信息学报》2021年第4期92-99,109,共9页付煜文 马志柔 刘杰 白琳 薄满辉 叶丹 
国家重点研发计划(2017YFB1002303);国家自然科学基金(61802381,61972386);民航科技重大专项(MHRD20160109)。
深度学习已经在许多自然语言处理任务中达到了最高水平的性能,但是这种方法通常需要大量的标注数据。该文围绕问题意图识别语料标注问题,结合深度学习和主动学习技术,实现了语料标注成本的降低。主动学习需要不断迭代地再训练,计算成本...
关键词:主动学习 文本标注 意图识别 
数字人文视域下的古文献文本标注与可视化研究——以《左传》知识库为例被引量:46
《大学图书馆学报》2020年第5期72-80,90,共10页李斌 王璐 陈小荷 王东波 
国家社会科学基金重大项目“基于《汉学引得丛刊》的典籍知识库构建及人文计算研究”(编号:15ZDB127);国家社会科学基金“中文抽象语义库的构建及自动分析研究”(编号:18BYY127);江苏省高校优势学科建设工程资助项目的研究成果之一。
在数字人文研究范式下,传统的以电子化和全文检索为基础的古籍研究模式已难以满足历史学、文献学、语言学等学科深度研究的需要。古籍文本特别是史书所记载的词语、时间、地点、人物、事件等要素都需要结构化的历史人文数据库,从而实现...
关键词:数字人文 《左传》 实体标注 数据库 古文信息处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部