苏祺

作品数:18被引量:70H指数:5
导出分析报告
供职机构:北京大学外国语学院更多>>
发文主题:信息检索自然语言处理词性标注信息检索系统向量空间模型更多>>
发文领域:自动化与计算机技术语言文字文化科学哲学宗教更多>>
发文期刊:《语言战略研究》《中国外语》《数字人文研究》《天津外国语大学学报》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金教育部人文社会科学研究基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
数字人文研究的多模态转向
《新华文摘》2025年第4期156-159,共4页苏祺 位通 
数字人文作为新兴的跨学科领域,已逐渐成为当代学术研究的重要组成部分,其核心在于利用数字技术创新性地分析、呈现人文领域的丰富材料,以探究复杂的人文问题。数字人文研究的兴起可追溯至20世纪中叶,当时随着计算技术的进步,学者们开...
关键词:计算技术 数字人文 OCR 跨学科领域 当代学术 技术创新性 人文领域 量化分析 
数字人文研究的多模态转向
《中国社会科学文摘》2025年第2期15-16,共2页苏祺 位通 
数字人文作为新兴的跨学科领域,已逐渐成为当代学术研究的重要组成部分。其核心在于利用数字技术创新性地分析、呈现人文领域的丰富材料,以探究复杂的人文问题。数字人文研究的兴起可追溯至20世纪中叶,当时随着计算技术的进步,学者们开...
关键词:自然语言处理 计算技术 数字人文 跨学科领域 文本资源 人文学者 当代学术 技术创新性 
数字人文研究的多模态转向
《山东社会科学》2024年第10期92-101,共10页苏祺 位通 
国家自然科学基金青年科学基金项目“跨语言多模态文物知识图谱构建研究”(项目编号:72204011)的阶段性成果。
数字人文领域正在经历从单一语言中心主义向多模态综合视角的转向,这一转向不仅契合了人类接收与处理信息的自然模式,而且揭示了单模态在解析复杂人文问题时的局限性。多模态数字人文研究强调文字、图像、声音等多元符号资源在意义构建...
关键词:数字人文 多模态转向 数据化 人工智能 
《论语》在中国历代儒家典籍中的文本复用与互文分析
《中外文化与文论》2024年第2期174-192,共19页杨浩 李佳纯 王军 苏祺 
国家自然科学基金国际重点合作项目“中国儒家学术史知识图谱构建研究”(项目号:72010107003)的支持
古代典籍常有袭用前贤文字的现象,或逐字逐句直引原文,或以相近之意异文复用。踵武前贤的文本复用行为使得先贤的思想观念在后世传播演化、历久弥新。然而许多文献在复用前贤文字时并未直接标明因袭的出处,因此人文学者以往是通过逐句...
关键词:文本复用 互文性 论语 儒家典籍 计量研究 
融合实体信息的古汉语关系分类研究被引量:4
《数据分析与知识发现》2024年第1期114-124,共11页唐雪梅 苏祺 王军 
国家自然科学基金国际重点合作项目(项目编号:72010107003)的研究成果之一。
【目的】将实体信息与预训练语言模型结合应用到古汉语关系分类任务中,构建古汉语关系分类模型。【方法】首先,在预训练模型输入层中使用特殊标记标出实体对的位置,同时在原关系句之后拼接实体类型描述句;其次,在预练语言模型的输出中...
关键词:古汉语 关系抽取 关系分类 预训练语言模型 实体信息 
文化组学视角下的中国殡葬话语变迁被引量:2
《天津外国语大学学报》2023年第6期43-51,109-110,共11页苏祺 孟玲 赵芃 
国家社会科学基金重点项目“当代中国‘死亡话语’及发展考察”(19AYY001)
文章基于大规模殡葬话语语料库,通过文化组学的分析手段,对中国殡葬话语的意义沿革和主题演变进行定量分析,揭示了我国殡葬话语的历时语义变化及其背后的影响因素。从殡葬话语中“殡葬改革”和“殡葬政策”在1978-2022年的相对频次出发...
关键词:殡葬话语 文化组学 语料库 话语变迁 
基于预训练语言模型的繁体古文自动句读研究被引量:2
《中文信息学报》2023年第8期159-168,共10页唐雪梅 苏祺 王军 陈雨航 杨浩 
国家自然科学基金(72010107003)。
未经整理的古代典籍不含任何标点,不符合当代人的阅读习惯,古籍加断句标点之后有助于阅读、研究和出版。该文提出了一种基于预训练语言模型的繁体古文自动句读框架。该文整理了约10亿字的繁体古文语料,对预训练语言模型进行增量训练,在...
关键词:自动句读 自动标点 预训练语言模型 
“语言智能”多人谈被引量:4
《语言战略研究》2023年第4期53-56,共4页宋柔 李斌 王宝鑫 杨子清 伍大勇 李辰 荀恩东 苏祺 
语言学能为大规模语言模型的完善做些什么.宋柔(北京语言大学信息科学学院) 虽然大规模语言模型(以下简称“大模型”)的出色表现震动了社会,但是也暴露出了一些根本性的不足,比如:生成的文本会有事实性错误和逻辑谬误;缺少正误判断能力...
关键词:语言智能 语言模型 系统架构 事实性 抽象能力 逻辑谬误 参数量 创新能力 
基于图卷积神经网络的古汉语分词研究被引量:7
《情报学报》2023年第6期740-750,共11页唐雪梅 苏祺 王军 杨浩 
国家自然科学基金国际重点合作项目“中国儒家学术史知识图谱构建研究”(72010107003)。
古汉语的语法有省略、语序倒置的特点,词法有词类活用、代词名词丰富的特点,这些特点增加了古汉语分词的难度,并带来严重的out-of-vocabulary(OOV)问题。目前,深度学习方法已被广泛地应用在古汉语分词任务中并取得了成功,但是这些研究...
关键词:古汉语 汉语分词 图卷积神经网络 预训练语言模型 BERT(bidirectional encoder representations from transformers) 
语言智能的演进及其在新文科中的应用探析被引量:4
《中国外语》2023年第3期4-11,共8页苏祺 杨佳野 
本文旨在探讨语言智能的进化之路,重点关注ChatGPT在其中的角色和作用。从早期的响应性程序发展到使用复杂算法和模型实现自然语言理解和生成的智能系统,现代聊天机器人已经可以完成语义理解、情感识别和知识推理等高级语言处理任务,其...
关键词:ChatGPT 聊天机器人 人工智能 自然语言处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部