刘静

作品数:5被引量:76H指数:3
导出分析报告
供职机构:中国科学院自动化研究所更多>>
发文主题:图像文本视频多模态图像分类方法更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《科技创新导报》《中国图象图形学报》《中国科学基金》《计算机学报》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-5
视图:
排序:
基于大模型的多模态具身智能研究与展望被引量:2
《人工智能》2024年第3期27-35,共9页汪群博 刘静 
科技创新2030—“新一代人工智能”重大项目(2022ZD0118801);国家自然科学基金青年基金(62206279)。
随着大模型展现出越来越强大的通用知识和多模态能力,其可以更好地处理信息和决策推理,将大模型应用到物理世界中成为实现通用人工智能的一个重要发展方向。具身智能目标让智能体能够在物理世界中进行感认知与环境交互,以及自主学习与...
关键词:具身智能 大模型 多模态 
GPT-4对多模态大模型在多模态理解、生成、交互上的启发被引量:20
《中国科学基金》2023年第5期793-802,共10页刘静 郭龙腾 
科技创新2030“新一代人工智能”重大项目(2022ZD0118801);国家自然科学基金项目(U21B2043)的资助。
对话式聊天机器人ChatGPT以近乎摧枯拉朽的气势席卷社会,拨开了通用人工智能的曙光。ChatGPT的升级版GPT-4是个多模态大模型,它从单调的文本交互,升级为可以接受文本与图像组合的多模态输入,相比传统的单模态大模型,多模态大模型更加符...
关键词:GPT-4 多模态大模型 多模态理解 多模态生成 多模态交互 
结合特征图切分的图像语义分割被引量:11
《中国图象图形学报》2019年第3期464-473,共10页曹峰梅 田海杰 付君 刘静 
国家自然科学基金项目(61472422)~~
目的基于全卷积神经网络的图像语义分割研究已成为该领域的主流研究方向。然而,在该网络框架中由于特征图的多次下采样使得图像分辨率逐渐下降,致使小目标丢失,边缘粗糙,语义分割结果较差。为解决或缓解该问题,提出一种基于特征图切分...
关键词:深度学习 全卷积神经网络 语义分割 场景解析 特征切分 多尺度 特征复用 
跨媒体分析的理论和方法被引量:1
《科技创新导报》2016年第1期173-174,共2页卢汉清 刘静 黄萱菁 
该年度的研究主要围绕多媒体对象的多粒度语义分析与关联挖掘等方面展开,考察媒体对象与语义标签关联矩阵的纵横不同视角,充分发掘底层特征之间的关联性,语义特征之间的关联性,以及媒体对象在底层特征空间相似度和语义标签空间相似...
关键词:跨媒体 多柆度语义分析 关联挖掘 
基于图学习的自动图像标注被引量:42
《计算机学报》2008年第9期1629-1639,共11页卢汉清 刘静 
国家自然科学基金(60723005);国家"八六三"高技术研究发展计划项目基金(2006AA01Z315)资助~~
自动图像标注是图像检索任务中重要而具有挑战性的工作.文中首先讨论并解释了自动图像标注问题,通过总结现有的研究工作,提出了一种基于图学习的图像标注框架.在该框架下,图像标注被分为两个阶段来完成,即基本图像标注与图像标注改善.其...
关键词:图像标注 图学习 图像相似性 词义相关性 
检索报告 对象比较 聚类工具 使用帮助 返回顶部