视觉模型

作品数:227被引量:796H指数:15
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄魁华侯志强张广军唐向宏范长俊更多>>
相关机构:中国科学院清华大学西安交通大学北京航空航天大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
融合物理规律与认知机理 推动AI应用取得新突破
《广东科技》2025年第2期16-19,共4页孙进 刘启强 徐向民 
[导读]当前,我们正快速步入智能化社会,为攻克视觉模型中因缺少显式刻画视觉物理规律而难以实现全面覆盖的技术瓶颈,华南理工大学徐向民教授带领团队开展了“基于认知机理与物理规律的视觉计算理论与方法”项目研究。项目组在视觉计算...
关键词:AI 视觉模型 模型优化 物理规律 视觉计算理论 
融合视觉模型的离散小波变换算法及设计
《科技与创新》2025年第6期5-7,共3页于飞 
桂林信息科技学院校级科研项目“基于深度多重变换的图像数字水印算法应用研究”(编号:XJ202038);广西高校中青年教师科研基础能力提升项目“基于混合嵌入算法的视频数字水印技术研究”(编号:2023KY1690)。
深入探讨了小波变换的起源、发展及其在信号处理中的应用,特别是离散小波变换(Discrete Wavelet Transform,DWT)在减少信号冗余和提高处理效率方面的优势。同时,对人类视觉系统(Human Vision System,HVS)的特性以及韦伯-费希纳定律和Wat...
关键词:数字水印 多重离散小波变换 ARNOLD置乱 MATLAB算法仿真 
基于超像素分割与三维空间的智慧站场人员违规行为全方位跟踪监测方法
《计算技术与自动化》2025年第1期70-74,共5页王全乐 张演义 姜艳民 张奋 周赛峰 白社峰 
现有智慧站场人员跟踪监测方法难以在兼顾多目标的同时保证较高的监测性能。为此,设计了基于超像素分割与三维空间的智慧站场人员违规行为全方位跟踪监测方法。基于改进的Itti视觉模型,提取感兴趣区域,通过小波变换替换Itti视觉模型中...
关键词:改进的Itti视觉模型 超像素分割 三维空间 联级AdaBoost检测 智慧站场人员 违规行为跟踪监测 
基于改进YOLOv8的小棚架下无核白葡萄果梗识别被引量:1
《中国农机化学报》2025年第2期259-263,278,共6页李涛 买买提明·艾尼 古丽巴哈尔·托乎提 杨佳雨 
国家自然科学基金资助项目(12162031)。
小棚架下准确识别无核白葡萄果梗是葡萄采摘机器人自动采摘任务的关键。针对新疆吐鲁番市小棚架下鲜食无核白葡萄果梗识别效果差的问题,提出一种基于YOLOv8的无核白葡萄果梗识别模型Small—YOLO,实现无核白葡萄果梗的自动识别。在原有...
关键词:无核白葡萄 采摘机器人 果梗识别 坐标注意力机制 可变形卷积 视觉模型 
面向深度神经网络视觉模型对抗鲁棒性的攻击与防御方法研究综述
《网络安全技术与应用》2025年第1期42-48,共7页刘文钊 郭凯威 
对抗攻击严重威胁着深度神经网络视觉模型的实际应用,这是当前人工智能发展面临的主要挑战之一。为了深入理解深度学习模型的脆弱性并开发更有效的防御方法,本文综述了面向深度神经网络视觉模型的对抗攻击与防御方法研究。首先介绍了对...
关键词:深度神经网络 对抗攻击 对抗防御 对抗鲁棒性 
基于大模型的具身智能系统综述被引量:1
《自动化学报》2025年第1期1-19,共19页王文晟 谭宁 黄凯 张雨浓 郑伟诗 孙富春 
国家自然科学基金面上项目(62173352);广东省基础与应用基础研究基金杰出青年基金(2024B1515020104)资助。
得益于近期具有世界知识的大规模预训练模型的迅速发展,基于大模型的具身智能在各类任务中取得了良好的效果,展现出强大的泛化能力与在各领域内广阔的应用前景.鉴于此,对基于大模型的具身智能的工作进行了综述,首先,介绍大模型在具身智...
关键词:大语言模型 大型视觉模型 基础模型 具身智能 机器人 
使用深度视觉模型提升终端自动化测试能力的研究
《长江信息通信》2025年第1期96-98,105,共4页邓华 
该文旨在探索深度视觉模型在终端自动化测试中替代人工视觉判断的可行性。通过对预训练的图像和视频识别模型进行微调,开发了新的视觉自动化测试工具。研究应用了目标检测、识别、跟踪及视频理解等模型,重点解决了花屏识别、机顶盒UI控...
关键词:深度视觉模型 终端自动化测试 人工视觉替代 
基于跨媒介理论的建筑遗产价值评估模型设计——以苏州为例
《创意与设计》2024年第6期67-75,共9页崔华春 武嘉玮 
江苏高校哲学社会科学研究重大项目(2019SJZDA117)。
本文旨在以跨媒介理论的视角,探索并建构一种建筑遗产价值可视化评估模型。首先,基于开放性的跨媒介理论认识,以苏州市控保、文保单位为基础对研究样本进行区位界定;然后从历史与文化、美学与工艺、经济与社会等3个评估维度对数据与案...
关键词:建筑遗产 跨媒介 遗产保护 视觉模型 可持续 
数据智能的知识革命:大模型的行业实践
《软件和集成电路》2024年第10期26-27,共2页林松涛 
数据和模型要与业务系统深度融合,以业务运营目标为牵引。为此,我们研发了自主演化的任务链“拓天链”,实现了知识和数据的混合驱动。近年来,大模型开启了我们通往AGI的通路。以OpenAI为例,我们可以看到AGI的发展路径:在早期阶段,语言...
关键词:主动探索 深度融合 人工智能 视觉模型 发展路径 语言模型 任务链 混合驱动 
从Sora到AGI:智能媒介的升维与全新场景体验时代的到来被引量:19
《编辑之友》2024年第6期39-45,共7页喻国明 苏健威 
北京师范大学博士生学科交叉基金项目“扩展现实技术环境中的人机与情感传播效果”(BNUXKJC2215);北京师范大学人才培养质量提升专项计划。
作为新一代大型视觉模型,Sora使文生视频技术实现了从“堪用”到“好用”的飞跃,其走红的背后是迈向通用人工智能的可能。Sora本质上是智能媒介的一次重大升维,使价值生成从此具备时空维度,这将开启数字文明的序幕。Sora的意义在于:首先...
关键词:SORA 大型视觉模型 场景体验 通用人工智能 智能媒介 
检索报告 对象比较 聚类工具 使用帮助 返回顶部