检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西安工程大学,陕西西安710048
出 处:《电脑知识与技术》2025年第4期152-154,共3页Computer Knowledge and Technology
摘 要:基于多模态大模型(MLLMs)开发的移动应用具备提供丰富用户体验的潜力。当前,关于人工智能在视觉表现层面的研究主要呈现出两种设计范式:一是具有人类特征的具象数智人,二是动态几何形态的抽象智能体。这两种范式在文旅领域的视觉问答(VQA)应用中各有优势。针对细分场景的用户需求,文章利用预训练的文旅行业大模型,开发了两个不同混合用户界面(HUI)设计风格的视觉问答App,以评估其在文化旅游情境中的实际效果。该研究旨在为未来文化旅游VQA移动应用设计提供参考,并为大语言模型的HUI设计提供新视角,推动移动计算终端多模态交互研究新方法的普及。
关 键 词:多模态大模型 视觉问答 混合用户界面 多模态交互
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171