上海交大、上海 AI 实验室、港中文等发布大型视觉语言模型最新成果 MIA-DPO

AI快讯
11月04日

AISCK

上海交大、上海 AI 实验室、港中文等带来最新成果 MIA-DPO，这是面向大型视觉语言模型的多图像增强的偏好对齐方法。它将单图像数据扩展至多图像数据，设计了序列、网格拼贴和图中图三种数据格式，降低数据收集和标注成本且具高度可扩展性。理解多图像上下文是视觉语言大模型发展趋势之一，但多图像易产生幻觉问题且可能削弱单图像任务表现，多图像偏好对齐仍是难题，MIA-DPO 无需人工标注或昂贵 API 解决了该问题。通过分析视觉大语言模型在多图像处理中的注意力分布差异，提出基于注意力的选择方法，自动过滤错误答案，构建自动化、低成本的多图像场景 DPO 数据生成方法，并引入后选择步骤过滤噪声样本。

MIA-DPO 构建了三种格式的多图像 DPO 数据，在多个多图和单图 benchmarks 上测试显示，能显著提升模型多图感知与推理能力，同时保持模型原有的单图理解能力，为多图像场景中对齐模型与人类偏好提供全新解决方案，推动了 LVLMs 在复杂多图像任务中的应用，为未来研究奠定基础。

{{userData.name}}已认证

如何用AI将手绘素描图生成未来科技感高清概念图

机器人驾驶着未来概念汽车

赛博朋克风格的未来概念车/赛车

2025新年红装女孩元旦插图海报元素背景（AI绘画+Midjourney提示词）

红衣服女孩穿着喜庆贺新年（AI绘画+Midjourney提示词）

2025年春节新年元旦海报黑色背景喜庆矢量图海报设计（AI绘画+Midjourney提示词）

2025年新年日历牌元旦海报背景（AI绘画+Midjourney提示词）

上海交大、上海 AI 实验室、港中文等发布大型视觉语言模型最新成果 MIA-DPO

【限量款】2024龙年大吉微信红包封面

【精品AI进阶课】零基础快速学会高效运用AI

探索AIGC创作之美，共享人工智能学习之乐

欢迎来到 AISCK , 开启你的AI学习探索之旅 , 一起创造无限可能的精彩世界！

科学

优秀AI生成

品质素材！每日更新AIGC干货

AISCK

强烈推荐！AISCK官方品牌微博

AISCK

官方微博，海量教程看不完

AI基础训练营

零基础入门，带你成为AIGC高手

创造力

AIGC

抖音号：AISCK

AISCK·AI

抖音号：AISCK

知识

每天实训五分钟

一年萌新变大神

扫码关注AISCK

官方微信公众号

AISCK

AI前沿研究室

关于AISCK

产品服务

热门灵感

热门教程

{{userData.name}}已认证

如何用AI将手绘素描图生成未来科技感高清概念图

机器人驾驶着未来概念汽车

赛博朋克风格的未来概念车/赛车

2025新年红装女孩元旦插图海报元素背景（AI绘画+Midjourney提示词）

红衣服女孩穿着喜庆贺新年（AI绘画+Midjourney提示词）

2025年春节新年元旦海报黑色背景喜庆矢量图海报设计（AI绘画+Midjourney提示词）

2025年新年日历牌元旦海报背景（AI绘画+Midjourney提示词）

【限量款】2024龙年大吉微信红包封面

【精品AI进阶课】零基础快速学会高效运用AI

探索AIGC创作之美，共享人工智能学习之乐

欢迎来到 AISCK , 开启你的AI学习探索之旅 , 一起创造无限可能的精彩世界 ！

科学

优秀AI生成

品质素材！每日更新AIGC干货

AISCK

强烈推荐！AISCK官方品牌微博

AISCK

官方微博，海量教程看不完

AI基础训练营

零基础入门，带你成为AIGC高手

创造力

AIGC

抖音号：AISCK

AISCK·AI

抖音号：AISCK

知识

每天实训五分钟

一年萌新变大神

扫码关注AISCK

官方微信公众号

AISCK

AI前沿研究室

关于AISCK

产品服务

热门灵感

热门教程

欢迎来到 AISCK , 开启你的AI学习探索之旅 , 一起创造无限可能的精彩世界！