小米多模态大模型Xiaomi MiMo-VL开源

作者
2025-05-30
14次阅读
人工智能
文章详情

近日,小米研发的MiMo-VL多模态模型在多个领域实力强劲,在图片、视频等通用问答及理解推理等任务上大幅领先同尺寸标杆多模态模型Qwen2.5-VL-7B ,在多模态推理任务成绩突出,超越阿里同类型模型及闭源模型GPT-4o,在复杂图片推理、问答及GUI操作上表现卓越。其全面视觉感知能力得益于高质量预训练数据及创新的混合在线强化学习算法(MORL)。相关链接:https://huggingface.co/XiaomiMiMo 。此外还介绍了蚂蚁集团开源Ming-lite-omni、谷歌推出LMEval等多条AI新闻。