小米多模态大模型Xiaomi MiMo-VL开源
作者
2025-05-30
13次阅读
人工智能

近日,小米研发的MiMo-VL多模态模型在图片、视频、语言的通用问答和理解推理等任务上大幅领先同尺寸标杆多模态模型Qwen2.5-VL-7B,在奥林匹克竞赛和多个数学竞赛中超越参数规模10倍大的阿里模型与闭源模型GPT-4o,在内部大模型竞技场评估真实用户体验时超越GPT-4o。其全面的视觉感知能力得益于高质量预训练数据与创新混合在线强化学习算法。相关链接:https://huggingface.co/XiaomiMiMo。此外,还推荐了蚂蚁集团开源Ming-lite-omni、谷歌推出LMEval等相关AI新闻 。