谷歌放大招!LMEval开源评测框架上线,AI模型比拼从此更透明
作者
2025-05-29
6次阅读
人工智能

近日,谷歌发布开源框架LMEval,为大语言和多模态模型提供标准化评测工具。该框架基于LiteLLM开发,兼容多个主流AI平台,简化跨平台模型性能比较,支持文本、图像和代码等多领域评估,还具备多线程、增量评估功能。其内置可视化工具,能识别模型“规避策略”。通过GitHub提供示例笔记本,降低开发者技术门槛。LMEval有望成为AI模型比较新标杆,推动AI评测规范化与透明化。此外,文章还推荐了LocAgent发布、DeepSeek - R1 - 0528开源等相关AI新闻。