谷歌放大招！LMEval开源评测框架上线，AI模型比拼从此更透明

作者

2025-05-29

50次阅读

人工智能

近日，谷歌发布开源框架LMEval，为大语言和多模态模型提供标准化评测工具。该框架基于LiteLLM开发，兼容多个主流AI平台，简化跨平台模型性能比较，支持文本、图像和代码等多领域评估，还具备多线程、增量评估功能。其内置可视化工具，能识别模型“规避策略”。通过GitHub提供示例笔记本，降低开发者技术门槛。LMEval有望成为AI模型比较新标杆，推动AI评测规范化与透明化。此外，文章还推荐了LocAgent发布、DeepSeek - R1 - 0528开源等相关AI新闻。