英伟达与 MIT、香港大学联手推出 Fast-dLLM 框架，推理速度提升惊人

作者

2025-06-03

36次阅读

人工智能

在最近的科技进展中，英伟达与麻省理工学院（MIT）和香港大学联合推出了名为 Fast-dLLM 的新框架，显著提升了扩散模型(Diffusion-based LLMs)的推理速度，最高可达27.6倍。扩散模型理论上可实现多词元同步生成，但在实际应用中推理速度常不及自回归模型，因重复计算和词元依赖易被破坏。