英伟达与 MIT、香港大学联手推出 Fast-dLLM 框架,推理速度提升惊人

作者
2025-06-03
3次阅读
人工智能
文章详情

在最近的科技进展中,英伟达与麻省理工学院(MIT)和香港大学联合推出了名为 Fast-dLLM 的新框架,显著提升了扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍。扩散模型理论上可实现多词元同步生成,但在实际应用中推理速度常不及自回归模型,因重复计算和词元依赖易被破坏。