DiffusionGemma
互联网
2026-06-12 12:14:24
DiffusionGemma是 Google DeepMind推出的实验性开源文本扩散模型。模型基于 Gemma 4 架构与 Gemini Diffusion 研究成果构建,采用 26B MoE 设计,通过并行去噪 256-token 文本块,在单张 NVIDIA H100 上实现 1000+ tokens/秒的生成速度,较传统自回归模型提升约 4 倍。模型支持双向注意力与实时自我纠错,量化后仅需 18GB VRAM 可在消费级 GPU 本地运行。







