AI快讯苏晓 2026-05-08 11:12:54 来源:中房网
中房网讯 5月5日,谷歌发布博文表示,为Gemma 4系列AI模型推出多Token预测(MTP)起草器,利用推测解码架构,推理速度最高可提升3倍。
据悉,谷歌曾表示,目前标准大语言模型推理通常受限于内存带宽,导致严重的延迟瓶颈。处理器需耗费大量时间将数十亿参数从显存传输至计算单元,造成了计算资源的利用率不足。而为了解决这个核心痛点,谷歌为Gemma 4系列大模型引入推测解码技术,配对重型目标模型(如 Gemma 4 31B)与轻量级起草器(MTP 模型)。
起草器利用闲置算力,在短时间内预测多个未来 Token,目标模型随后并行验证这些令牌。若预测通过,模型可在单次前向传递中确认整个序列,大幅缩短生成时间。
2026-05-08
更多
- 10:43
- 10:28
- 10:18
- 10:15
- 10:12
- 09:56
- 09:46
- 09:10
- 08:56
- 08:55
- 08:54
- 08:52
- 08:51
- 08:49
- 08:46
- 08:01
- 07:58
- 07:10
- 07:05
- 07:00
- 2026-05-07 11:54:31
中国城市住房价格288指数
(2023-02)1571.9点
- 0.13%

- -0.91%

| 日期 | 指数 | 环比 | 同比 |
|---|---|---|---|
| 2023.01 | 1569.9 | -0.97% | -0.14% |
| 2022.12 | 1572.1 | -0.92% | -0.11% |
| 2022.11 | 1573.9 | -0.12% | -1.08% |
| 2022.10 | 1575.8 | -0.20% | -1.01% |
| 2022.09 | 1579.0 | -0.02% | -0.87% |
| 2022.08 | 1579.3 | -0.04% | -0.62% |