AI资讯2026/03/27内存焦虑终结者:谷歌发布TurboQuant技术,实现大模型压缩六倍谷歌推出TurboQuant技术,通过压缩KV缓存,有效解决大语言模型推理中的内存瓶颈问题,显著降低内存使用且不损失准确率,提升处理长文本和复杂任务的效率。