#AI部署 - AI情报

2026/03/28

谷歌发布TurboQuant：大语言模型键值缓存压缩6倍，速度提升8倍，无精度损失，无需训练！

谷歌推出TurboQuant算法，结合PolarQuant和QJL技术，将大语言模型推理中的键值缓存内存需求至少压缩6倍，H100 GPU上注意力计算速度提升至8倍，同时保持零精度损失。这一突破有望降低AI部署成本，加速长上下文应用的发展。

AI资讯2026/03/17

腾讯内部测试QClaw：实现一键安装部署OpenClaw，微信QQ无缝集成

在人工智能日益加速发展的今天，你是否因为复杂的代码和环境配置而无法使用强大的AI工具？最近，一款名为OpenClaw（俗称“小螃蟹”）的开源AI代理在全球范围内迅速走红，甚至引起了马化腾的关注，他在社交媒体上分享并感叹：“没想到这么火。” 就在今天，腾讯带来了新动作——一款神秘的内部测试产品QClaw正式曝光。它不仅打破了AI技术门槛，还将AI直接带入了你的微信！ 1. QClaw究竟是什么？

AI商业

2026/03/29

Nexa SDK：在任意设备上快速部署任意 AI 模型

Nexa SDK 是一款面向移动端、PC、车载与物联网设备的 AI 部署工具包，可在 NPU、GPU、CPU 上高效运行 LLM、多模态、语音识别与语音合成模型，实现本地快速、私密、可量产的 AI 推理。