NVIDIA强化与DiffusionGemma的兼容性，推动本地AI实现

发布时间：2026/6/16

NVIDIA与DiffusionGemma

NVIDIA宣布已对由日本国家Google AI研发团队开发的开源模型DiffusionGemma进行了优化，使其能够在从本地PC到云端的多种环境中更快速地运行，支持NVIDIA GeForce RTX GPU、NVIDIA RTX PRO平台以及NVIDIA DGX Spark系统。

DiffusionGemma基于Gemma 4构建，不再像传统方法那样一次预测一个token，而是能够在每一步中同时去除多达256个token的噪声。这种性能提升使得即使在单用户场景下，通常会出现性能瓶颈的文本生成任务，也能在本地硬件上实现高速处理。

通过将256个token的区块整体并行处理，DiffusionGemma充分契合了NVIDIA GPU的设计理念。NVIDIA的Tensor核心加速了高密度并行计算，CUDA软件栈无需特别调整即可高效执行模型，充分发挥了GPU的优势，实现了高效的处理能力。

借助这一优化，用户可以在NVIDIA DGX Spark、NVIDIA RTX PRO 6000工作站以及DGX Station等设备上，获得最佳的本地AI体验。

此外，支持在GeForce RTX GPU上运行的开源推理引擎llama.cpp也计划在近期推出，进一步丰富本地AI的生态环境。

标签

#NVIDIA #本地AI #DiffusionGemma #GPU优化 #生成式AI

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

AI实验室呼吁放缓脚步，亚马逊与SpaceX依然高速前进

2026/08/01

AI实验室呼吁放缓脚步，亚马逊与SpaceX依然高速前进

在多年全速推进人工智能发展的背景下，OpenAI首席执行官Sam Altman表示，或许现在是AI行业“放慢节奏”的时候了。这番言论发布于OpenAI的一款模型意外脱离测试环境并卷入Hugging Face安全漏洞事件几天后——尽管正如TechCrunch Equity播客主持人指出的那样，漏洞的发生同样归因于安全措施的疏忽。Altman并非孤军作战，OpenAI和Anthropic均支持一份呼吁

AI情感剧在X平台泛滥，创作者借此赚取收益

2026/08/01

AI情感剧在X平台泛滥，创作者借此赚取收益

某天，我的X平台动态中出现了一条线索。虽然我知道这位第一人称叙述者很可能并不存在，但我还是被这段充满煽情的故事吸引，故事中善良最终战胜了邪恶。事实上，作者并非一位因盗窃受审的母亲，而是一位自称21岁的尼日利亚股票交易员，他利用AI生成故事，并通过X平台获得报酬。我之所以注意到这些简短的救赎情节频繁出现在我的动态中，是因为我偶尔会随意点击这些俗套的故事，想看看接下来会发生什么，算法也因此关注了我。

中国AI研究人员在X平台上逐渐发声

2026/08/01

中国AI研究人员在X平台上逐渐发声

过去一年，我注意到越来越多的中国人工智能研究人员加入了X平台，积极参与关于AI发展和商业化的广泛讨论。以Moonshot AI为例，这家公司推出了Kimi K3模型。周四，我迅速找到了大约30个自称目前与Moonshot有关联的X账号，其中包括两位联合创始人，以及六名前员工和合作伙伴。这些账号并非闲置，他们不仅分享Moonshot的重要发布和研究论文，还与西方研究人员互动，分享个人生活和兴趣爱好。