AI资讯Skymizer发布能以约240W功耗推理700B大型语言模型的AI加速器
台湾Skymizer公司于4月23日发布了基于HyperThought平台打造的AI加速器芯片“HTX301”。该芯片通过6颗集成,并配备384GB内存的PCIe卡,能够以约240瓦的功耗完成700B参数规模大型语言模型(LLM)的推理计算。 HyperThought架构专为推理为核心的AI时代设计,采用了预填充(prefill)和解码(decode)工作负载分离的策略。通过解码优先的硅片设计结
按标签聚合查看文章内容。
AI资讯台湾Skymizer公司于4月23日发布了基于HyperThought平台打造的AI加速器芯片“HTX301”。该芯片通过6颗集成,并配备384GB内存的PCIe卡,能够以约240瓦的功耗完成700B参数规模大型语言模型(LLM)的推理计算。 HyperThought架构专为推理为核心的AI时代设计,采用了预填充(prefill)和解码(decode)工作负载分离的策略。通过解码优先的硅片设计结
AI资讯英伟达CEO黄仁勋在周一于加利福尼亚圣何塞举行的年度GTC大会开幕主题演讲中,抛出了大量技术数据,但最引人注目的是他对公司未来财务前景的预测。他表示,英伟达的Blackwell和即将推出的Vera Rubin芯片订单预计将达到1万亿美元,这反映了人工智能业务的蓬勃发展。 在演讲进行约一小时后,黄仁勋提到,去年英伟达对Blackwell和Rubin芯片的需求约为5000亿美元,覆盖至2026年。他说
AI资讯美国谷歌云(Google Cloud)在2026年4月22日至24日于美国拉斯维加斯举办的年度盛会“Google Cloud Next '26”上,正式发布了面向AI计算的第8代张量处理单元(TPU)——TPU 8t和TPU 8i两款产品。 谷歌云自2015年推出首款定制TPU以来,TPU一直搭载专门针对矩阵乘加运算的TensorCore,广泛应用于AI模型的训练和推理计算。 在发布会及分会场中