#大型语言模型

按标签聚合查看文章内容。

AI资讯

xAI发布Grok4.20:推理性能大幅提升,78%非虚构率创行业新高

2026年3月12日,xAI正式推出新一代大型语言模型Grok4.20Beta,该模型在保持竞争性价格的同时,实现了极高的事实可靠性,刷新了行业记录。 根据Artificial Analysis的最新评测,Grok4.20在智能指数中的推理能力得分为48分,比上一版本提升了6分。虽然在综合基准测试中仍落后于Gemini3.1Pro Preview和GPT-5.4(两者均为57分),但其在AA全知测

日本丸红社内生成AI平台“まるちゃ”对外开放,支持多模型及高精度RAG,月费3万元起AI资讯

日本丸红社内生成AI平台“まるちゃ”对外开放,支持多模型及高精度RAG,月费3万元起

日本丸红信息系统株式会社(丸红I-DIGIO集团)于11日宣布,将其在丸红集团内部广泛使用的生成式AI平台“まるちゃ”对外开放,向外部企业提供服务。企业若自行从零搭建AI基础设施,需投入大量初期资金并配备专业人才,涵盖LLM连接、认证、日志管理、权限控制、文档检索、应用集成及运维等多个环节。而“まるちゃ”则基于丸红集团内部长期使用所锤炼的AI基础环境,以SaaS形式快速且低成本地提供给企业使用。

搭载RTX Spark的笔记本电脑“Surface Laptop Ultra”亮相!支持1200亿参数大型语言模型运行AI资讯

搭载RTX Spark的笔记本电脑“Surface Laptop Ultra”亮相!支持1200亿参数大型语言模型运行

美国微软公司于2026年5月31日(当地时间)发布了面向全球创作者和AI开发者的15英寸笔记本电脑“Surface Laptop Ultra”。该产品预计将于今年下半年正式上市,售价尚未公布。 Surface Laptop Ultra由微软与NVIDIA联合工程设计,搭载了NVIDIA最新的Windows平台处理器“RTX Spark”,配备Blackwell RTX GPU和最高128GB统一

OpenAI联合创始人Andrej Karpathy加盟Anthropic预训练团队AI资讯

OpenAI联合创始人Andrej Karpathy加盟Anthropic预训练团队

Andrej Karpathy,这位曾共同创立OpenAI并曾领导特斯拉AI团队的知名人工智能研究员,现已加入Anthropic。 Karpathy在周二于社交平台X上宣布:“我已加入Anthropic。我认为未来几年在大型语言模型(LLM)前沿领域将极具影响力。我非常兴奋能加入这里的团队,重新投身研发工作。” 本周,Karpathy开始在Anthropic工作,负责预训练项目,团队由Nick J

人工智能代理简介及应用场景AI教程

人工智能代理简介及应用场景

人工智能代理简介及应用场景 欢迎参加“人工智能代理入门”课程!本课程将为您提供构建人工智能代理的基础知识和实用示例。 加入Azure AI Discord社区,与其他学习者和AI代理开发者交流,解答您在课程中的疑问。 课程开始,我们将深入了解什么是人工智能代理,以及如何在应用程序和工作流程中有效使用它们。 课程内容 本课涵盖: 什么是人工智能代理及其不同类型? 人工

本地运行大型语言模型工具“Ollama”支持“Hermes Desktop”AI资讯

本地运行大型语言模型工具“Ollama”支持“Hermes Desktop”

开源工具“Ollama”近日发布了v0.30.7版本更新,该工具支持在本地环境运行大型语言模型(LLM),兼容Windows、macOS和Linux系统,用户可从官方网站免费下载使用。 “Ollama”允许用户通过简单的命令下载并本地运行如“Gemma”、“Qwen”、“Llama”等开源大型语言模型,支持聊天和API调用,且基于MIT许可证开源开发,方便用户管理和使用本地模型。 此次更新的亮点

AI助力停车违章处理!NVIDIA Agent Toolkit引领未来AI资讯

AI助力停车违章处理!NVIDIA Agent Toolkit引领未来

在2026年COMPUTEX大会上,具备更强自主性的代理型AI成为了焦点。日本国家NVIDIA公司同时发布了专为Windows设计的SoC“RTX Spark”,以更好地支持这类代理型AI的运行。 本文将通过GTC Taipei记者说明会等渠道,分享关于AI代理及代理型AI的最新资讯。NVIDIA正通过其“NVIDIA Agent Toolkit”推动AI技术开创新未来。 让大型语言模型(LLM

五角大楼正在开发替代Anthropic的人工智能方案AI资讯

五角大楼正在开发替代Anthropic的人工智能方案

五角大楼与Anthropic之间的合作关系在经历了戏剧性的破裂后,似乎难以恢复。根据彭博社对五角大楼首席数字与人工智能官卡梅伦·斯坦利的采访,五角大楼正在积极开发多种大型语言模型(LLM),以替代Anthropic的人工智能技术,并计划很快将这些模型投入实际使用。 Anthropic与美国国防部签订的2亿美元合同在过去几周内因双方未能就军方对Anthropic人工智能的无限制访问达成一致而告吹。A

Skymizer发布能以约240W功耗推理700B大型语言模型的AI加速器AI资讯

Skymizer发布能以约240W功耗推理700B大型语言模型的AI加速器

台湾Skymizer公司于4月23日发布了基于HyperThought平台打造的AI加速器芯片“HTX301”。该芯片通过6颗集成,并配备384GB内存的PCIe卡,能够以约240瓦的功耗完成700B参数规模大型语言模型(LLM)的推理计算。 HyperThought架构专为推理为核心的AI时代设计,采用了预填充(prefill)和解码(decode)工作负载分离的策略。通过解码优先的硅片设计结

SB C&S开始代理Sparticle的本地部署生成式AI平台“GBase on Spark”AI资讯

SB C&S开始代理Sparticle的本地部署生成式AI平台“GBase on Spark”

日本SB C&S株式会社于10日宣布,正式开始代理Sparticle株式会社的本地部署型大型语言模型(LLM)平台“GBase on Spark”,该平台能够在不将机密数据发送到外部的情况下,安全地利用生成式AI。 “GBase on Spark”是一套结合了本地部署生成式AI解决方案“GBase On-premises”与包括NVIDIA AI基础设施“NVIDIA DGX Spark”

SandboxAQ将其药物发现模型引入Claude——无需计算机博士学位AI资讯

SandboxAQ将其药物发现模型引入Claude——无需计算机博士学位

药物发现是现代工业中成本最高的领域之一。找到一个可行的分子可能需要十年时间,花费数十亿美元,而且大多数候选分子最终都未能成功。新一代的人工智能初创公司承诺解决这一难题——大多数工具已经让技术足够成熟的研究人员使用起来更为轻松。 但SandboxAQ认为,瓶颈不在于模型本身,而在于界面设计。 该公司与Anthropic合作,将其科学人工智能模型直接集成到Claude中——通过一个对话式界面提供强大的