xAI发布Grok4.20:推理性能大幅提升,78%非虚构率创行业新高
2026年3月12日,xAI正式推出新一代大型语言模型Grok4.20Beta,该模型在保持竞争性价格的同时,实现了极高的事实可靠性,刷新了行业记录。 根据Artificial Analysis的最新评测,Grok4.20在智能指数中的推理能力得分为48分,比上一版本提升了6分。虽然在综合基准测试中仍落后于Gemini3.1Pro Preview和GPT-5.4(两者均为57分),但其在AA全知测
按标签聚合查看文章内容。
2026年3月12日,xAI正式推出新一代大型语言模型Grok4.20Beta,该模型在保持竞争性价格的同时,实现了极高的事实可靠性,刷新了行业记录。 根据Artificial Analysis的最新评测,Grok4.20在智能指数中的推理能力得分为48分,比上一版本提升了6分。虽然在综合基准测试中仍落后于Gemini3.1Pro Preview和GPT-5.4(两者均为57分),但其在AA全知测
AI资讯Remote是一家成立七年、总部位于阿姆斯特丹的薪资服务提供商,近日宣布其年经常性收入突破3亿美元,并实现了现金流正向。但公司强调,真正值得关注的是背后的故事:在全面采用人工智能后,每位员工的收入增长了50%。 Remote的CEO Job van der Voort告诉TechCrunch:“此刻,我的笔记本电脑第二屏幕上同时运行着五个不同的Claude实例,构建着各种项目——其中一些是为我个人
AI资讯中国AI大模型在国际主流平台的周调用量连续两周超过美国,达到4.69万亿Tokens,增长11.83%,而美国模型调用量下降9.33%至3.294万亿。
AI资讯Anthropic公司于2023年在伦敦开设了首个办公室,现计划搬迁至与Google DeepMind、OpenAI、Meta、Wayve、Isomorphic Labs、Synthesia及多家AI研究机构同一地区。新办公室面积达158,000平方英尺,能容纳800名员工,是目前员工规模的四倍,有望超越最近宣布伦敦扩张的OpenAI。 Anthropic欧洲、中东及非洲区负责人Pip White
AI资讯Bret Taylor创立的AI初创公司Sierra宣布完成由Tiger Global和GV领投的9.5亿美元融资,使公司估值超过150亿美元。此次融资使Sierra手握超过10亿美元资金,公司计划利用这笔资金打造全球领先的AI驱动客户体验标准。 像许多AI企业一样,Sierra积极展示自身在激烈市场中的成长。公司表示,几年前仅有4个设计合作伙伴,如今已拥有超过40%的财富50强企业客户。其平台上
AI资讯随着人工智能的广泛应用,企业开始对AI带来的高昂费用感到担忧。2026年,Uber在四月份就花光了全年AI编码预算;微软在几个月后撤销了开发者的Claude Code许可证;Priceline的一名员工透露,常规的Cursor合同续约费用上涨了4到5倍。 尽管每个代币的价格有所下降,但随着AI应用的推广和自主代理的增加,代币的消耗量持续攀升。那些在2025年初购买无限制订阅的公司,如今正努力追踪资
AI教程自今年三月推出 Manus 以来,我们陆续发布了多项新功能,包括视频和图像生成、幻灯片以及操作手册。未来还有更多令人期待的功能正在开发中! 在幕后,是一群人不断构建并引领 Manus 的发展方向。 具体来说,是我们的用户和团队成员。 自三月以来,我们有幸通过在迪拜、伦敦、利雅得、旧金山、新加坡、悉尼、东京、墨尔本等地举办的活动,与全球社区和用户面对面交流。丰富的使用案例和宝贵的反馈极大地推动了我们
AI资讯Anthropic发布了Claude Fable 5,这是其备受关注的Mythos模型的首个公开版本。Fable到底能做些什么?事实证明,它能做的事情非常多样。 著名AI研究员、宾夕法尼亚大学学者Ethan Mollick一直在尝试使用该模型,并且玩得非常开心。 在测试中,Mollick表示Fable“在性能上远远超过了我用过的几乎所有公开模型”。他补充说,该模型“能胜任多种问题,并产生令人惊讶的
AI资讯ElevenLabs与AI风险评估公司AIUC合作,推出针对AI语音代理的综合保险服务,解决企业对AI行为责任不明确的担忧。
AI资讯Cartwheel通过生成3D动画数据,赋予创作者更多控制权,推动动画创作进入开放式故事和实时表演的新阶段。
AI资讯人工智能的使用成本正在迅速上升,许多公司开始限制AI的使用以控制开支。优步便是其中之一,最近该公司实施了内部使用上限,以减少其高昂的AI支出。 据彭博社报道,优步规定每位员工及其使用的智能编码工具(包括Anthropic的Claude Code和Cursor)每月的使用费用上限为1500美元。员工可以通过内部仪表盘实时监控使用情况,尽管在某些情况下,经过批准后可以超出该限额。 这一举措并不令人意外
AI资讯Y Combinator著名CEO加里·谭在SXSW大会上透露,他因与AI代理合作而兴奋不已,几乎无法入眠,自嘲患上了“网络精神病”。他表示自己每晚只睡四个小时,称这种状态让他充满活力,甚至不需要服用助眠药物。 加里·谭回忆起自己曾经为了创业服用过抗嗜睡药莫达非尼,而如今与AI合作的兴奋感让他自然失眠。他目前正同时推进多个项目,包括重新打造他曾经的博客创业公司Posterous,以及他的其他创业项