#强化学习 - AI情报

Unsloth Studio发布：首个本地视觉大模型微调平台，显存使用降低70%

AI资讯

2026/03/20

Unsloth Studio发布：首个本地视觉大模型微调平台，显存使用降低70%

Unsloth AI推出开源无代码视觉工具Unsloth Studio，简化大语言模型微调流程，降低开发门槛，实现训练速度翻倍和显存使用减少70%。

AI资讯

2026/06/30

这款类人机器人堪称令人惊叹的高效办公室实习生

瑞士初创公司Flexion Robotics由前Nvidia机器人研究员创立，致力于解决机器人执行复杂任务的难题。该公司开发出一种训练机器人完成诸如开门、爬楼梯、搬运箱子等简单技能的方法。关键在于先在模拟环境中教会机器人单项技能，再由一个主控AI算法决定如何组合使用这些技能。目前大多数演示视频展示的类人机器人仅能完成特定任务，如叠衣服或上货架，且通常依赖远程操控——由人类在幕后控制机器人动作。然

AI资讯

2026/04/24

索尼新款AI机器人或能击败你打乒乓球

索尼发布了名为“Project Ace”的自主乒乓球机器人，能够与职业选手竞技，展示了AI在物理世界中达到人类专家水平的突破。

DeepMind的David Silver筹集11亿美元打造无需人类数据的自主学习AI

AI资讯

2026/04/28

DeepMind的David Silver筹集11亿美元打造无需人类数据的自主学习AI

英国人工智能实验室Ineffable Intelligence由前DeepMind研究员David Silver于几个月前创立，近日完成了11亿美元的融资，估值达到51亿美元，旨在开发能够超越大型语言模型的新型AI模型。根据其官网介绍，Ineffable的目标是打造一款“超级学习者”，通过强化学习技术自主发现知识和技能，而无需依赖人类数据。强化学习是一种通过试错方式让AI系统学习的技术，这正是S

Prime Intellect完成1.3亿美元A轮融资，助力企业打造专属AI代理

AI资讯

2026/07/10

Prime Intellect完成1.3亿美元A轮融资，助力企业打造专属AI代理

Prime Intellect是一家专注于为企业提供计算能力和专业软件工具，帮助其构建AI代理的初创公司，近日完成了1.3亿美元的A轮融资，估值达到10亿美元。此次大规模融资由Radical Ventures领投，参与方包括Nvidia Ventures、Intel Capital、Dell Technologies Capital、Iconiq，以及多位知名公司的创始人天使投资人，如Perpl

AI资讯

2026/07/09

Meta推出新AI模型“Muse Image”，实现高质量图像生成与直接编辑

2026年7月7日，美国Meta公司宣布在其Meta AI平台引入由Meta Superintelligence Labs开发的首个图像生成模型“Muse Image”。该模型已在Meta AI应用及网页版meta.ai上免费开放使用，用户若需生成更多图像，也可选择付费服务。 “Muse Image”是一款面向Meta AI的图像生成模型，能够通过简单的文本提示生成和编辑高质量图像。用户只需输入

AI资讯

2026/07/01

打造扑克AI的DeepMind三人组，如今为量化对冲基金创造收益

三位曾在DeepMind工作的研究人员，曾开发出击败人类的扑克AI，如今将相同技术应用于股票交易，且成效显著。他们位于布拉格的AI实验室EquiLibre Technologies，在完成一轮未公开金额的A轮融资后，估值达到5亿美元。此次融资由Creandum领投，副总裁Cameron Sellers向TechCrunch透露，这是该公司“有史以来最大的一笔单次投资”。扑克和华尔街的共同点在于

独家报道：谷歌与Thinking Machines Lab签署数十亿美元新协议，深化合作关系

AI资讯

2026/04/24

独家报道：谷歌与Thinking Machines Lab签署数十亿美元新协议，深化合作关系

前OpenAI高管Mira Murati创立的初创公司Thinking Machines Lab，已签署一项新的数十亿美元协议，扩大其对谷歌云AI基础设施的使用范围，其中包括搭载Nvidia最新GPU的系统，TechCrunch独家获悉。据知情人士透露，该协议价值数十亿美元，涵盖了基于Nvidia新款GB300芯片构建的谷歌最新AI系统的访问权限，以及支持模型训练和部署的基础设施服务。谷歌正积

AI资讯

2026/06/18

GLM-5.2：全球顶尖前端编码模型，采用IndexShare实现推测解码优化

GLM-5.2作为Z.ai最新发布的开源模型，在编码和长上下文任务中表现卓越，凭借创新的IndexShare稀疏注意力机制和百万令牌上下文窗口，成为当前最强的开源前端编码模型。

AI资讯

2026/04/29

我报道机器人多年，这款机器人与众不同

在我十多年的机器人报道生涯中，从未见过一款机器人动作如此自然。大多数机器人笨拙笨手笨脚，即使是由人远程操控也如此。在目前市场上的几十款机械臂中，没有一款能真正拧灯泡。我来到位于马萨诸塞州剑桥肯德尔广场的初创公司Eka，距离麻省理工学院步行仅几分钟，骑车稍远一些。公司的办公室位于我最喜欢的餐厅Shy Bird楼上，我经常带着自己的“钳子”——敲键盘写作——来这里工作。 Eka的办公室不大，里面摆满

AI资讯

2026/03/28

性能反转：苹果发布RubiCap图像描述框架

苹果与威斯康星大学麦迪逊分校联合推出了RubiCap AI训练框架，专注于密集图像描述，旨在让AI准确描述图像细节，如桌上的红苹果。该框架采用强化学习，借助Qwen2.5作为裁判提升训练效果，实现以更少参数获得更好表现。

AI资讯

2026/05/24

所有模型实验室现已转型为智能代理实验室

随着OpenAI即将提交IPO申请，模型实验室正逐步转向构建智能代理产品，行业格局正在发生深刻变化。