简要说明:我们现已开启2026年夏季AI工程师世界博览会第二轮演讲嘉宾征集,欢迎申请:https://sessionize.com/aiewf2026/

特别欢迎涉及以下新主题轨道的项目申请:自动研究(Autoresearch)、记忆(Memory)、世界模型(World Models)、Tokenmaxxing、代理商业(Agentic Commerce)以及法律、医疗、市场推广和金融领域的垂直AI。

今年1月,我们发布了“无冗余扩展”计划,尽管内容密集,反馈积极,AIE的观众数量预计将达到2025年峰值的两倍以上,每月服务超过一百万独立AI工程师。

AI工程师世界博览会现场

今年是我们首次在旧金山Moscone West举办,连续第三年规模翻倍,旨在汇聚全球AI工程师,展示年度重要研究与产品工程成果,同时促进招聘、融资和商务合作。销售情况良好,但我们每年只发起一次公开征集,目的是吸引那些平时可能不会主动提交演讲的人士。

今年我们将增加整整一天的演讲内容,除了2025年及欧洲场次涵盖的常青主题外,还新增以下重点征集方向:

  • 自动研究(Autoresearch):递归自我改进循环在训练和工具链中的应用。
  • Tokenmaxxing:作为企业领导者,如何让AI工程团队实现10倍的AI原生化和规模化,同时避免资源浪费。
  • 记忆(Memory):探讨智能体和模型如何随着用户使用不断提升性能。
  • 世界模型(World Models):解决空间智能和对抗推理的创新方法。
  • 代理商业(Agentic Commerce):智能体如何为数据、API及其他智能体付费。
  • 垂直AI:法律、医疗、市场推广和金融领域的AI应用,也欢迎政府和教育领域的投稿,尽管这些领域发展较慢。
  • 机器人技术:去年包括Physical Intelligence、Waymo、Tesla、Nvidia等展示了自动驾驶方案,今年我们将提供免费展位供优秀机器人演示(联系[email protected]安排,人体机器人需陪同)。
  • 创业者专场:新增创业战场活动,预系列A公司可向顶级风险投资人和评委团展示项目。

更多主题请参见完整申请表,不必局限于轨道,提交最佳作品即可,我们会为您安排合适的场次。

世界博览会日程安排

已在第一轮申请并获批的嘉宾将收到邮件通知,未收到也无需担心,第二轮仍会考虑您的申请。

如果您之前未注意到本次年度最大技术AI盛会的演讲征集,尤其是您认识的某位专家非常适合分享上述主题,请帮忙转发,助力我们找到更多优秀讲者。

立即申请——请尽早预订门票和行程(当周旧金山还将举办世界杯,住宿紧张),成功申请者可获得门票退款。(需要国际签证邀请函请联系[email protected])


AI Twitter 精华回顾

  • Grok 4.3发布及评测:xAI发布Grok 4.3,成本与性能显著提升,Intelligence Index得分53,较4.20版本提升4分,输入成本降低40%,输出成本降低60%。在GDPval-AA测试中提升321 Elo至1500分,显示实际任务能力增强。但准确率与非幻觉表现存在权衡,社区反应分歧。

  • DeepSeek V4 Pro与视觉空间推理:DeepSeek V4 Pro被认为是当前最具竞争力的开源编码/代理模型,支持百万级上下文,采用混合注意力设计,推理效率提升近4倍。多模态方向聚焦显式空间推理,利用视觉原语(坐标点、边界框)实现“边指边思考”,提升空间智能。

  • Codex产品快速迭代:Codex在用户体验和产品速度上领先,新增设备工具栏、聊天中的持续集成状态、迁移工具及趣味宠物系统,形成完整生态环境。

  • 代理运行时演进:Devin、Hermes、Flue等代理运行时趋同于子代理、浏览器使用、持久状态、技能和反馈循环等设计,竞争焦点从模型智商转向代理框架设计。

  • 代理基础设施研究:ReaLM-Retrieve和OCR-Memory等论文强调推理时检索的重要性,LangChain/LangGraph推动多用户和人机协作代理的生产级特性,Cloudflare推出动态工作流支持持久执行。

  • 值得关注的研究论文:递归多代理系统通过共享潜在递归计算提升准确率和效率;Meta FAIR提出自我改进预训练方法显著提升事实性和安全性;微软合成长时序计算机使用真实文件系统模拟,推动可扩展经验数据生成。


AI Reddit 精华回顾

1. /r/LocalLlama 与 /r/localLLM 亮点

  • Qwen模型进展:PFlash技术实现长上下文解码10倍加速;Qwen 3.6 27B与Gemma 4 31B在本地游戏开发竞赛中表现对比;Qwen-Scope发布,提供大规模稀疏自编码器工具,支持模型内部特征精细操控;Qwen 3.6-27B-Q6_K用于生成SVG图像;Qwen 27B被开发者用于代码重构,表现稳定但速度有待提升;Qwen 3.6 35B-A3B在资源受限环境下表现优异。

  • 硬件与基础设施:16卡Spark集群搭建,采用NVIDIA DGX Spark单元,支持高达200Gbps吞吐;AMD Halo Box展示,配备Ryzen 395处理器和128GB内存。

  • 其他前沿模型与基础设施:4月被评为本地LLM发展最活跃月份,DeepSeek发布“视觉原语思维”框架,提升空间推理能力;OpenAI关于“妖精”隐喻的训练机制引发讨论;本地LLM使用场景丰富,包括代码审查和数据过滤。

2. 非技术AI子版块亮点

  • AI模型发布与评测:GPT-5.5在多步骤网络攻防模拟中表现优异,成本低廉;OpenAI研究员称LLM已能超越人类研究者,提出研究问题;全球研究空间发布最新1000万篇论文语义地图;Claude助力SEO和内容增长,用户数激增;DeepSeek V4系列模型以高性价比引发关注;谷歌TPU 8t和8i芯片显著提升训练和推理效率;SenseNova-U1发布,支持2048x2048分辨率的多模态生成。

  • AI工具与工作流:机器人演示安全事故提醒;ICML 2026论文决策期待;OpenAI解释“妖精”现象;Claude幽默互动;AI公司服务中断现象;多款代理运行时和工具发布;AI生成图像质量波动;AGI幽默设想;AI生成图像逼真度提升。

  • 其他前沿模型与基础设施:LLM对任务理解的挑战;工程团队庆祝代理工作流稳定性;AI提示工程幽默;AGI轻松解决实际问题的调侃。


AI Discords

遗憾的是,Discord今日关闭了我们的访问权限,我们将不再以此形式运营,但新版本AINews即将发布。感谢大家的关注与支持。