微软近日为Microsoft 365 Copilot的科研工具Researcher推出了一项强大的新功能——批评(Critique),这是GPT与Claude首次在同一平台上的协作尝试。该创新突破了单一模型的局限,实现了多模型协同完成复杂学术研究和数据处理任务。

在这一工作流程中,GPT凭借其强大的文本生成能力,负责撰写初步的研究草稿。随后,Claude作为“严格的审稿人”,依据专业学术标准对内容的准确性和完整性进行深入核查。

引入“理事会”机制,通过多模型协作消除AI幻觉

除了相互审查,微软还创新性地引入了“理事会”机制。该机制允许多个模型在物理隔离的环境中独立进行研究,最终由专门的“评判模型”对各方结果进行比较和评估。

DRACO的测试数据显示,这种多智能体协作的效果远超任何单一模型。通过发挥不同算法的优势,系统能够有效过滤错误信息,大幅减少业界长期存在的“AI幻觉”问题。

从通用工具向专业代理转变,构建全新AI产业生态

业内分析人士认为,微软此举标志着AI助手从通用工具向专业化、行业导向的“数字员工”演进。GPT擅长创造与生成,Claude则注重安全与严谨,两者的互补性为企业级高可靠性应用树立了新标杆。

通过与NVIDIA和Anthropic的深度战略合作,微软正在打造庞大的AI生态系统。未来的行业竞争将不再是单一模型参数的较量,而是构建更高效、更稳定的多智能体协作生态的竞争。