
美国微软公司于3月30日宣布,为其“Microsoft 365 Copilot”中的调查助手“Researcher”引入了两项新的多模型功能。这些功能不仅支持OpenAI的“GPT”模型,还结合了Anthropic公司的“Claude”模型,分别命名为“Critique”和“Council”。
“Critique”:一方撰写,一方审核
传统的调查助手通常只使用单一AI模型。而“Critique”功能则利用两个模型协同工作:一个负责调查和草稿撰写,另一个负责评估和改进内容。通过这种写作与校对的分工,旨在提升报告的整体质量。
在由学术研究者设计的深度研究基准测试“DRACO”中,“Critique”表现出色,显示了其强大的调查能力。

当用户在“Researcher”的模型选择器中选择“Auto”时,默认启用的即是“Critique”模式。

“Council”:多模型竞争评审
另一项功能“Council”则让OpenAI模型和Anthropic模型同时生成报告,由专门的评审模型进行评价。该功能会对比两份报告,列出相同点和差异,并指出各模型的独特贡献。

用户可在“Researcher”的模型选择器中选择“Model Council”来启用此功能。当然,也可以继续单独选择“GPT”或“Claude”模型。
这两项功能已于今日通过微软的“Frontier”计划向广大用户开放测试。相比传统的单模型调查助手,多模型协作预计将带来更高的准确性、深度和可信度。


