GitHub Copilot

日本国家GitHub于3月25日宣布,将更新GitHub Copilot的交互数据使用政策。从4月24日起,Copilot Free、Copilot Pro、Copilot Pro+等计划中的用户作业数据将被收集,用于AI模型的训练。这些数据包括用户的输入、输出以及代码片段等。

GitHub Copilot是一款面向集成开发环境(IDE)的AI助手,旨在辅助用户进行编码等工作。

此前,AI训练数据仅限于公开数据和手工制作的代码样本。然而,在引入微软员工与Copilot的交互数据后,模型在多种编程语言上的表现得到了提升。基于此成果,GitHub决定利用更多普通用户的实际数据,以改进模型,支持更广泛的使用场景。

被收集的数据包括用户确认或修改的输出内容、发送给GitHub Copilot的输入信息,以及光标周围的代码上下文等。值得注意的是,Copilot Business和Enterprise计划用户的数据不会被用于训练。

如果用户希望阻止数据被使用,可以通过设置中的“隐私”选项进行选择退出。GitHub呼吁用户协助改进模型,提升其预防错误的能力等性能。