为何梵蒂冈邀请Anthropic参与教皇人工智能通谕发布会

Anthropic成立于2021年，由一群原OpenAI研究人员，包括Dario和Daniela Amodei离开后创立。他们坚信，人工智能模型变得过于强大，不能仅仅依靠竞争和速度的逻辑来开发。

自那时起，Anthropic将自身形象塑造为AI安全的倡导者。公司不仅致力于打造强大的模型，更强调模型的可控性和伦理指导原则。这也催生了“宪法式AI”的概念：通过一套由原则和规则组成的“宪法”来训练系统，而非仅仅手动纠正最危险的回应。

Christopher Olah出席梵蒂冈活动绝非偶然，也不是临时的象征性举动。这是梵蒂冈长期努力的结果，逐步将自身从技术的道德观察者转变为人工智能产业的直接对话者。

2020年，梵蒂冈生命科学院联合微软、IBM等国际组织发起了“罗马人工智能伦理倡议”，旨在为AI发展建立透明、包容和问责的伦理基础。那时，梵蒂冈主要关注生物伦理和道德问题，但随着ChatGPT的兴起、美中科技竞争加剧以及大科技公司的影响力扩大，教廷意识到这不仅是技术伦理问题，更关乎人类未来。

在此背景下，Anthropic被梵蒂冈视为重要对话伙伴。与其他以创新和增长为核心的硅谷公司不同，Anthropic将AI安全作为核心身份。

梵蒂冈特别关注AI模型的对齐问题，而Christopher Olah正是这一领域的代表人物。相比于更为公众化的Amodei兄妹，Olah更偏向理论和哲学层面，致力于研究模型可解释性，即理解复杂神经网络内部运作的努力。

Olah在个人网站上自述致力于“将神经网络转化为人类可理解的算法”，这与教皇利奥十四世通谕的核心思想高度契合——反思构建过于强大、难以理解、控制和治理的技术的风险。

据多方报道，梵蒂冈与Anthropic的联系在全球AI安全峰会期间有所加深。教廷认为Anthropic至少愿意公开承认，人工智能问题不能仅靠科技行业自行解决。

这一观点在通谕文本及发布会上均有强调。文件反复指出技术并非中立，算法不可避免地体现特定世界观。Anthropic通过宪法式AI项目，正尝试将价值观、规则和原则明确引入AI模型行为中。

梵蒂冈与Anthropic的联系，根源于共同的担忧：日益强大的系统可能最终被经济、地缘政治和竞争驱动的全球AI竞赛所塑造。

这不仅是精神层面的故事，也具有产业意义。对Anthropic而言，与梵蒂冈的关系带来巨大声誉价值。在人工智能日益成为劳动、国家安全、监控和军事力量核心议题的当下，打造“伦理AI公司”的形象极具优势。

Anthropic的聊天机器人Claude正是基于与用户建立信任的理念构建。该模型遵循伦理宪法，公司公开语言持续围绕责任和安全展开，伦理成为产品象征性基础。

通谕标题本身体现了一种张力：人类被描述为“壮丽”，同时又能创造出新的非人化形式。从这个角度看，人工智能本身并非邪恶，而是建造者的镜像。

因此，梵蒂冈反复警示数字巴比伦的风险——一个将人、关系甚至真理本身简化为数据、绩效和效率的社会。

教皇利奥十四世在文中明确指出，技术权力集中于少数跨国私营实体手中。这一批评呼应了当下关于AI治理的诸多讨论：谁控制模型？谁决定训练标准？谁拥有未来基础设施？

在通谕发布会上，Christopher Olah罕见地坦言，即使是最注重伦理的公司，也难免受经济、地缘政治和竞争激励影响，这些可能与“做正确的事”相冲突。他公开承认人工智能问题不能仅靠科技公司自我监管解决。

在AI讨论中，核弹的比喻屡次出现。不同之处在于核技术由国家控制，而AI主要由私企开发。这是通谕的核心观点之一：今天，“技术权力呈现出以私营为主的新面貌”。

这也引发了共同的担忧——无论是梵蒂冈还是AI安全领域的专家，都担心日益强大的系统可能被扭曲的人类激励所驱动。

从这个视角看，21世纪的“广岛”或许不是单一灾难事件，而是一个缓慢的社会自动化过程，人类开始将思考、选择、获取信息和相互关系的方式委托给机器。换言之，壮丽的人性可能转变为可怕的存在。

评论