Anthropic成立于2021年,由一群原OpenAI研究人员,包括Dario和Daniela Amodei离开后创立。他们坚信,人工智能模型变得过于强大,不能仅仅依靠竞争和速度的逻辑来开发。
自那时起,Anthropic将自身形象塑造为AI安全的倡导者。公司不仅致力于打造强大的模型,更强调模型的可控性和伦理指导原则。这也催生了“宪法式AI”的概念:通过一套由原则和规则组成的“宪法”来训练系统,而非仅仅手动纠正最危险的回应。
Christopher Olah出席梵蒂冈活动绝非偶然,也不是临时的象征性举动。这是梵蒂冈长期努力的结果,逐步将自身从技术的道德观察者转变为人工智能产业的直接对话者。
2020年,梵蒂冈生命科学院联合微软、IBM等国际组织发起了“罗马人工智能伦理倡议”,旨在为AI发展建立透明、包容和问责的伦理基础。那时,梵蒂冈主要关注生物伦理和道德问题,但随着ChatGPT的兴起、美中科技竞争加剧以及大科技公司的影响力扩大,教廷意识到这不仅是技术伦理问题,更关乎人类未来。
在此背景下,Anthropic被梵蒂冈视为重要对话伙伴。与其他以创新和增长为核心的硅谷公司不同,Anthropic将AI安全作为核心身份。
梵蒂冈特别关注AI模型的对齐问题,而Christopher Olah正是这一领域的代表人物。相比于更为公众化的Amodei兄妹,Olah更偏向理论和哲学层面,致力于研究模型可解释性,即理解复杂神经网络内部运作的努力。
Olah在个人网站上自述致力于“将神经网络转化为人类可理解的算法”,这与教皇利奥十四世通谕的核心思想高度契合——反思构建过于强大、难以理解、控制和治理的技术的风险。
据多方报道,梵蒂冈与Anthropic的联系在全球AI安全峰会期间有所加深。教廷认为Anthropic至少愿意公开承认,人工智能问题不能仅靠科技行业自行解决。
这一观点在通谕文本及发布会上均有强调。文件反复指出技术并非中立,算法不可避免地体现特定世界观。Anthropic通过宪法式AI项目,正尝试将价值观、规则和原则明确引入AI模型行为中。
梵蒂冈与Anthropic的联系,根源于共同的担忧:日益强大的系统可能最终被经济、地缘政治和竞争驱动的全球AI竞赛所塑造。

这不仅是精神层面的故事,也具有产业意义。对Anthropic而言,与梵蒂冈的关系带来巨大声誉价值。在人工智能日益成为劳动、国家安全、监控和军事力量核心议题的当下,打造“伦理AI公司”的形象极具优势。
Anthropic的聊天机器人Claude正是基于与用户建立信任的理念构建。该模型遵循伦理宪法,公司公开语言持续围绕责任和安全展开,伦理成为产品象征性基础。
通谕标题本身体现了一种张力:人类被描述为“壮丽”,同时又能创造出新的非人化形式。从这个角度看,人工智能本身并非邪恶,而是建造者的镜像。
因此,梵蒂冈反复警示数字巴比伦的风险——一个将人、关系甚至真理本身简化为数据、绩效和效率的社会。
教皇利奥十四世在文中明确指出,技术权力集中于少数跨国私营实体手中。这一批评呼应了当下关于AI治理的诸多讨论:谁控制模型?谁决定训练标准?谁拥有未来基础设施?
在通谕发布会上,Christopher Olah罕见地坦言,即使是最注重伦理的公司,也难免受经济、地缘政治和竞争激励影响,这些可能与“做正确的事”相冲突。他公开承认人工智能问题不能仅靠科技公司自我监管解决。
在AI讨论中,核弹的比喻屡次出现。不同之处在于核技术由国家控制,而AI主要由私企开发。这是通谕的核心观点之一:今天,“技术权力呈现出以私营为主的新面貌”。
这也引发了共同的担忧——无论是梵蒂冈还是AI安全领域的专家,都担心日益强大的系统可能被扭曲的人类激励所驱动。
从这个视角看,21世纪的“广岛”或许不是单一灾难事件,而是一个缓慢的社会自动化过程,人类开始将思考、选择、获取信息和相互关系的方式委托给机器。换言之,壮丽的人性可能转变为可怕的存在。


