欢迎来到CNET全新专栏系列“另类视角”,这里汇聚了来自各界专家和知名人士的见解,聚焦人工智能这一迅速演变的领域。更多AI相关内容,请访问CNET的AI地图

你当然有道德原则,但你多久会真正运用它们?

我是Meia,一名心理学研究教授,我可以告诉你,大多数不良结果并非源于缺乏道德原则,而是因为这些原则没有被激活。我是Max,一名AI研究教授,我想告诉你,作为AI研究者,你的选择至关重要,因为你正在构建未来最强大的技术:人工智能。这项技术有潜力带来前所未有的健康、繁荣、自由、尊严和赋能,也可能引发替代我们的工作、关系、决策权、权力甚至物种的竞赛。

AI社区几乎每天都面临道德抉择,议题涵盖从AI伴侣监控、黑客攻击及军事用途。许多顶尖AI公司正面临关于数据中心AI安全等方面的诉讼,其中最引人注目的是OpenAI的Sam Altman与xAI的Elon Musk之间的法庭争斗。同时,Anthropic与五角大楼的对峙也在持续升级。

因此,给所有AI研究者准备了一份实用的道德力量锻炼清单。

1. 你有道德底线吗?

是否存在某些行为让你觉得道德上完全不可接受,以至于如果你的组织采取了这些行为,你会选择辞职或采取其他代价高昂的行动,比如举报?这些就是你的道德红线。

例如,罗莎·帕克斯因反对种族隔离而被罚款和解雇;瓦西里·阿尔希波夫因否决苏联对美核打击计划而受到批评;爱德华·斯诺登因揭露大规模监控而流亡海外。许多AI研究者也因公司触碰其红线而离开,包括Daniel Kokotajlo,他辞职离开OpenAI时放弃了近200万美元的股权且未签署不诋毁协议。你的红线是什么?

2. 你是否将红线写下来并分享?

乔治·华盛顿和本杰明·富兰克林都曾为自己制定道德准则,富兰克林甚至每周自我评分。这是一种强有力的工具,能防止“温水煮青蛙”效应,保护你的红线不被逐渐侵蚀。将红线与亲友或网络分享,也能增加社会压力,促使你坚守底线。对每条红线,务必写清楚如果被突破你将采取的行动。你可以点击这里列出你的红线(仅在你允许的情况下分享)。

3. 你是否抵制道德脱节?

为了强化你的道德力量,了解并警惕道德脱节的机制非常重要。心理学家Albert Bandura总结了几种常见的道德脱节方式,帮助你在面对公司压力、社交圈影响、个人利益诱惑或自我感觉良好时,保持道德警觉。

  • 责任转移和分散:当你或他人让你相信自己不对伤害负责时,你会感觉好受些。责任可能被归咎于领导层、投资者、市场、地缘政治或历史(“这项技术不可避免”)。在大型团队中,个人责任感减弱。“我只是研究员”或“我只是履行职责”是典型借口。

  • 措辞游戏:用模糊或积极的词汇替代道德上鲜明的语言。例如,将“帮助构建可能取代工人、操纵用户、集中权力或增加存在风险的系统”说成“能力研究”、“模型改进”或“基准进展”。这种语言软化不仅改变语气,还削弱良知。

  • 选择性自我豁免:在大多数情况下保持高道德标准,但在自己受益的领域放松要求。

  • 有利比较:只与更糟糕的行为者比较,借此感觉自己道德无虞。

  • 道德辩解:为自己造成的伤害寻找高尚的理由,如“帮助民主”、“创造普遍富裕”或“确保安全参与”,却不认真质疑这些目标的可信度或是否有更少伤害的替代方案。

这些脱节机制往往相互叠加,导致严重后果。比如恩龙公司高管从小规模财务操控逐步升级到大规模欺诈,马多夫从小幅虚报收益逐渐演变成650亿美元的庞氏骗局,越南战争中士兵在“正义战争”名义下逐步参与屠杀。

AI研究者常用的心态是:“我不是有偿参与有害竞赛的人,我是负责任、现实且道德严肃的人,帮助引导不可避免的进步。”但这场替代竞赛真的不可避免吗?民调显示它极不受欢迎,这或许只是自我辩解和自我实现的预言。

4. 你是否保持情境意识?

你是否主动调查你的红线是否被突破?包括研究你所在组织行为的间接后果。汉娜·阿伦特提出“平庸之恶”概念,指出最大伤害往往不是出于恶意,而是那些服从且尽责的技术官僚未能考虑全局。

除了用措辞游戏淡化已知伤害外,还有一种强大的道德脱节方式是“故意无知”,即不去了解你所参与的伤害。无知不是借口,尤其当你本可以通过努力了解真相时。比如德国化学家布鲁诺·特施因供应毒气给奥斯维辛而被判处死刑,尽管他声称不知道用途。

请定期问自己明显的问题:你的组织有哪些红线?它是否积极反对你支持的AI安全立法?你是否查阅过AI安全指数?它的产品如何被使用?如果你在谷歌或OpenAI工作,是否浏览过针对公司涉嫌与聊天机器人相关自杀的诉讼?

现代大型语言模型让你几乎没有理由不了解这些信息,因为它们只需一个提示即可查询。例如,你可以每月尝试:

“请列出[我的公司]近年来的道德争议行为,包括a) 工具的争议性使用(如自杀、犯罪、监控或武器),b) 工具造成的伤害,c) 公司或领导层的谎言或违约,d) 公司追求利润而非真正造福人类的扭曲激励。”

这是我们2026年3月29日针对Anthropic、谷歌、OpenAI、Meta和xAI的ChatGPT回复

5. 你是否在内部发声?

如果你发现某些行为接近你的红线,请在内部提问以了解更多。虽然历史上批评组织可能招致杀身之祸,但如今在AI公司提出质疑通常不会导致解雇——如果公司无法容忍你对红线的尊重,为什么还要继续工作?多数公司都有保护举报者的政策(详见未来生命研究所第99页)。

如果你发现不可接受但暂时不想辞职,就要在内部发声:向同事和上级解释原因,积极推动变革。不要像挑战者号航天飞机的工程师那样,明知寒冷天气可能导致灾难却未能坚决发声。如果你在安全团队但不认识游说团队或决策者,努力建立联系并进行教育,避免成为旁观者。

6. 你是否在外部发声?

公开挑战自己的组织有助于推动其自愿改进,或激发外部力量施压(包括竞争对手),促使改进。这并不意味着你必须像爱德华·斯诺登那样冒流亡风险。近年来,许多AI研究者成功发表了有理有据的批评而未遭报复。如果你公开批评组织或揭露有害或非法行为,会面临什么后果?大多数美国AI公司都有举报者保护政策,请务必了解自己的权利!此外,简单搜索即可找到许多信誉良好的举报者组织,提供法律支持和经济援助。

读完这些,你如何评价自己的道德力量?你识别出多少道德脱节的表现?你对公司潜在伤害的研究有多深入?如果得分不高,请不要气馁。把这看作是第一次去健身房,发现连举50磅都困难:肌肉需要锻炼才能强壮。这六步计划能迅速增强你的道德力量,让你照镜子时感到自豪。