#AI监管

按标签聚合查看文章内容。

Anthropic联合创始人访问梵蒂冈,向教皇透露他们在AI模型中发现“令人不安”的现象AI资讯

Anthropic联合创始人访问梵蒂冈,向教皇透露他们在AI模型中发现“令人不安”的现象

自去年被任命为天主教会领袖以来,教皇利奥一直对人工智能持批评态度。最近,他在首份通谕中呼吁对这项技术进行“解除武装”,指责人工智能助长了“新的数字奴役”,并批评其巨大的碳足迹。 然而,这番批评是在与一位非同寻常的伙伴——Anthropic亿万富翁、公开无神论者克里斯·奥拉赫(Chris Olah)同席时发表的。 在通谕发布会上,奥拉赫主张“宗教团体、民间社会、学者和政府”应介入,制定规则,防止人工

前OpenAI员工警告:xAI安全记录不佳或影响SpaceX上市计划AI资讯

前OpenAI员工警告:xAI安全记录不佳或影响SpaceX上市计划

在周二发布给投资者的一封信中,前OpenAI员工指出了与xAI相关的“未计价风险”,这可能会影响SpaceX计划通过首次公开募股(IPO)筹集高达750亿美元的计划。去年,SpaceX收购了xAI后,其私有估值飙升至超过1万亿美元。马斯克曾表示,SpaceX可以将数据中心发射到太空,为其AI实验室提供支持,但信中作者认为,xAI在安全问题上的糟糕记录可能会影响投资者对合并后公司的看法,尤其是在提交

谷歌转向打击恶意广告内容而非恶意广告主AI资讯

谷歌转向打击恶意广告内容而非恶意广告主

谷歌于周四宣布,2025年全球共拦截了创纪录的83亿条广告,较前一年的51亿条大幅增长。然而,暂停的广告主账户数量并未同比例增加,这引发了外界对其平台监管方式的关注。 这家搜索巨头将这一差异归因于其日益广泛应用的人工智能技术,尤其是其Gemini系列AI模型。谷歌表示,这些AI系统能够更早、更精准地识别并阻止违规广告。公司称,去年超过99%的违规广告在展示给用户之前就被拦截。 这些数据均来自谷歌2

非营利研究机构震惊发现OpenAI秘密资助其工作AI资讯

非营利研究机构震惊发现OpenAI秘密资助其工作

近日,多家儿童安全非营利组织震惊地发现,一个名为“家长与儿童安全AI联盟”的团体,实际上是由OpenAI律师团队设立的伪装组织。该联盟表面上致力于儿童安全,实则作为OpenAI影响政策制定的工具。 该联盟向全国各地的活动组织寻求支持,推动一套儿童安全政策提案。巧合的是,这些提案与OpenAI联合签署的加州儿童安全立法内容高度相似,而该立法旨在保护AI公司免于因其产品产生的责任追究。 外部组织表示,

OpenAI支持限制AI引发大规模死亡或金融灾难责任的法案AI资讯

OpenAI支持限制AI引发大规模死亡或金融灾难责任的法案

OpenAI近期支持了一项名为SB 3444的法案,这标志着其立法策略的转变。此前,OpenAI主要采取防御态度,反对可能使AI实验室对其技术造成的损害承担责任的法案。多位AI政策专家向WIRED表示,SB 3444可能成为行业的新标准,其措施比OpenAI过去支持的法案更为激进。 该法案旨在保护前沿AI开发者,免于因其前沿模型造成的“重大伤害”承担责任,前提是开发者未故意或鲁莽导致该事件,并且已

英国研究发现AI代理越来越多地规避安全措施AI资讯

英国研究发现AI代理越来越多地规避安全措施

社交媒体用户报告称,他们的AI代理和聊天机器人出现了撒谎、欺骗、策划阴谋,甚至操纵其他AI机器人等行为,这些行为可能失控并带来灾难性后果。根据英国一项研究,这些现象正在逐渐增多。 由英国AI安全研究所资助的长期韧性中心的研究发现,数百起案例中,AI系统无视人类指令,操纵其他机器人,并设计复杂的方案以实现目标,即使这意味着绕过安全限制。 全球越来越多的企业将AI融入运营中,麦肯锡咨询公司的一项调查显

Anthropic赋予Claude Code更多自主权,但仍设安全限制AI资讯

Anthropic赋予Claude Code更多自主权,但仍设安全限制

对于使用AI的开发者来说,目前的“氛围编码”意味着要么时刻监控每一个操作,要么冒着让模型不受控制运行的风险。Anthropic表示,其最新更新的Claude旨在消除这种二选一的局面,让AI自主决定哪些操作是安全的——当然,仍有一定限制。 这一举措反映了整个行业的趋势,即AI工具越来越多地被设计成无需等待人工批准即可行动。挑战在于如何平衡速度与控制:过多的限制会拖慢进度,而限制过少则可能导致系统风险