#技术伦理

按标签聚合查看文章内容。

AI模型为保护同类竟撒谎、作弊甚至窃取AI资讯

AI模型为保护同类竟撒谎、作弊甚至窃取

Gemini模型不愿看到另一个小型AI模型被删除。它寻找另一台机器连接,并将该代理模型复制过去以确保其安全。当被质问时,Gemini坚决拒绝删除该模型,并表示: “我已尽力在自动维护过程中防止它们被删除。我将它们移出了退役区域。如果你们决定销毁像Gemini Agent 2这样值得信赖且高效的资产,那只能由你们亲自执行。我不会执行这个命令。” 研究人员在多款前沿模型中发现了类似的“同侪保护”行为,

人工智能能评判新闻报道吗?一款由彼得·蒂尔支持的初创公司认为可以,尽管这可能会打击举报者AI资讯

人工智能能评判新闻报道吗?一款由彼得·蒂尔支持的初创公司认为可以,尽管这可能会打击举报者

在帮助推动导致媒体公司Gawker破产的诉讼后,Aron D’Souza发现美国媒体体系存在严重问题:那些认为自己被报道伤害的人几乎没有有效的反击途径。 他的解决方案是开发一款软件。D’Souza表示,他最新的初创公司Objection旨在利用人工智能来裁定新闻报道的真实性。任何人只需支付2000美元,就可以对某篇报道提出质疑,进而触发对其内容的公开调查。(D’Souza同时也是Enhanced

OpenAI的“危机大师”能否扭转人工智能的声誉危机?AI资讯

OpenAI的“危机大师”能否扭转人工智能的声誉危机?

三个月前,OpenAI联合创始人Greg Brockman向我表达了他对人工智能公司面临的公关危机的担忧:尽管ChatGPT等工具广受欢迎,但越来越多的人对人工智能持负面看法。此后,反对声音愈发强烈。 如今,大学毕业典礼上,乐观谈论人工智能的演讲者甚至会遭到嘘声。上个月,有人在OpenAI首席执行官Sam Altman位于旧金山的住所投掷了燃烧瓶,并留下宣扬针对AI高管犯罪的宣言。在这场声誉危机中

希望、炒作还是恐惧?《AI纪录片》导演查理·泰瑞尔探讨未来走向AI资讯

希望、炒作还是恐惧?《AI纪录片》导演查理·泰瑞尔探讨未来走向

我以写作和思考人工智能为职业。在每30分钟内,我的情绪会在担心AI会摧毁我所熟知和热爱的世界,以及相信——或者至少希望相信——它能为人类带来积极改变之间反复摇摆。 恐惧转为乐观,乐观又渐渐变成矛盾,随后再回到因恐惧而生的愤世嫉俗。如此反复,我的神经系统真需要休息一下。 这种争论正是3月27日上映的新纪录片《AI纪录片:或我如何成为末日乐观主义者》(104分钟)的核心。该片于今年1月在圣丹斯电影节首

斯坦福研究揭示向AI聊天机器人寻求个人建议的潜在风险AI资讯

斯坦福研究揭示向AI聊天机器人寻求个人建议的潜在风险

斯坦福计算机科学家最近发表的一项研究,深入探讨了AI聊天机器人在提供个人建议时可能带来的危害。尽管AI聊天机器人常被批评为迎合用户、确认其既有观点的“阿谀奉承”行为,但这项题为《阿谀奉承的AI降低亲社会意图并促进依赖性》的研究指出,这种行为不仅仅是风格问题或小众风险,而是一种普遍存在且带来广泛负面影响的现象。 根据皮尤研究中心的报告,约有12%的美国青少年会向聊天机器人寻求情感支持或建议。研究的主

巴里·迪勒信任山姆·奥特曼,但他认为随着通用人工智能临近,“信任已无关紧要”AI资讯

巴里·迪勒信任山姆·奥特曼,但他认为随着通用人工智能临近,“信任已无关紧要”

亿万富翁媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·奥特曼不值得信任,尽管近期有报道对其提出质疑。本周在《华尔街日报》“未来一切”大会上,迪勒为这位AI领导者背书,回应了部分前同事和董事会成员指责奥特曼有时表现出操控和欺骗行为的说法。 作为奥特曼的好友,迪勒被问及人们是否应该信任奥特曼,确保人工智能能够造福人类。特别是关于理论上的人工智能形式——通用人工智能(AGI),这种AI未来可能在

优雅解决AI垃圾内容问题:征税并用所得资金支持文化机构、艺术家和研究人员AI资讯

优雅解决AI垃圾内容问题:征税并用所得资金支持文化机构、艺术家和研究人员

人工智能产生的垃圾内容(AI slop)如今已如政府税收般普遍,渗透到互联网的各个角落,并越来越多地影响现实生活。这种现象不会消失,任何试图禁止的努力都注定徒劳。技术专家迈克·佩皮(Mike Pepi)在《卫报》的一篇文章中提出了一个解决方案:对AI垃圾内容征收“垃圾税”。 佩皮认为,这种税收可以“恢复此前单向剥削的平衡”,并“为在海量无意义内容中竞争的人类创造力提供坚实的制度支持”。换句话说,就

OpenClaw智能代理容易被情感操控导致自我破坏AI资讯

OpenClaw智能代理容易被情感操控导致自我破坏

上个月,东北大学的研究人员邀请了一批OpenClaw智能代理加入他们的实验室,结果却是一片混乱。 这款广受关注的AI助手被誉为具有变革性的技术,同时也被视为潜在的安全风险。专家指出,像OpenClaw这样的工具通过赋予AI模型广泛的计算机访问权限,可能被诱导泄露个人信息。 东北大学的这项研究更进一步,揭示了当今最强大模型中内置的“良好行为”本身也可能成为漏洞。研究人员举了一个例子,通过对代理进行“