AI资讯微软推出新工具,开发者可通过文本描述快速生成AI行为测试
AI研究人员和实验室在评估AI模型的安全性、合规性、谄媚行为以及对齐性等方面取得了显著进展。然而,企业和开发者面临一个新的具体需求:确保他们的AI系统在特定产品或服务中按预期行为运行。 为简化这一测试流程,微软于周二发布了名为ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing,自适应规范驱动的评估与回归
按时间排序浏览最新内容。
AI资讯AI研究人员和实验室在评估AI模型的安全性、合规性、谄媚行为以及对齐性等方面取得了显著进展。然而,企业和开发者面临一个新的具体需求:确保他们的AI系统在特定产品或服务中按预期行为运行。 为简化这一测试流程,微软于周二发布了名为ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing,自适应规范驱动的评估与回归
AI资讯ALLIN宣布正式启动以生成AI为核心的企业视频制作工作室,结合电影导演与HR专家打造创新制作生态。
AI资讯考虑一下长期新冠的流行率:一项研究显示它影响了英国3.3%的人口,而其他研究却显示南美洲高达51%,埃及甚至达到86%。治疗方法方面,《英国医学杂志》(BMJ)系统评价中仅有认知行为疗法和体育锻炼被认为有中等证据支持。然而,如果你参加了去年底在波士顿举行的第三届国际长期新冠大会,就会发现与BMJ的观点截然不同——大会上的顶尖科学权威们不仅提到锻炼,反而警告不要锻炼,认知行为疗法也仅被提及一次,并被
AI资讯上周,我们在Claude Code中发布了动态工作流。现在,Claude可以即时编写自己的专用工具,针对当前任务量身定制。 虽然默认的Claude Code工具主要面向编码任务,但它同样适用于许多其他类型的工作,因为很多任务本质上类似于编码。然而,对于某些特定任务类别,比如研究、安全分析、代理团队或代码审查,我们需要在Claude Code基础上构建定制工具以达到最佳性能。 动态工作流允许你基于C
AI资讯自特朗普政府计划发布人工智能(AI)监管行政命令以来,围绕该命令的讨论一直被硅谷关键人物和政府官员视为混乱不堪。一些AI企业高管私下告诉WIRED,他们不确定修订后的行政命令会有哪些具体要求,甚至不确定该命令是否最终会被签署。 5月21日,特朗普在原定签署仪式开始前数小时突然取消了该活动。他当时对记者表示,这项命令可能会抑制国内竞争力,并削弱美国在与中国的AI竞赛中所保持的优势。 被取消的行政命令
AI资讯本文回顾了微软Build大会上发布的七款全新MAI模型及其技术细节,重点介绍了MAI-Thinking-1模型的架构、性能和技术报告,同时总结了微软在本地AI、开发者工具和硬件生态方面的战略布局。
AI资讯多年来,工程师的工作时间一直是构建应用程序中最昂贵的部分。无论是传统的瀑布模型,还是后来的敏捷开发,所有的软件规划和交付流程都是围绕这一成本设计的。 我在2000年代初开始职业生涯,参与开发Visual Studio。那时软件通过CD-ROM发放,制造和发行有严格的截止时间。随着在线分发的兴起,我们开始实现持续更新。如今,我们的工作方式再次发生变化,这次的焦点是编写软件所需的时间和人员。 在Cla
AI资讯人工智能的使用成本正在迅速上升,许多公司开始限制AI的使用以控制开支。优步便是其中之一,最近该公司实施了内部使用上限,以减少其高昂的AI支出。 据彭博社报道,优步规定每位员工及其使用的智能编码工具(包括Anthropic的Claude Code和Cursor)每月的使用费用上限为1500美元。员工可以通过内部仪表盘实时监控使用情况,尽管在某些情况下,经过批准后可以超出该限额。 这一举措并不令人意外
AI资讯Opal Camera现已更名为Opal Electronics,计划将产品线从网络摄像头扩展到更广泛的消费电子设备,其中部分产品将聚焦于人工智能技术。公司希望通过注重设计与文化,打造类似索尼电子那样的多元化消费电子品牌,而不仅仅局限于技术本身。 此次转型得益于OpenAI领投的4000万美元B轮融资。虽然投资细节早在2024年已有报道,但交易于2025年第一季度正式完成。除OpenAI外,Opa
AI资讯数据存储安全公司Cyera正在敲定一轮由Evolution Equity Partners领投的融资,金额至少为3亿美元,估值达到120亿美元,据四位知情人士透露。 Calcalist最先报道了这笔融资交易,TechCrunch的消息源则补充了关于公司及其财务状况的新细节。 三位知情人士告诉TechCrunch,Cyera的年经常性收入(ARR)已超过1.5亿美元,尽管公司仍远未实现盈利。此次融资
AI资讯微软基于OpenClaw打造了一款企业级智能助手——Scout。这款AI工具在2026年初吸引了旧金山的早期用户关注,而Scout则专为办公人员设计,用户可以直接在Teams中向它发送指令,就像与一位真人同事交流一样。 Scout是微软推动的以智能代理为核心的转型战略的一部分,旨在自动化知识工作者的软件使用方式,并将AI助手融入日常办公互动中。微软Scout的企业副总裁Omar Shahine表示
AI智能体GuessGoal 是面向 2026 世界杯的 AI 足球预测与数据平台,汇集 5 大主流 AI 模型为每场比赛给出比分预测与共识分析,并提供覆盖 48 支参赛球队、上千名球员与教练的中文资料库,以及赛程、球场信息等内容。