AI资讯从博士生到AI行业评判者:Arena如何定义人工智能的未来
人工智能模型正迅速增多,竞争异常激烈。在众多参与者争夺市场的情况下,谁将成为最优秀的AI模型?又由谁来评判?Arena(前身为LM Arena)已成为前沿大型语言模型(LLM)的事实公共排行榜,影响着资金投入、产品发布和公关周期。短短七个月内,这家初创公司从加州大学伯克利分校的博士研究项目,成长为估值达17亿美元的独角兽。 在TechCrunch的Equity播客最新一期中,记者Rebecca B
按标签聚合查看文章内容。
AI资讯人工智能模型正迅速增多,竞争异常激烈。在众多参与者争夺市场的情况下,谁将成为最优秀的AI模型?又由谁来评判?Arena(前身为LM Arena)已成为前沿大型语言模型(LLM)的事实公共排行榜,影响着资金投入、产品发布和公关周期。短短七个月内,这家初创公司从加州大学伯克利分校的博士研究项目,成长为估值达17亿美元的独角兽。 在TechCrunch的Equity播客最新一期中,记者Rebecca B
AI资讯每一项新技术都会创造一个新的工作环境,但人工智能将如何改变这一点尚不明确。其中一种可能性是界面完全消失。 这正是Josh Sirota的愿景。他于去年八月创立了初创公司Eragon,刚刚完成了1200万美元融资,估值达1亿美元,旨在为企业客户打造一个具备自主代理能力的AI操作系统。 Sirota提出了一个简单的论点:“软件已死。”按钮、对话框和下拉菜单将成为过去,未来的业务将通过提示(prompt
AI资讯本文分享了OpenAI研究员Aidan McLaughlin关于提升对大型语言模型(LLMs)期望值的思考,以及近期AI领域的热点动态和技术进展。
AI资讯人工智能模型迅速增多,竞争异常激烈。在众多参与者争夺市场的情况下,谁能成为最优秀的模型?又由谁来决定?Arena(前身为LM Arena)已经成为前沿大型语言模型(LLM)的事实公共排行榜,影响着资金投入、产品发布和公关周期。仅仅七个月时间,这家初创公司就从加州大学伯克利分校的博士研究项目,发展到估值达到17亿美元。 在《Equity》节目中,主持人Rebecca Bellan采访了Arena的联
AI教程探索谷歌AI Studio,这个平台免费提供谷歌最强大的AI模型和功能,适合各种用户体验。
AI资讯五角大楼与Anthropic之间的合作关系在经历了戏剧性的破裂后,似乎难以恢复。根据彭博社对五角大楼首席数字与人工智能官卡梅伦·斯坦利的采访,五角大楼正在积极开发多种大型语言模型(LLM),以替代Anthropic的人工智能技术,并计划很快将这些模型投入实际使用。 Anthropic与美国国防部签订的2亿美元合同在过去几周内因双方未能就军方对Anthropic人工智能的无限制访问达成一致而告吹。A
2026年3月12日,xAI正式推出新一代大型语言模型Grok4.20Beta,该模型在保持竞争性价格的同时,实现了极高的事实可靠性,刷新了行业记录。 根据Artificial Analysis的最新评测,Grok4.20在智能指数中的推理能力得分为48分,比上一版本提升了6分。虽然在综合基准测试中仍落后于Gemini3.1Pro Preview和GPT-5.4(两者均为57分),但其在AA全知测
AI资讯OpenAI于周一宣布收购Promptfoo,这是一家成立于2024年的AI安全初创公司,致力于保护大型语言模型(LLM)免受网络攻击。 这家前沿实验室在一篇博客文章中表示,交易完成后,Promptfoo的技术将整合进OpenAI Frontier,这是其面向企业的AI代理平台。 独立AI代理执行数字任务的发展带来了生产力提升的期待,但也为恶意行为者提供了新的机会,可能访问敏感数据或操控自动化系统
AI资讯Yann LeCun认为,大多数人类推理基于物理世界而非语言,因此构建AI世界模型是实现真正人类级智能的关键。他在接受WIRED采访时表示:“认为通过扩展大型语言模型(LLMs)的能力就能达到人类级智能完全是无稽之谈。” 这轮融资使该初创公司估值达到35亿美元,领投方包括Cathay Innovation、Greycroft、Hiro Capital、HV Capital和Bezos Expedi
AI资讯Legora是一款面向律师的人工智能平台,最新完成5.5亿美元的D轮融资后,估值达到55.5亿美元,资金将主要用于推动其在美国市场的扩展。尽管面临Harvey、微软Copilot以及通用大型语言模型(LLM)的激烈竞争,Legora依然保持强劲增长。公开上市的法律软件公司股价在Anthropic推出Claude法律插件后出现下跌,显示市场竞争日益激烈。 Legora基于大型语言模型,主要依托Cla