从博士生到AI行业评判者：Arena如何定义人工智能的未来

发布时间：2026/3/20

人工智能模型正迅速增多，竞争异常激烈。在众多参与者争夺市场的情况下，谁将成为最优秀的AI模型？又由谁来评判？Arena（前身为LM Arena）已成为前沿大型语言模型（LLM）的事实公共排行榜，影响着资金投入、产品发布和公关周期。短短七个月内，这家初创公司从加州大学伯克利分校的博士研究项目，成长为估值达17亿美元的独角兽。

在TechCrunch的Equity播客最新一期中，记者Rebecca Bellan采访了Arena联合创始人Anastasios Angelopoulos和Wei-Lin Chiang，探讨他们如何在背后支持者也是被评估对象的情况下，构建一个中立的基准评测体系。

完整节目内容包括：

Arena的运作机制，以及为什么其创始人认为该平台不像传统静态基准那样容易被操控。
“结构性中立”概念的含义，以及从OpenAI、谷歌和Anthropic等公司融资是否存在利益冲突。
Arena如何超越聊天机器人，推出面向代理、编程和实际任务的新企业产品。
为什么Claude目前在法律和医疗专业排行榜上领先。
Arena对大型语言模型之后发展的押注，以及为什么代理（agents）将成为排行榜的新焦点。

欢迎订阅Equity播客，收听更多关于科技与投资的深度分析。

标签

#人工智能 #大型语言模型 #技术评测 #初创企业 #科技投资

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

东京大学学生生成式AI使用率达93.4%，匿名问卷应用用户突破500人

2026/07/10

东京大学学生生成式AI使用率达93.4%，匿名问卷应用用户突破500人

日本株式会社カルペ・ディエム发布了其运营的面向日本东京大学在校生的匿名问卷应用“东京大学生问卷”的最新调查结果。此次公布了从累计收集的问卷中提炼出的五组数据，展现了东京大学学生的真实面貌。同时，应用注册用户数已突破500人。关于生成式AI的使用情况，93.4%的学生表示有使用经历。其中，65.3%为日常使用，15.9%每周使用数次，11.4%偶尔使用。具体工具方面，使用率最高的是Gemini（

Meta新款AI芯片将于九月开始量产

2026/07/11

Meta新款AI芯片将于九月开始量产

为了应对前所未有的元件短缺并降低GPU成本，Meta计划于今年九月开始生产其最新版本的专用AI芯片。据路透社援引内部备忘录报道，至少有一款芯片在约六周内顺利通过了测试阶段。Meta与博通（Broadcom）合作设计芯片，但将由台湾半导体制造公司（TSMC）负责制造。此外，Meta还从三星采购内存，从闪迪（Sandisk）采购存储设备，并从住友电工采购光纤设备。今年三月，Meta详细介绍了其Met

TOPPAN等三家公司推动日本政府共通数据的AI准备化

2026/07/14

TOPPAN等三家公司推动日本政府共通数据的AI准备化

TOPPAN、NTT数据与Fides Policy & Strategy Consulting合作，推进日本数字厅“政府AI源内”项目，整备并AI准备化政府共通及领域特化数据集，制定AI数据集标准。