人工智能模型正迅速增多,竞争异常激烈。在众多参与者争夺市场的情况下,谁将成为最优秀的AI模型?又由谁来评判?Arena(前身为LM Arena)已成为前沿大型语言模型(LLM)的事实公共排行榜,影响着资金投入、产品发布和公关周期。短短七个月内,这家初创公司从加州大学伯克利分校的博士研究项目,成长为估值达17亿美元的独角兽。
在TechCrunch的Equity播客最新一期中,记者Rebecca Bellan采访了Arena联合创始人Anastasios Angelopoulos和Wei-Lin Chiang,探讨他们如何在背后支持者也是被评估对象的情况下,构建一个中立的基准评测体系。

完整节目内容包括:
- Arena的运作机制,以及为什么其创始人认为该平台不像传统静态基准那样容易被操控。
- “结构性中立”概念的含义,以及从OpenAI、谷歌和Anthropic等公司融资是否存在利益冲突。
- Arena如何超越聊天机器人,推出面向代理、编程和实际任务的新企业产品。
- 为什么Claude目前在法律和医疗专业排行榜上领先。
- Arena对大型语言模型之后发展的押注,以及为什么代理(agents)将成为排行榜的新焦点。
欢迎订阅Equity播客,收听更多关于科技与投资的深度分析。


