模型分类

🤖 OpenAI 系列

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
GPT-5.4 🔥gpt-5.41M原生计算机操控,GDPval 83%,错误率降低 33%复杂智能体、专业工作流
GPT-5.4 Pro 🔥gpt-5.4-pro1M最强推理性能,适合顶级任务顶级推理、科研
GPT-5.2gpt-5.2400KGDPval 70.9% 超越专业人士编程规划、结构化任务
GPT-5.3 Instantgpt-5.3-chat-latest400K快速响应版本,保持顶级推理快速写作、信息检索
GPT-5.1gpt-5.1128K智能与速度平衡,SWE-bench 76.3%,24h 缓存综合应用、编程
GPT-5.3 Codex 🔥gpt-5.3-codex128KSWE-Bench Pro SOTA,比 5.2 Codex 快 25%,首个参与自身创建的模型复杂编程、智能体任务
GPT-5.3 Codex Spark 🔥gpt-5.3-codex-spark128K轻量实时编码版本,快速响应日常编程、实时编码

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
GPT-5 ⭐gpt-5128K旗舰稳定版,超强推理能力顶级推理、复杂任务
GPT-5 Minigpt-5-mini128KGPT-5 轻量版,性能优异平衡性能与成本
GPT-5 Nanogpt-5-nano128KGPT-5 超轻量版大批量处理
o3 ⭐o3200K推理模型,已大幅降价,性价比极高复杂推理、数学、编程
o4-minio4-mini200K轻量级推理模型编程任务首选
GPT-4.1 ⭐gpt-4.1128K速度快,主力模型之一综合应用
GPT-4.1 Minigpt-4.1-mini128K更便宜的轻量版本成本敏感场景
GPT-4ogpt-4o128K综合能力平衡,多模态支持通用场景
GPT-4o Minigpt-4o-mini128K轻量快速版本快速响应

GPT-5 系列使用注意事项:

  1. 温度参数 temperature 必须设置为 1(只支持 1)
  2. 使用 max_completion_tokens 替代 max_tokens
  3. 不要传递 top_p 参数
图像和视频生成模型已移至专属页面,请访问 图像与视频生成模型 查看完整列表和定价。

🎭 Claude 系列 (Anthropic)

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
Claude Opus 4.6 🔥claude-opus-4-61M (Beta)Terminal-Bench 2.0 登顶,智能体团队协作,128K 输出顶级编程、复杂智能体
Claude Opus 4.6 Thinking 🔥claude-opus-4-6-thinking1M (Beta)自适应思维链,深度推理增强顶级推理任务
Claude Sonnet 4.6 🔥claude-sonnet-4-61M (Beta)全面升级,性能媲美 Opus 4.5,性价比极高编程首选、智能体开发
Claude Sonnet 4.6 Thinking 🔥claude-sonnet-4-6-thinking1M (Beta)思维链模式,深度推理复杂编程推理任务

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
Claude Opus 4.5 ⭐claude-opus-4-5-20251101200KSWE-bench 80.9%,价格降至前代 1/3复杂编程、顶级推理
Claude Sonnet 4.5 ⭐claude-sonnet-4-5-20250929200K世界级编码模型,SWE-bench 77.2%代码生成、智能体开发
Claude Sonnet 4.5 Thinkingclaude-sonnet-4-5-20250929-thinking200K思维链模式,深度推理复杂编程推理任务
Claude Haiku 4.5 ⭐claude-haiku-4-5-20251001200K高性价比编码模型,SWE-bench 73.3%,速度 2 倍实时聊天、结对编程
Claude 4 Sonnetclaude-sonnet-4-20250514200K稳定版本,编程首选代码生成、分析
Claude Opus 4.1claude-opus-4-1-20250805200K迭代升级版,编程优化高要求编程任务
最新推荐:Claude Opus 4.6 以 Terminal-Bench 2.0 登顶,支持 1M 上下文和智能体团队协作。Sonnet 4.6 性能媲美 Opus 4.5,已成为 claude.ai 默认模型,性价比极高。稳定首选:Opus 4.5 和 Sonnet 4.5 经过充分验证,适合生产环境。Haiku 4.5 速度快 2 倍,性价比高。

🌟 Google Gemini 系列

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
Gemini 3.1 Pro Preview 🔥gemini-3.1-pro-preview1MARC-AGI-2 77.1%(3 Pro 的 2 倍+),最强推理模型复杂推理、多模态分析
Gemini 3 Flash Preview 🔥gemini-3-flash-preview1MSWE-bench 78% 超越 3 Pro,速度快 3 倍,价格仅 1/4编程首选、性价比之王
Gemini 3 Flash Thinking 🔥gemini-3-flash-preview-thinking1M强制推理模式,显示完整思考过程复杂编程、深度推理
Gemini 3 Flash NoThinking 🔥gemini-3-flash-preview-nothinking1M快速响应模式,最低延迟简单任务、实时应用
Gemini 3.1 Flash Lite Preview 🔥gemini-3.1-flash-lite-preview1M速度快 2.5 倍,超越 GPT-5 Mini 和 Haiku 4.5,超低价高并发、大批量、低成本
注意:Gemini 3 Pro Preview 已于 2026 年 3 月 9 日停止服务,请迁移至 Gemini 3.1 Pro Preview。

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
Gemini 2.5 Pro ⭐gemini-2.5-pro2M正式版,编程优势,多模态能力强长文本、编程、多模态
Gemini 2.5 Flash ⭐gemini-2.5-flash1M速度快,成本低,正式版快速响应场景
Gemini 2.5 Flash Litegemini-2.5-flash-lite1M超轻量版本,更快更便宜大批量简单任务
最新推荐:Gemini 3.1 Pro Preview 推理能力翻倍(ARC-AGI-2 77.1%),是谷歌最先进推理模型。Gemini 3 Flash Preview 以 SWE-bench 78% 继续领跑编程性价比。Gemini 3.1 Flash Lite Preview 是最便宜的前沿模型,适合高并发场景。稳定首选:Gemini 2.5 Pro(2M 超长上下文)和 Gemini 2.5 Flash 已正式发布,适合生产环境。

🚀 xAI Grok 系列

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
Grok 4 🔥grok-4标准最新官方版本综合任务
Grok 4 All 🔥grok-4-all标准原生联网,无需工具调用需要实时信息场景
Grok 4 Fast Reasoning 🔥grok-4-fast-reasoning200K推理模式,显示思考过程,降价 93%+复杂推理任务
Grok 4 Fast Non-Reasoninggrok-4-fast-non-reasoning200K非推理模式,快速响应大上下文场景
Grok Code Fast 1 ⭐grok-code-fast-1256KSWE-bench 70.8%,高速生成代码生成、智能体编程

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
Grok 3 ⭐grok-3标准官方稳定版本日常使用
Grok 3 Allgrok-3-all标准原生联网增强版新闻资讯、市场分析
Grok 3 Minigrok-3-mini标准带推理能力的小模型轻量任务

Grok Fast 系列价格优势:

  • 相比 Grok-4 系列降价 93%+
  • 输入:$0.20/1M tokens,输出:$0.50/1M tokens
  • 业界领先的性价比,适合超长上下文场景

🔍 DeepSeek 系列

🆕 最新模型

模型名称模型ID上下文长度特点推荐场景
DeepSeek V3.2 🔥deepseek-v3.2128K性能比肩 GPT-5,工具调用融入推理,IMO 金牌复杂推理、编程、智能体
DeepSeek V3.2 Speciale 🔥deepseek-v3.2-speciale128K高算力版本,超越 GPT-5,推理媲美 Gemini 3 Pro顶级推理任务

✅ 稳定/经典系列

模型名称模型ID上下文长度特点推荐场景
DeepSeek V3.1 ⭐deepseek-v3-1-250821128K混合推理模式,Think/Non-Think 双模式智能推理、编程
DeepSeek R1deepseek-r164K推理模型数学、推理
DeepSeek V3deepseek-v3128K综合能力强通用场景

🐘 国产模型系列

智谱 AI (GLM)

🆕 最新:GLM-5 | ✅ 稳定/经典:GLM-4.6、GLM-4.5

模型名称模型ID上下文长度特点推荐场景
GLM-5 🔥glm-5200K744B 参数(40B 激活),编程对齐 Claude Opus 4.5,开源复杂编程、系统工程、智能体
GLM-4.6 ⭐glm-4.6200K代码与推理增强版,稳定可靠编程、推理、智能体
GLM-4.5glm-4.5128K标准版本,综合能力强通用场景
GLM-4.5 Airglm-4.5-air128K轻量版本,速度快快速响应

GLM-5 特性:

  • 744B 参数(40B 激活),预训练数据 28.5T
  • 编程能力对齐 Claude Opus 4.5,超越 Gemini 3 Pro
  • 全新 Slime 框架,支持长时序智能体强化学习
  • 开源模型中编程能力最强,性价比极高

阿里通义千问 (Qwen)

🆕 最新:Qwen 3.5-Plus | ✅ 稳定/经典:Qwen Max、Plus、Turbo

模型名称模型ID上下文长度特点推荐场景
Qwen 3.5-Plus 🔥qwen3.5-plus1M397B(17B 激活),支持 201 种语言,自称超越 GPT-5.2智能体、多语言、长文本
Qwen Max ⭐qwen-max32K最强稳定版本综合任务
Qwen Plusqwen-plus32K增强版本性价比场景
Qwen Turboqwen-turbo32K快速版本低延迟场景

Moonshot Kimi 系列

🆕 最新:Kimi K2.5 | ✅ 稳定/经典:Kimi K2

模型名称模型ID上下文长度特点推荐场景
Kimi K2.5 🔥kimi-k2.5200K1T 参数(32B 激活),原生多模态,Agent Swarm 100 智能体协作多模态、智能体
Kimi K2 正式版 ⭐kimi-k2-250711200K火山引擎官方合作,稳定性强生产环境

🌐 MiniMax 系列

🆕 最新:MiniMax M2.5

模型名称模型ID上下文长度特点推荐场景
MiniMax M2.5 🔥minimax-m2.5标准230B(10B 激活),SWE-bench 80.2%,$1/小时极致性价比编程、智能体、办公自动化

MiniMax M2.5 特性:

  • SWE-bench 80.2%,编程能力顶级,速度比 M2.1 快 37%
  • 仅 $1/小时持续运行,业界最低成本前沿模型
  • 支持 10+ 编程语言,20 万+ 真实环境训练
  • 模型权重已完全开源