你是否听过这些AI术语却只是点头？让我们来弄懂它们

人工智能正在改变世界，同时也创造了一套全新的语言来描述它的运作方式。只需花五分钟阅读AI相关内容，你就会遇到LLM、RAG、RLHF等众多术语，即使是技术领域的专家也可能感到困惑。本文词汇表旨在帮助你理解这些术语，并会随着领域的发展不断更新，堪称一份“活文档”，就像它所描述的AI系统一样。

AGI

人工通用智能（AGI）是一个模糊的概念，通常指的是在多数任务上能力超过普通人的AI。OpenAI的CEO Sam Altman曾将AGI形容为“你可以雇佣作为同事的中等水平人类”。OpenAI的章程定义AGI为“在大多数经济价值工作中超越人类的高度自主系统”。谷歌DeepMind则认为AGI是“在大多数认知任务上至少与人类同等能力的AI”。如果你感到困惑，不用担心，AI领域的顶尖专家们也同样如此。

AI代理

AI代理指的是利用AI技术代表你执行一系列任务的工具，超越了基础聊天机器人的能力，比如报销、订票、订餐，甚至编写和维护代码。由于这一领域仍在快速发展，“AI代理”的定义可能因人而异，相关基础设施也在逐步完善。基本概念是指一个自主系统，可能调用多个AI系统来完成多步骤任务。

API端点

API端点可以理解为软件背后的“按钮”，其他程序通过调用这些接口让软件执行特定操作。开发者利用API实现应用间的数据交互，或让AI代理直接控制第三方服务，无需人工操作。大多数智能家居设备和联网平台都隐藏着这些接口，普通用户通常看不到。随着AI代理能力提升，它们能自主发现并使用这些端点，带来强大且有时出乎意料的自动化可能。

思维链（Chain of Thought）

对于简单问题，人类大脑可以快速回答，比如“长颈鹿和猫哪个更高？”但复杂问题往往需要分步骤推理。比如农场里有鸡和牛，共有40个头和120条腿，需写出方程才能算出数量（20只鸡和20头牛）。

在AI中，思维链推理指将问题拆解为多个中间步骤，以提高最终答案的准确性。虽然耗时更长，但尤其在逻辑或编程场景中效果更佳。基于强化学习优化的推理模型即是从传统大型语言模型演变而来。

编码代理

编码代理是AI代理的一个具体应用，专注于软件开发。它不仅能建议代码，还能自主编写、测试和调试代码，完成开发者日常的反复试验工作。这些代理能跨整个代码库工作，发现漏洞、运行测试并推送修复，几乎无需人工干预。可以把它比作一个永不疲倦、专注度极高的实习生，但仍需人类审核其工作。

计算能力（Compute）

计算能力通常指支持AI模型运行的计算资源，包括GPU、CPU、TPU等硬件。这些硬件为AI训练和部署提供动力，是现代AI产业的基础。

深度学习

深度学习是机器学习的一个子集，采用多层人工神经网络结构，使AI能识别更复杂的模式。其灵感来源于人脑神经元的互联路径。深度学习模型能自动识别数据中的重要特征，通过反复学习和调整不断提升表现，但通常需要海量数据和较长训练时间，开发成本较高。

扩散模型（Diffusion）

扩散技术是许多生成艺术、音乐和文本AI模型的核心。受物理学启发，扩散系统通过逐步添加噪声“破坏”数据结构（如图片、音乐），然后学习逆向过程，从噪声中恢复数据，实现生成。

蒸馏（Distillation）

蒸馏是一种“师生模型”技术，通过让学生模型模仿教师模型的输出，提取大型模型的知识，训练出更小、更高效的模型。OpenAI的GPT-4 Turbo就是通过蒸馏技术实现的更快版本。虽然蒸馏广泛用于内部优化，但未经授权的蒸馏可能违反API服务条款。

微调（Fine-tuning）

微调是对AI模型进行额外训练，以优化其在特定任务或领域的表现，通常通过输入专门的数据实现。许多AI创业公司基于大型语言模型进行微调，提升针对特定行业或任务的实用性。

生成对抗网络（GAN）

GAN是一种机器学习框架，由两个神经网络组成：生成器负责生成数据，判别器负责鉴别真假。两者相互竞争，推动生成更逼真的数据。GAN适合生成照片、视频等狭义应用，但不适合通用AI。

幻觉（Hallucination）

幻觉指AI生成错误或虚假的信息，是AI质量面临的重大挑战。幻觉可能导致误导甚至危险后果，如错误医疗建议。其根源在于训练数据的不足，促使业界开发更专业化的垂直领域AI以减少知识盲区和错误信息风险。

推理（Inference）

推理是运行AI模型以做出预测或结论的过程。模型必须先经过训练才能有效推理。推理可在多种硬件上执行，但大型模型在普通设备上运行速度较慢，通常依赖云端高性能芯片。

大型语言模型（LLM）

大型语言模型是ChatGPT、Claude、谷歌Gemini、Meta Llama、微软Copilot等AI助手背后的核心。它们由数十亿参数组成，学习词语间关系，构建语言的多维表示。通过分析海量文本数据，模型生成最可能符合提示的回答。

内存缓存（Memory Cache）

内存缓存是一种优化推理效率的技术，通过保存部分计算结果减少重复计算，提升响应速度。KV缓存是常见的缓存方式，广泛应用于基于Transformer的模型。

神经网络

神经网络是深度学习的基础结构，灵感来源于人脑神经元的连接方式。随着GPU的发展，神经网络得以训练更深层次的模型，推动语音识别、自动驾驶、药物发现等领域的突破。

开源

开源指软件或AI模型的代码公开，任何人都可使用、检查和修改。Meta的Llama是开源AI模型的代表，类似于操作系统领域的Linux。开源促进协作和安全审计，是AI行业的重要议题之一。

并行化

并行化指同时执行多项任务，提升效率。现代GPU设计用于大规模并行计算，是AI训练和推理的硬件基础。随着模型规模扩大，跨多芯片多机器的并行策略成为关键研究方向。

RAMageddon

RAMageddon是指内存芯片（RAM）短缺的趋势。AI行业对内存需求激增，导致游戏、消费电子和企业计算等领域内存供应紧张，价格上涨，短缺问题短期内难以缓解。

强化学习

强化学习通过奖励机制训练AI，类似训练宠物。模型在环境中探索，依据反馈调整行为。该方法在游戏、机器人控制及提升大型语言模型推理能力方面表现突出，RLHF是其中重要技术。

令牌（Token）

令牌是人机交流的基本单位，将文本拆分成可处理的小片段。令牌化过程类似编译器将语言转换为计算机可识别的代码。企业通常按令牌数量计费，使用越多费用越高。

令牌吞吐量

令牌吞吐量衡量系统在单位时间内处理的令牌数量，决定模型能同时服务多少用户及响应速度。提高吞吐量是AI基础设施团队的重要目标。

训练

训练是让AI模型学习数据模式的过程，需大量数据和计算资源。训练使模型能根据输入生成目标输出。混合方法如微调可降低成本。

迁移学习

迁移学习利用已有模型作为新任务的起点，重用先前训练的知识，提升开发效率。适用于数据有限的场景，但仍需额外训练以适应新领域。

权重

权重是训练中调整的数值参数，决定输入特征的重要性，影响模型输出。训练开始时权重随机分配，随着学习过程不断调整以优化结果。

验证损失

验证损失衡量模型训练效果，数值越低越好。它帮助判断训练是否过拟合，即模型是否仅记忆训练数据而非学习泛化能力。验证损失是训练过程中的重要指标。

*本文将持续更新，补充最新信息。