你听过这些AI术语却只点头？来，这里帮你理清楚

人工智能正在改变世界，同时也创造了一套全新的语言来描述它的工作原理。只需花五分钟阅读AI相关内容，你就会遇到LLM、RAG、RLHF等一系列术语，即使是技术领域的资深人士也可能感到困惑。本文词汇表旨在帮助你理解这些术语，并会随着领域的发展不断更新，堪称一份“活文档”，就像它所描述的AI系统一样。

AGI

人工通用智能（AGI）是一个模糊的概念，通常指的是在多数任务上能力超过普通人的AI。OpenAI CEO Sam Altman曾将AGI形容为“你可以雇佣为同事的普通人类”。OpenAI的章程定义AGI为“在大多数经济价值工作中表现优于人类的高度自主系统”。Google DeepMind则认为AGI是“在大多数认知任务上至少与人类同等能力的AI”。如果你感到困惑，不用担心，AI领域的专家们也一样。

AI代理

AI代理指的是利用AI技术代表用户完成一系列任务的工具，超越了基础聊天机器人的能力，比如报销、订票、订餐甚至编写和维护代码。由于这一领域仍在快速发展，“AI代理”的定义可能因人而异，相关基础设施也在逐步完善。基本概念是指一个自主系统，可能调用多个AI系统来完成多步骤任务。

API端点

API端点可以理解为软件背后的“按钮”，其他程序可以通过它们触发软件执行操作。开发者利用这些接口构建集成，例如让一个应用从另一个应用获取数据，或让AI代理无需人工操作即可直接控制第三方服务。大多数智能家居设备和连接平台都隐藏着这些端点，普通用户通常看不到。随着AI代理能力提升，它们能自主发现并使用这些端点，带来强大且有时出乎意料的自动化可能。

思维链（Chain of Thought）

人类面对简单问题时往往不假思索就能回答，比如“长颈鹿和猫哪个更高？”但有些问题需要中间步骤，比如农场里鸡和牛共有40个头和120条腿，需写出方程才能算出数量。在AI中，思维链推理指将问题拆解为更小的步骤，以提升最终答案的准确性，尤其适用于逻辑或编程场景。该方法基于传统大语言模型，通过强化学习优化思维链能力。

编码代理

编码代理是AI代理的一个特定应用，专注于软件开发。它不仅能建议代码，还能自主编写、测试和调试代码，完成开发者日常的反复试验工作。这些代理能跨整个代码库工作，发现漏洞、运行测试并推送修复，几乎无需人工干预。可以把它看作一个永不疲倦、专注度极高的实习生，但仍需人类审核其工作。

计算力（Compute）

计算力通常指支持AI模型运行的关键计算资源，包括GPU、CPU、TPU等硬件，是现代AI产业的基础。它为训练和部署强大模型提供动力，是AI发展的核心要素。

深度学习

深度学习是机器学习的一个子集，采用多层人工神经网络结构，使AI能比传统线性模型或决策树更复杂地关联数据。其灵感来自人脑神经元的互联路径。深度学习模型能自动识别数据中的重要特征，通过反复学习和调整来提升表现，但通常需要海量数据和更长训练时间，开发成本较高。

扩散模型（Diffusion）

扩散技术是许多生成艺术、音乐和文本AI模型的核心。受物理学启发，扩散系统通过逐步向数据（如图片、音乐）添加噪声“破坏”其结构，然后学习逆过程从噪声中恢复数据，实现生成。

蒸馏（Distillation）

蒸馏是一种“师生模型”技术，通过让学生模型学习教师模型的输出，提取大型模型的知识，训练出更小、更高效的模型。OpenAI的GPT-4 Turbo即可能采用了此技术。虽然各AI公司内部普遍使用蒸馏，但未经授权的蒸馏可能违反服务条款。

微调（Fine-tuning）

微调指在已有模型基础上，使用特定领域或任务的数据进行进一步训练，以提升模型在特定应用上的表现。许多AI初创企业以大语言模型为基础，通过微调增强针对目标行业的实用性。

生成对抗网络（GAN）

GAN是一种机器学习框架，由生成器和判别器两个神经网络组成，生成器试图制造逼真数据以欺骗判别器，判别器则努力识别真假。两者相互竞争，推动生成结果更真实。GAN适合生成逼真图像或视频，但不适合通用AI。

幻觉（Hallucination）

幻觉指AI模型生成错误或虚假的信息，是AI质量的重大问题。幻觉可能导致误导性输出，甚至带来实际风险，如错误医疗建议。其根源通常是训练数据的缺失，推动了专门领域AI模型的发展，以减少知识盲区和虚假信息。

推理（Inference）

推理是运行AI模型进行预测或结论推断的过程。模型必须先经过训练才能有效推理。推理可在多种硬件上执行，但大型模型在低性能设备上运行缓慢。

大型语言模型（LLM）

大型语言模型是诸如ChatGPT、Claude、Google Gemini、Meta Llama、微软Copilot和Mistral Le Chat等AI助手背后的核心技术。它们由数十亿参数组成，学习词语间关系，构建语言的多维表示。模型通过分析海量文本数据，生成最符合提示的语言模式。

内存缓存（Memory Cache）

内存缓存是一种优化推理效率的技术，通过保存部分计算结果减少重复计算，提升响应速度。KV缓存是常见的缓存类型，广泛应用于基于Transformer的模型。

神经网络

神经网络是深度学习的基础结构，灵感来源于人脑神经元的连接方式。随着GPU的发展，神经网络得以训练更深层次的模型，推动了语音识别、自动驾驶和药物发现等领域的突破。

开源

开源指软件或AI模型的代码公开，任何人都可使用、检查或修改。Meta的Llama模型是AI领域开源的代表。开源促进全球研究者和开发者协作，加速进步并支持独立安全审计。与之相对的是闭源，如OpenAI的GPT模型，代码不可见。

并行化

并行化指同时执行多项任务，类似多个员工同时处理项目不同部分。AI训练和推理依赖并行化，现代GPU设计用于成千上万的并行计算，是AI硬件的核心。随着模型复杂度提升，跨多芯片和多机器的并行化能力成为关键。

RAMageddon

RAMageddon是指内存芯片（RAM）日益短缺的现象。AI行业对内存需求激增，导致游戏、消费电子和企业计算等领域内存供应紧张，价格上涨，影响产品价格和出货量。短缺预计短期内难以缓解。

递归自我改进

递归自我改进指AI模型自主改进自身的能力，可能带来能力和自主性的快速提升，有时被视为奇点时刻。虽然存在末日论调，许多AI初创企业将其视为研究的新前沿，致力于构建能设计自身后继者的模型。

强化学习

强化学习是一种训练方法，AI通过尝试和获得奖励信号学习行为，类似训练宠物。与监督学习不同，强化学习允许模型探索环境并根据反馈调整策略，广泛应用于游戏、机器人控制及提升大语言模型的推理能力。RLHF（基于人类反馈的强化学习）是当前主流实验室微调模型的核心技术。

令牌（Token）

令牌是人机交流的基本单位，将文本拆分成可被语言模型处理的片段，类似编译器将语言转为机器码。令牌数量也是AI使用成本的计费依据。

令牌吞吐量

令牌吞吐量衡量系统在单位时间内处理的令牌数量，决定了模型能同时服务多少用户及响应速度。提高吞吐量是AI基础设施团队的重要目标。

训练

训练是机器学习AI开发的过程，通过输入大量数据让模型学习模式，生成有用输出。训练成本高昂，数据需求不断增加，混合方法如基于规则的微调可降低成本。

迁移学习

迁移学习利用已有模型作为新任务的起点，重用之前训练的知识，提升开发效率，尤其在新任务数据有限时有用，但通常仍需额外训练以适应新领域。

验证损失

验证损失是衡量模型训练效果的指标，数值越低越好。它帮助研究者判断何时停止训练、调整参数或发现过拟合问题，确保模型真正学会泛化能力。

权重

权重是训练中决定输入特征重要性的数值参数，通过调整权重，模型逐步优化输出。例如预测房价模型中，卧室数量、车库等特征的权重反映其对价格的影响。

*本文将持续更新，补充最新信息。