人工智能正在改变世界,同时也创造了一套全新的语言来描述它的运作方式。只需花五分钟阅读AI相关内容,你就会遇到LLM、RAG、RLHF等众多术语,即使是技术领域的专家也可能感到困惑。本文词汇表旨在帮助你理解这些术语,并会随着领域的发展不断更新,堪称一份“活文档”,就像它所描述的AI系统一样。
AGI
人工通用智能(AGI)是一个模糊的概念,通常指的是在多数任务上能力超过普通人的AI。OpenAI的CEO Sam Altman曾将AGI形容为“你可以雇佣作为同事的中等水平人类”。OpenAI的章程定义AGI为“在大多数经济价值工作中超越人类的高度自主系统”。谷歌DeepMind则认为AGI是“在大多数认知任务上至少与人类同等能力的AI”。如果你感到困惑,不用担心,AI领域的顶尖专家们也同样如此。
AI代理
AI代理指的是利用AI技术代表你执行一系列任务的工具,超越了基础聊天机器人的能力,比如报销、订票、订餐,甚至编写和维护代码。由于这一领域仍在快速发展,“AI代理”的定义可能因人而异,相关基础设施也在逐步完善。基本概念是指一个自主系统,可能调用多个AI系统来完成多步骤任务。
API端点
API端点可以理解为软件背后的“按钮”,其他程序通过调用这些接口让软件执行特定操作。开发者利用API实现应用间的数据交互,或让AI代理直接控制第三方服务,无需人工操作。大多数智能家居设备和联网平台都隐藏着这些接口,普通用户通常看不到。随着AI代理能力提升,它们能自主发现并使用这些端点,带来强大且有时出乎意料的自动化可能。
思维链(Chain of Thought)
对于简单问题,人类大脑可以快速回答,比如“长颈鹿和猫哪个更高?”但复杂问题往往需要分步骤推理。比如农场里有鸡和牛,共有40个头和120条腿,需写出方程才能算出数量(20只鸡和20头牛)。
在AI中,思维链推理指将问题拆解为多个中间步骤,以提高最终答案的准确性。虽然耗时更长,但尤其在逻辑或编程场景中效果更佳。基于强化学习优化的推理模型即是从传统大型语言模型演变而来。
编码代理
编码代理是AI代理的一个具体应用,专注于软件开发。它不仅能建议代码,还能自主编写、测试和调试代码,完成开发者日常的反复试验工作。这些代理能跨整个代码库工作,发现漏洞、运行测试并推送修复,几乎无需人工干预。可以把它比作一个永不疲倦、专注度极高的实习生,但仍需人类审核其工作。
计算能力(Compute)
计算能力通常指支持AI模型运行的计算资源,包括GPU、CPU、TPU等硬件。这些硬件为AI训练和部署提供动力,是现代AI产业的基础。
深度学习
深度学习是机器学习的一个子集,采用多层人工神经网络结构,使AI能识别更复杂的模式。其灵感来源于人脑神经元的互联路径。深度学习模型能自动识别数据中的重要特征,通过反复学习和调整不断提升表现,但通常需要海量数据和较长训练时间,开发成本较高。
扩散模型(Diffusion)
扩散技术是许多生成艺术、音乐和文本AI模型的核心。受物理学启发,扩散系统通过逐步添加噪声“破坏”数据结构(如图片、音乐),然后学习逆向过程,从噪声中恢复数据,实现生成。
蒸馏(Distillation)
蒸馏是一种“师生模型”技术,通过让学生模型模仿教师模型的输出,提取大型模型的知识,训练出更小、更高效的模型。OpenAI的GPT-4 Turbo就是通过蒸馏技术实现的更快版本。虽然蒸馏广泛用于内部优化,但未经授权的蒸馏可能违反API服务条款。
微调(Fine-tuning)
微调是对AI模型进行额外训练,以优化其在特定任务或领域的表现,通常通过输入专门的数据实现。许多AI创业公司基于大型语言模型进行微调,提升针对特定行业或任务的实用性。
生成对抗网络(GAN)
GAN是一种机器学习框架,由两个神经网络组成:生成器负责生成数据,判别器负责鉴别真假。两者相互竞争,推动生成更逼真的数据。GAN适合生成照片、视频等狭义应用,但不适合通用AI。
幻觉(Hallucination)
幻觉指AI生成错误或虚假的信息,是AI质量面临的重大挑战。幻觉可能导致误导甚至危险后果,如错误医疗建议。其根源在于训练数据的不足,促使业界开发更专业化的垂直领域AI以减少知识盲区和错误信息风险。
推理(Inference)
推理是运行AI模型以做出预测或结论的过程。模型必须先经过训练才能有效推理。推理可在多种硬件上执行,但大型模型在普通设备上运行速度较慢,通常依赖云端高性能芯片。

大型语言模型(LLM)
大型语言模型是ChatGPT、Claude、谷歌Gemini、Meta Llama、微软Copilot等AI助手背后的核心。它们由数十亿参数组成,学习词语间关系,构建语言的多维表示。通过分析海量文本数据,模型生成最可能符合提示的回答。
内存缓存(Memory Cache)
内存缓存是一种优化推理效率的技术,通过保存部分计算结果减少重复计算,提升响应速度。KV缓存是常见的缓存方式,广泛应用于基于Transformer的模型。
神经网络
神经网络是深度学习的基础结构,灵感来源于人脑神经元的连接方式。随着GPU的发展,神经网络得以训练更深层次的模型,推动语音识别、自动驾驶、药物发现等领域的突破。
开源
开源指软件或AI模型的代码公开,任何人都可使用、检查和修改。Meta的Llama是开源AI模型的代表,类似于操作系统领域的Linux。开源促进协作和安全审计,是AI行业的重要议题之一。
并行化
并行化指同时执行多项任务,提升效率。现代GPU设计用于大规模并行计算,是AI训练和推理的硬件基础。随着模型规模扩大,跨多芯片多机器的并行策略成为关键研究方向。
RAMageddon
RAMageddon是指内存芯片(RAM)短缺的趋势。AI行业对内存需求激增,导致游戏、消费电子和企业计算等领域内存供应紧张,价格上涨,短缺问题短期内难以缓解。
强化学习
强化学习通过奖励机制训练AI,类似训练宠物。模型在环境中探索,依据反馈调整行为。该方法在游戏、机器人控制及提升大型语言模型推理能力方面表现突出,RLHF是其中重要技术。
令牌(Token)
令牌是人机交流的基本单位,将文本拆分成可处理的小片段。令牌化过程类似编译器将语言转换为计算机可识别的代码。企业通常按令牌数量计费,使用越多费用越高。
令牌吞吐量
令牌吞吐量衡量系统在单位时间内处理的令牌数量,决定模型能同时服务多少用户及响应速度。提高吞吐量是AI基础设施团队的重要目标。
训练
训练是让AI模型学习数据模式的过程,需大量数据和计算资源。训练使模型能根据输入生成目标输出。混合方法如微调可降低成本。
迁移学习
迁移学习利用已有模型作为新任务的起点,重用先前训练的知识,提升开发效率。适用于数据有限的场景,但仍需额外训练以适应新领域。
权重
权重是训练中调整的数值参数,决定输入特征的重要性,影响模型输出。训练开始时权重随机分配,随着学习过程不断调整以优化结果。
验证损失
验证损失衡量模型训练效果,数值越低越好。它帮助判断训练是否过拟合,即模型是否仅记忆训练数据而非学习泛化能力。验证损失是训练过程中的重要指标。
*本文将持续更新,补充最新信息。


