人工智能正在改变世界,同时也创造了一套全新的语言来描述它的工作原理。只需花五分钟阅读AI相关内容,你就会遇到LLM、RAG、RLHF等一系列术语,即使是技术领域的资深人士也可能感到困惑。本文词汇表旨在帮助你理解这些术语,并会随着领域的发展不断更新,堪称一份“活文档”,就像它所描述的AI系统一样。
AGI
人工通用智能(AGI)是一个模糊的概念,通常指的是在多数任务上能力超过普通人的AI。OpenAI CEO Sam Altman曾将AGI形容为“你可以雇佣为同事的普通人类”。OpenAI的章程定义AGI为“在大多数经济价值工作中表现优于人类的高度自主系统”。Google DeepMind则认为AGI是“在大多数认知任务上至少与人类同等能力的AI”。如果你感到困惑,不用担心,AI领域的专家们也一样。
AI代理
AI代理指的是利用AI技术代表用户完成一系列任务的工具,超越了基础聊天机器人的能力,比如报销、订票、订餐甚至编写和维护代码。由于这一领域仍在快速发展,“AI代理”的定义可能因人而异,相关基础设施也在逐步完善。基本概念是指一个自主系统,可能调用多个AI系统来完成多步骤任务。
API端点
API端点可以理解为软件背后的“按钮”,其他程序可以通过它们触发软件执行操作。开发者利用这些接口构建集成,例如让一个应用从另一个应用获取数据,或让AI代理无需人工操作即可直接控制第三方服务。大多数智能家居设备和连接平台都隐藏着这些端点,普通用户通常看不到。随着AI代理能力提升,它们能自主发现并使用这些端点,带来强大且有时出乎意料的自动化可能。
思维链(Chain of Thought)
人类面对简单问题时往往不假思索就能回答,比如“长颈鹿和猫哪个更高?”但有些问题需要中间步骤,比如农场里鸡和牛共有40个头和120条腿,需写出方程才能算出数量。在AI中,思维链推理指将问题拆解为更小的步骤,以提升最终答案的准确性,尤其适用于逻辑或编程场景。该方法基于传统大语言模型,通过强化学习优化思维链能力。
编码代理
编码代理是AI代理的一个特定应用,专注于软件开发。它不仅能建议代码,还能自主编写、测试和调试代码,完成开发者日常的反复试验工作。这些代理能跨整个代码库工作,发现漏洞、运行测试并推送修复,几乎无需人工干预。可以把它看作一个永不疲倦、专注度极高的实习生,但仍需人类审核其工作。
计算力(Compute)
计算力通常指支持AI模型运行的关键计算资源,包括GPU、CPU、TPU等硬件,是现代AI产业的基础。它为训练和部署强大模型提供动力,是AI发展的核心要素。
深度学习
深度学习是机器学习的一个子集,采用多层人工神经网络结构,使AI能比传统线性模型或决策树更复杂地关联数据。其灵感来自人脑神经元的互联路径。深度学习模型能自动识别数据中的重要特征,通过反复学习和调整来提升表现,但通常需要海量数据和更长训练时间,开发成本较高。
扩散模型(Diffusion)
扩散技术是许多生成艺术、音乐和文本AI模型的核心。受物理学启发,扩散系统通过逐步向数据(如图片、音乐)添加噪声“破坏”其结构,然后学习逆过程从噪声中恢复数据,实现生成。
蒸馏(Distillation)
蒸馏是一种“师生模型”技术,通过让学生模型学习教师模型的输出,提取大型模型的知识,训练出更小、更高效的模型。OpenAI的GPT-4 Turbo即可能采用了此技术。虽然各AI公司内部普遍使用蒸馏,但未经授权的蒸馏可能违反服务条款。
微调(Fine-tuning)
微调指在已有模型基础上,使用特定领域或任务的数据进行进一步训练,以提升模型在特定应用上的表现。许多AI初创企业以大语言模型为基础,通过微调增强针对目标行业的实用性。
生成对抗网络(GAN)
GAN是一种机器学习框架,由生成器和判别器两个神经网络组成,生成器试图制造逼真数据以欺骗判别器,判别器则努力识别真假。两者相互竞争,推动生成结果更真实。GAN适合生成逼真图像或视频,但不适合通用AI。
幻觉(Hallucination)
幻觉指AI模型生成错误或虚假的信息,是AI质量的重大问题。幻觉可能导致误导性输出,甚至带来实际风险,如错误医疗建议。其根源通常是训练数据的缺失,推动了专门领域AI模型的发展,以减少知识盲区和虚假信息。
推理(Inference)
推理是运行AI模型进行预测或结论推断的过程。模型必须先经过训练才能有效推理。推理可在多种硬件上执行,但大型模型在低性能设备上运行缓慢。
大型语言模型(LLM)
大型语言模型是诸如ChatGPT、Claude、Google Gemini、Meta Llama、微软Copilot和Mistral Le Chat等AI助手背后的核心技术。它们由数十亿参数组成,学习词语间关系,构建语言的多维表示。模型通过分析海量文本数据,生成最符合提示的语言模式。

内存缓存(Memory Cache)
内存缓存是一种优化推理效率的技术,通过保存部分计算结果减少重复计算,提升响应速度。KV缓存是常见的缓存类型,广泛应用于基于Transformer的模型。
神经网络
神经网络是深度学习的基础结构,灵感来源于人脑神经元的连接方式。随着GPU的发展,神经网络得以训练更深层次的模型,推动了语音识别、自动驾驶和药物发现等领域的突破。
开源
开源指软件或AI模型的代码公开,任何人都可使用、检查或修改。Meta的Llama模型是AI领域开源的代表。开源促进全球研究者和开发者协作,加速进步并支持独立安全审计。与之相对的是闭源,如OpenAI的GPT模型,代码不可见。
并行化
并行化指同时执行多项任务,类似多个员工同时处理项目不同部分。AI训练和推理依赖并行化,现代GPU设计用于成千上万的并行计算,是AI硬件的核心。随着模型复杂度提升,跨多芯片和多机器的并行化能力成为关键。
RAMageddon
RAMageddon是指内存芯片(RAM)日益短缺的现象。AI行业对内存需求激增,导致游戏、消费电子和企业计算等领域内存供应紧张,价格上涨,影响产品价格和出货量。短缺预计短期内难以缓解。
递归自我改进
递归自我改进指AI模型自主改进自身的能力,可能带来能力和自主性的快速提升,有时被视为奇点时刻。虽然存在末日论调,许多AI初创企业将其视为研究的新前沿,致力于构建能设计自身后继者的模型。
强化学习
强化学习是一种训练方法,AI通过尝试和获得奖励信号学习行为,类似训练宠物。与监督学习不同,强化学习允许模型探索环境并根据反馈调整策略,广泛应用于游戏、机器人控制及提升大语言模型的推理能力。RLHF(基于人类反馈的强化学习)是当前主流实验室微调模型的核心技术。
令牌(Token)
令牌是人机交流的基本单位,将文本拆分成可被语言模型处理的片段,类似编译器将语言转为机器码。令牌数量也是AI使用成本的计费依据。
令牌吞吐量
令牌吞吐量衡量系统在单位时间内处理的令牌数量,决定了模型能同时服务多少用户及响应速度。提高吞吐量是AI基础设施团队的重要目标。
训练
训练是机器学习AI开发的过程,通过输入大量数据让模型学习模式,生成有用输出。训练成本高昂,数据需求不断增加,混合方法如基于规则的微调可降低成本。
迁移学习
迁移学习利用已有模型作为新任务的起点,重用之前训练的知识,提升开发效率,尤其在新任务数据有限时有用,但通常仍需额外训练以适应新领域。
验证损失
验证损失是衡量模型训练效果的指标,数值越低越好。它帮助研究者判断何时停止训练、调整参数或发现过拟合问题,确保模型真正学会泛化能力。
权重
权重是训练中决定输入特征重要性的数值参数,通过调整权重,模型逐步优化输出。例如预测房价模型中,卧室数量、车库等特征的权重反映其对价格的影响。
*本文将持续更新,补充最新信息。


