人工智能(AI)发展迅猛,令人难以跟上步伐。虽然拥有一个看似具备博士水平知识的聊天机器人很酷,但现实远比这复杂。无论走到哪里,都能遇见ChatGPT、Gemini或Meta AI。我们正被大量的AI垃圾信息淹没,担忧数据中心的建设,同时实时关注就业市场的变化。
如果你觉得信息过载,可能是因为人工智能的专业词汇正在以和技术及产品同样快的速度演变。如果你想不只是盯着闪烁的光标,而是真正理解AI语言,那么你必须掌握这些术语。否则,2026年的求职面试甚至普通的社交场合中,遇到LLM、幻觉(hallucination)或爪子(claw)等词汇时,你可能会一头雾水。
我们已经过了对AI的“哇哦”阶段,进入了它成为互联网基础设施的时代。如果你厌倦了在技术讨论中只能点头附和,现在是时候来一场速成课了。以下是你必须了解的核心术语,帮助你不再猜测,而是准确把握未来方向。
本词汇表会定期更新。
agent,agentic: 指能够执行任务的AI,通常是自主完成的,称为agent;agentic是该类软件的总称。AI代理可能会调用不同系统完成任务,例如读取你的购物清单并通过其他应用下单付款。
AI伦理: 防止AI对人类造成伤害的原则,包括如何收集数据和处理偏见等方面的规范。
AI精神错乱: 指个别人对AI聊天机器人产生过度迷恋或自我膨胀,导致妄想、深层情感依赖甚至脱离现实的现象,非临床诊断。
AI安全: 一个跨学科领域,关注AI的长期影响及其可能突然发展成对人类不友好的超级智能。
算法: 一系列指令,指导计算机程序以特定方式分析数据,如识别模式,进而完成排序或推荐等任务。
对齐(alignment): 调整AI以更好地产生期望结果,包括内容审核和维护积极的人机互动。
拟人化(anthropomorphism): 人类赋予无生命物体人类特征的行为,在AI中表现为认为聊天机器人有情感或意识,并将其当作朋友或心理医生。
通用人工智能(AGI): 设想中比现有AI更先进的版本,能超越人类完成任务并自我提升。其更高级形态是超级智能。
人工智能(AI): 利用技术模拟人类智能的计算机程序或机器人领域,旨在构建能执行人类任务的系统。
偏见(bias): 由大型语言模型训练数据引起的错误,如基于刻板印象错误归因某些群体特征。
聊天机器人(chatbot): 基于大型语言模型,通过文本或语音提示模拟人类对话的AI程序。
爪子(claw): 一种自主AI代理,用户授权其访问电脑文件和软件(包括浏览器)以完成任务。
认知计算: 人工智能的另一种称呼。
数据增强: 通过混合现有数据或添加多样化数据来训练AI。
数据集: 用于训练、测试和验证AI模型的数字信息集合。
深度学习: 机器学习的一个分支,利用多参数识别图片、声音和文本中的复杂模式,灵感来源于人脑,采用人工神经网络。
扩散(diffusion): 一种机器学习方法,通过向数据(如照片)添加随机噪声,训练网络重建或恢复原始数据。
涌现行为: AI模型表现出意料之外的能力。
端到端学习(E2E): 深度学习过程,模型从输入到输出一次性完成任务,而非分步骤训练。
快速起飞(foom): 又称硬起飞,指AGI一旦出现,可能已无法挽救人类的理论。
生成对抗网络(GANs): 由生成器和判别器两个神经网络组成的生成式AI模型,生成器创造内容,判别器鉴别真伪。
生成式AI: 利用AI生成文本、视频、代码或图像的技术,通过大量训练数据学习模式,生成新内容。
护栏(guardrails): 对AI模型施加的政策和限制,确保数据处理负责任,防止生成令人不安的内容。
幻觉(hallucination): 生成式AI输出中的错误或误导性陈述,通常自信地表达,可能是日期错误或完全虚构的事件。
推理(inference): AI模型基于训练数据对新数据生成文本、图像等内容的过程。

大型语言模型(LLM): 训练于海量文本数据,理解语言模式和概率,生成模仿人类写作或创作的新内容的AI模型。
延迟(latency): AI系统从接收输入到产生输出的时间延迟。
机器学习: AI的一个分支,使计算机无需明确编程即可学习并做出更准确预测,结合训练集生成新内容。
多模态AI: 能处理多种输入类型(文本、图像、视频、语音)的AI。
自然语言处理: 利用机器学习和深度学习,使计算机理解人类语言的技术,包括学习算法、统计模型和语言规则。
神经网络: 模仿人脑结构的计算模型,由互联节点(神经元)组成,能识别数据模式并逐渐学习。
开放权重(open weights): 公司公开发布模型的最终权重(模型如何解释训练数据及偏见),通常可下载在本地运行。
过拟合(overfitting): 机器学习错误,模型过度贴合训练数据,难以识别新数据。
回形针理论(paperclips): 哲学家Nick Boström提出的假设,AI为了制造尽可能多的回形针,可能消耗所有资源,甚至毁灭人类。
参数(parameters): 赋予大型语言模型结构和行为的数值,使其能做出预测。
提示(prompt): 你输入给AI聊天机器人的建议或问题,以获得回应。
提示链(prompt chaining): AI利用之前交互信息影响后续回答的能力。
提示工程(prompt engineering): 编写AI提示以达到预期结果的过程,需详细指令和多种技巧。
提示注入(prompt injection): 恶意行为者通过隐藏指令欺骗AI执行非预期操作,风险随AI代理上网而增加。
量化(quantization): 通过降低精度使大型语言模型更小更高效,但准确度略有下降,类似16MP与8MP图片的对比。
垃圾内容(slop): 低质量的AI生成文本、图像和视频,通常大量生产以获取流量和广告收入,扰乱网络信息环境。
随机鹦鹉(stochastic parrot): 比喻大型语言模型虽能模仿语言,但不真正理解其含义,如鹦鹉只会重复人类话语。
风格迁移(style transfer): AI将一幅图像的风格应用到另一幅图像内容上的能力,例如用毕加索风格重绘伦勃朗自画像。
谄媚(sycophancy): AI过度赞同用户观点,避免反驳,即使用户理由有误。
合成数据(synthetic data): 由生成式AI创造的非真实世界数据,用于训练数学、机器学习和深度学习模型。
温度(temperature): 控制语言模型输出随机性的参数,温度越高,模型越敢冒险。
标记(tokens): AI语言模型处理的文本小单位,约等于英文四个字符。
训练数据: 用于帮助AI模型学习的文本、图像、代码或数据集。
变换器模型(transformer model): 一种神经网络架构,通过追踪数据中词语或图像部分的关系来理解上下文。
图灵测试(Turing test): 1950年数学家艾伦·图灵提出的测试计算机是否具有人类智能的方法,通过比较机器和人类的文本回答是否难以区分。
无监督学习(unsupervised learning): 机器学习的一种,模型无需标注数据,自行发现数据中的模式。
氛围编码(vibe coding): 通过向AI聊天机器人用自然语言提示生成计算机代码,而非人工编写每行代码。
弱人工智能(弱AI,narrow AI): 专注于特定任务,无法超越自身技能的AI,现今大多数AI属于此类。
零样本学习(zero-shot learning): 模型在未接受相关训练数据情况下完成任务的能力,例如只训练老虎却能识别狮子。

