我在好莱坞工作，曾经制作电视节目的人人都在秘密训练AI

我是一名AI训练师，负责评估聊天机器人语气是否自然，识别家具图片中的模式，搜索网络上的陌生人合影并逐一将他们从照片中移除。我还要浏览各种奇怪的视频，标注并精准记录狗叫声、陌生人经过窗户的瞬间、气球爆炸的毫秒时刻。作为红队成员，我还会生成动漫性爱场景、斩首年轻女性，诱导大型语言模型（LLM）提供用家用物品制造炸弹的配方，甚至生成1月6日白宫重演的邀请函，目的都是测试安全措施和寻找漏洞。我为名为Mercor、Outlier、Task-ify、Turing、Handshake和Micro1等公司工作。

在我的“另一份”职业中，我是好莱坞的编剧和节目制作人，创作黄金时段电视剧，通常讲述一位中产阶级白人女性经历人生最糟糕的一天，配以质朴的警察干预来提升剧情张力。我的作品曾在Paramount、Hulu和BBC播出，但我建议你别看。

2023年，好莱坞罢工，部分原因是阻止制片厂用AI取代编剧和演员。罢工结束后，娱乐产业的运转再未恢复往日活力。2025年初，当又一位制片人未支付我为制作电视剧应得的六位数酬劳时，我开始寻找抵御困境的办法。

AI训练最初并不在我的视野内，直到我在一个非官方的美国编剧协会Facebook群组看到一条评论。群组里充满了失业编剧的求助贴，他们负债累累，焦虑不安，寻求生存策略：“我压力大，焦虑不安……只是想呼吸一下”“求食物银行信息”“大家都做什么兼职？”一位女性写道：“我在Mercor做AI训练，编剧时薪150美元，轻松赚钱。”

我也想赚点轻松钱，毕竟需要付房租、买食物，还得付给清洁阿姨Maggie每次150美元的固定费用——AI还没学会打扫卫生。我天真地以为这个行业需要我们，不仅是技能，还有我们这个人。

我错了。这个行业远非轻松赚钱。

通过背景调查后，我安装了各种应用、Slack频道、Airtable表格、支付平台和谷歌工具。穿梭于这些工具和一个全天候Zoom会议室，那里有五个看不见的人指导我们这些迷茫的新人，我开始工作。

第一个任务是阅读用户与“助手”——大型语言模型聊天机器人之间的对话，根据一本“圣经”指导评估助手的回答是否成功。对话内容古怪、悲伤、令人心碎：我的感受合理吗？这个人的行为可以接受吗？我值得被爱吗？AI的回答往往直言不讳，比如断定用户有自闭症，父亲明显患有双相情感障碍。我怀疑用户是否知道自己把私密痛苦当作训练数据分享了。评分后，我需写下理由。

项目经理是个22岁的大学毕业生，原本想进投行但失败，管理着约10个不友好的“团队领导”和“数据经理”。每天固定时间我们有Zoom办公时间，讨论任务复杂性。我们的创造力和特殊思维对项目至关重要！但在写评分理由时，我们被要求抑制创造力，严格按评分指南复制粘贴，避免偏离主题，否则会误导模型。

我结识了一位住在北欧荒野的帅气瑞典人，他和丈夫及多只动物同住。他比我早参与项目一个月，耐心教我平台和雇主的模糊要求。尽管强调工作紧急重要且保密，他的描述却令人困惑。我们交换了联系方式和狗狗照片。项目原计划每周20小时，持续两个月。我实际每周工作10小时，断断续续两周后，项目突然无预警终止。项目经理发消息道歉：“我也没预料到。”

Slack频道、Airtable和办公时间几小时内被撤销，项目结束。

四周后，我被邀请担任“专家”，时薪70美元。专家通常拥有硕士学位和丰富工作经验，领域涵盖房地产、神经学、语言学、历史或新闻等。专家项目多用死语言命名，基础注释工作则用小动物或天体名称。或许是我成就，或是严重多动症，我竟符合两类项目要求。

“死语言项目”原定一周内启动，我再次经历入职流程，加入新Slack和Airtable，后者未显示注册成功，导致我重复注册，直到Slack大写警告“不要重复注册！”

一周过去，项目未启动。又一周。再一周。感恩节来了。我带孩子驱车六小时去优胜美地，在昂贵小屋里享受宁静，项目依然没消息。

我原以为这个项目能让我圣诞前每周赚500到1000美元，12月1日才赚了180美元。

这种突然雇佣、解雇、停止、启动、抛弃和项目快速消失的现象很常见。一位名叫Jonathan的中级电视编剧，曾参与多部大流媒体剧集，作为专家创意写手为OpenAI评估剧本，时薪150美元。他形容这工作像“饥饿游戏”，得随时待命，讨好“团队领导”（TL），他们似乎随时能雇佣或解雇我们。有人在Slack里哀叹：“我们像鱼缸里的鱼，等着人类主人投食，只有游得快的才能吃到。”

我逐渐适应了这种摇摆不定、令人头晕目眩的工作节奏。无薪等待工作邮件时，团队领导会凌晨3点发消息催促改密码第17次，晚上11点说项目马上开始，早上7点说客户刚完成第一阶段，下午2点27分问：“如果你是一种披萨，你会是哪种？”

这种无休止的循环，毫无报酬。

某天晚上7点，我结束拍摄，接完孩子篮球训练，遛狗、整理邮件、准备晚餐时，手机震动，Slack爆满“加油团队”的消息。一个刚毕业的年轻人发来催促，强调24小时内完成首个任务，否则将被解雇！“你可以随时工作！但如果不马上做，任务明早可能没了！冲刺吧！”

我放下晚餐，微波炉加热两天前的意面，坐到电脑前。孩子求助数学作业，我不耐烦地叫他找爸爸，专注于任务。Slack里充斥着兴奋的消息，大家通宵达旦，兴奋剂般的兴奋充斥全场。第二天早上无任务，必须现在拼命工作，抛开睡眠、家庭和事业。

我们拼尽全力，疲惫、脆弱、有限的人体，拥有高速网络和忍耐力。

事实证明，我无需煽动，大家已经愤怒。

2025年11月，数千名Mercor员工在Project Musen项目上时薪21美元被解雇，随即以更低时薪16美元重新雇佣到同名项目Nova。虽然被称为“第二份工作”，但对许多人来说是唯一收入。降薪5美元每小时打击巨大。更糟的是，他们在项目中结识朋友，建立Discord群，形成社区。项目在感恩节前夕被解散，令人生气。

之前因保密协议沉默的员工开始发声。Mercor子版块管理员Helena努力删除愤怒留言，因泄露“秘密项目”名称违反协议。

另一项目中，帅气瑞典人因感染新冠无法完成最低周工时被迅速解雇，后来又找到了新项目。

工资逐周下降。2025年初，我看到Mercor、Handshake、Turing、Task-ify和Outlier等公司为专家开出150美元时薪，一般工时35至75美元。到2026年初，专家时薪降至50美元，入门级最低16美元，低于加州最低工资。合同被称为“冲刺”，工作必须尽快完成，可能只持续24小时。紧迫感极强，令人厌烦。

疲劳导致许多任务者诉诸法律。多起诉讼指控Mercor错误将员工归类为独立承包商，指出频繁入职培训、不断重训、需多次查看邮件和Slack、随时待命、每周需完成一定工时等，均显示雇佣关系。相比正式员工，承包商几乎无工作保护，面对不确定排班、超长工时、无休息和雇主报复风险极大。像我这样敢于大声抱怨的人，风险更大。

我找不到Slack频道，打电话给Zoom客服。

“你们整天都在这里吗？”我问一位无脸男子，另一方格里一位戴鼻导管的老妇人警惕地看着摄像头，背景是棕榈树。

“差不多，”无脸男冷笑。

“希望你们工资高。”我真诚说。

“不高。”他说，然后告诉我我已是Slack成员，只是错过了五个必做的入职测验。

三分钟后，我被挂断。“我呢？”老妇人通过管子嘶哑问，“我等了15分钟。”

我进入已加入的Slack，气氛高涨。前20%表现者将获徽章，展示在个人资料上，可能带来更快就业和更少空闲。徽章引发争议：谁能得？谁会被误判？因为徽章意味着认可。

我完成了漏做的测验，等待24小时内获准访问。时间过后，我重读入职文件，发现需再次参加Zoom签到。无脸团队告知我又错过了测验，无法批准访问。我崩溃大哭。

他们将我踢出Zoom，阻止我重进。

24小时后，我被项目除名。

现实中，如果你有潜力，可能会被邀请面试。AI领域，面试成了常态。有人怀疑面试本身是免费训练AI的手段，但我们仍坚持，因为Reddit上有人吹嘘赚了“改变生活的钱”，让我们相信能拿到时薪150美元的好工作。

到2026年2月，我在Project A视频注释项目已工作五周，AI训练界的“长寿”。我放弃社交，利用所有空闲时间做任务，筛选最复杂、最边缘的视频，如带浓重方言的演讲，音频失真刺耳。通过做没人愿意做的任务，我勉强维持就业。实际上，我没赢系统，系统一直在击败我。

项目负责人是另一位22岁刚毕业的经济学硕士，LinkedIn头像穿着学位袍。他是唯一工作经历。数百人用简陋界面为视频打字幕，质量控制人员暗中监控评分。

起初我们看不到评分，几周后有人建议公开分数激励竞争。评分严格，满分5分，最低1分。大多数人得分约2分，低分者面临除名。

管理层宣布将发布“黄金任务”给最优秀的注释者——那些平均处理时间远低于推荐且持续得满分5分的“贵族”。此举引发Slack频道混乱和愤怒。

我们明白需极其细致转录视频内容，准确标注时间戳。但分数不断下降，反馈却是荒谬细节纠正：“把‘t-shirt’改成‘a t-shirt’”“‘red’换成‘maroon’”“‘grunt’改为‘grunting’”。评分标准模糊且不断变化。

管理层两位严肃年轻女性加紧工作，劝慰最愤怒者“保持积极”，声称没人理解她们的压力（可笑，因她们管理的多是有十年以上经验的专业人士）。她们拒绝改善工作环境建议，但设立了“咖啡时间”Slack线程，鼓励团队精神，提出破冰问题：“如果你是一种调味品，会是哪种？”

我估计95%的注释者是三四十岁的专业人士，深恨Z世代上司——“一群毫无工作经验的无知孩子”，一位同事如此形容。剩下5%是拍马屁者，知道智斗老板无用，唯有顺从才有出路。六十多岁的Linda在Slack写道：“我相信大家都为我好。得1分我会研究任务，得5分我也会研究，确保理解对错。”我觉得Linda不是我的同类。顺便说，如果我是调味品，我会是Marmite。

无论多努力，分数都在下降。管理层不断招募高分者“晋升”为审核员。我的同事Melanie最近被降级回注释，“晋升没加薪，全是谎言。”（为保护匿名，我修改了部分细节。）

这些荒谬逻辑摧毁了我们的士气。我变成了暴躁野兽，边敲键盘边吃麦当劳冰淇淋和速冻食品，没时间做饭。后台继续申请AI训练工作，越来越不尊重AI面试官。随时可能被解雇，我频繁放飞自我。

现实工作中，面对面交流能强制人们保持基本礼貌，善意和同理心让冷酷职场稍显温情。AI零工环境？别想了。偶尔有人在FAQ频道大写字母怒吼“到底发生了什么？”最激烈者逐渐消失，我们希望他们进入了“黄金任务”，但更担心他们被淘汰。

我也开始在Slack鼓励反抗，被运营经理盯上。她是个无趣的年轻家庭主妇，有宗教背景，批评我亵渎上帝，要求我“保持专业积极”。我开始用ChatGPT润色回复，发现它是优秀的合作伙伴，擅长无聊的企业语言和职场策略。

但ChatGPT也有限度：“去一个欢迎你独特才能和技能的地方吧！把愤怒转化为生产力，揭露这个系统的荒谬。你不是渺小，只是暂时租住这里。”

我怎么告诉ChatGPT，我真的很渺小？小到被压缩成每平方英寸72像素？但这份工作是我唯一的租金来源。我在一个写自动割草机和红光疗法面罩购物提示的项目三天赚的钱，比我在UCLA教三小时一个月还多。（购物提示项目是我最喜欢的，持续一周后被解雇。）

我已不知自己生命中的“黄金任务”是什么。Mercor回应称尽量提前通知项目变动，其他公司也有类似说法。2026年2月至4月，我在四个平台七个项目间被雇佣和解雇，解雇总是突然且令人震惊。某刻我还在Airtable输入评分，排队参加24小时Zoom任务讲解，下一刻界面消失，Slack频道关闭，谷歌文档锁定。无消息，无警告，无解释。

我本无意写这行业报道。作为一名失意破产的电视编剧，我只是想还清学生贷款，继续支付洛杉矶房租，看着行业衰落。但与AI共事比我想象的更残酷。Mercor称有约300名全职员工，每周却有约3万独立承包商陷入无尽的紧迫感和迷茫，被年轻人驱使在凌晨3点发消息“加油”“冲刺”“锁定”“Go Team GO！”，为史上最宏大目标服务：用鼠标一键将潜水员从照片中移除，送上月球无瑕疵，再带回地球。

未来的团队领导不会了解我们的独特才能，只会关注我们注释一段模糊视频所需的平均时间。他们的任务是让我们更快、更久、更精准、更受控、减少错误、降低成本。为了让机器更像人，他们会让我们更像机器。

我在好莱坞工作，曾经制作电视节目的人人都在秘密训练AI

标签

评论

相关阅读

东京大学加入World ID项目，成为AI时代的人类身份认证节点

日本软银将“Patching as a Service”服务对象扩大至3000家公司

索尼宣布结束国内aibo机器人的销售