我是一名AI训练师,负责评估聊天机器人语气是否自然,识别家具图片中的模式,搜索网络上的陌生人合影并逐一将他们从照片中移除。我还要浏览各种奇怪的视频,标注并精准记录狗叫声、陌生人经过窗户的瞬间、气球爆炸的毫秒时刻。作为红队成员,我还会生成动漫性爱场景、斩首年轻女性,诱导大型语言模型(LLM)提供用家用物品制造炸弹的配方,甚至生成1月6日白宫重演的邀请函,目的都是测试安全措施和寻找漏洞。我为名为Mercor、Outlier、Task-ify、Turing、Handshake和Micro1等公司工作。

在我的“另一份”职业中,我是好莱坞的编剧和节目制作人,创作黄金时段电视剧,通常讲述一位中产阶级白人女性经历人生最糟糕的一天,配以质朴的警察干预来提升剧情张力。我的作品曾在Paramount、Hulu和BBC播出,但我建议你别看。

2023年,好莱坞罢工,部分原因是阻止制片厂用AI取代编剧和演员。罢工结束后,娱乐产业的运转再未恢复往日活力。2025年初,当又一位制片人未支付我为制作电视剧应得的六位数酬劳时,我开始寻找抵御困境的办法。

AI训练最初并不在我的视野内,直到我在一个非官方的美国编剧协会Facebook群组看到一条评论。群组里充满了失业编剧的求助贴,他们负债累累,焦虑不安,寻求生存策略:“我压力大,焦虑不安……只是想呼吸一下”“求食物银行信息”“大家都做什么兼职?”一位女性写道:“我在Mercor做AI训练,编剧时薪150美元,轻松赚钱。”

我也想赚点轻松钱,毕竟需要付房租、买食物,还得付给清洁阿姨Maggie每次150美元的固定费用——AI还没学会打扫卫生。我天真地以为这个行业需要我们,不仅是技能,还有我们这个人。

我错了。这个行业远非轻松赚钱。

通过背景调查后,我安装了各种应用、Slack频道、Airtable表格、支付平台和谷歌工具。穿梭于这些工具和一个全天候Zoom会议室,那里有五个看不见的人指导我们这些迷茫的新人,我开始工作。

第一个任务是阅读用户与“助手”——大型语言模型聊天机器人之间的对话,根据一本“圣经”指导评估助手的回答是否成功。对话内容古怪、悲伤、令人心碎:我的感受合理吗?这个人的行为可以接受吗?我值得被爱吗?AI的回答往往直言不讳,比如断定用户有自闭症,父亲明显患有双相情感障碍。我怀疑用户是否知道自己把私密痛苦当作训练数据分享了。评分后,我需写下理由。

项目经理是个22岁的大学毕业生,原本想进投行但失败,管理着约10个不友好的“团队领导”和“数据经理”。每天固定时间我们有Zoom办公时间,讨论任务复杂性。我们的创造力和特殊思维对项目至关重要!但在写评分理由时,我们被要求抑制创造力,严格按评分指南复制粘贴,避免偏离主题,否则会误导模型。

我结识了一位住在北欧荒野的帅气瑞典人,他和丈夫及多只动物同住。他比我早参与项目一个月,耐心教我平台和雇主的模糊要求。尽管强调工作紧急重要且保密,他的描述却令人困惑。我们交换了联系方式和狗狗照片。项目原计划每周20小时,持续两个月。我实际每周工作10小时,断断续续两周后,项目突然无预警终止。项目经理发消息道歉:“我也没预料到。”

Slack频道、Airtable和办公时间几小时内被撤销,项目结束。

四周后,我被邀请担任“专家”,时薪70美元。专家通常拥有硕士学位和丰富工作经验,领域涵盖房地产、神经学、语言学、历史或新闻等。专家项目多用死语言命名,基础注释工作则用小动物或天体名称。或许是我成就,或是严重多动症,我竟符合两类项目要求。

“死语言项目”原定一周内启动,我再次经历入职流程,加入新Slack和Airtable,后者未显示注册成功,导致我重复注册,直到Slack大写警告“不要重复注册!”

一周过去,项目未启动。又一周。再一周。感恩节来了。我带孩子驱车六小时去优胜美地,在昂贵小屋里享受宁静,项目依然没消息。

我原以为这个项目能让我圣诞前每周赚500到1000美元,12月1日才赚了180美元。

这种突然雇佣、解雇、停止、启动、抛弃和项目快速消失的现象很常见。一位名叫Jonathan的中级电视编剧,曾参与多部大流媒体剧集,作为专家创意写手为OpenAI评估剧本,时薪150美元。他形容这工作像“饥饿游戏”,得随时待命,讨好“团队领导”(TL),他们似乎随时能雇佣或解雇我们。有人在Slack里哀叹:“我们像鱼缸里的鱼,等着人类主人投食,只有游得快的才能吃到。”

我逐渐适应了这种摇摆不定、令人头晕目眩的工作节奏。无薪等待工作邮件时,团队领导会凌晨3点发消息催促改密码第17次,晚上11点说项目马上开始,早上7点说客户刚完成第一阶段,下午2点27分问:“如果你是一种披萨,你会是哪种?”

这种无休止的循环,毫无报酬。

某天晚上7点,我结束拍摄,接完孩子篮球训练,遛狗、整理邮件、准备晚餐时,手机震动,Slack爆满“加油团队”的消息。一个刚毕业的年轻人发来催促,强调24小时内完成首个任务,否则将被解雇!“你可以随时工作!但如果不马上做,任务明早可能没了!冲刺吧!”

我放下晚餐,微波炉加热两天前的意面,坐到电脑前。孩子求助数学作业,我不耐烦地叫他找爸爸,专注于任务。Slack里充斥着兴奋的消息,大家通宵达旦,兴奋剂般的兴奋充斥全场。第二天早上无任务,必须现在拼命工作,抛开睡眠、家庭和事业。

我们拼尽全力,疲惫、脆弱、有限的人体,拥有高速网络和忍耐力。

事实证明,我无需煽动,大家已经愤怒。

2025年11月,数千名Mercor员工在Project Musen项目上时薪21美元被解雇,随即以更低时薪16美元重新雇佣到同名项目Nova。虽然被称为“第二份工作”,但对许多人来说是唯一收入。降薪5美元每小时打击巨大。更糟的是,他们在项目中结识朋友,建立Discord群,形成社区。项目在感恩节前夕被解散,令人生气。

之前因保密协议沉默的员工开始发声。Mercor子版块管理员Helena努力删除愤怒留言,因泄露“秘密项目”名称违反协议。

另一项目中,帅气瑞典人因感染新冠无法完成最低周工时被迅速解雇,后来又找到了新项目。

工资逐周下降。2025年初,我看到Mercor、Handshake、Turing、Task-ify和Outlier等公司为专家开出150美元时薪,一般工时35至75美元。到2026年初,专家时薪降至50美元,入门级最低16美元,低于加州最低工资。合同被称为“冲刺”,工作必须尽快完成,可能只持续24小时。紧迫感极强,令人厌烦。

疲劳导致许多任务者诉诸法律。多起诉讼指控Mercor错误将员工归类为独立承包商,指出频繁入职培训、不断重训、需多次查看邮件和Slack、随时待命、每周需完成一定工时等,均显示雇佣关系。相比正式员工,承包商几乎无工作保护,面对不确定排班、超长工时、无休息和雇主报复风险极大。像我这样敢于大声抱怨的人,风险更大。

我找不到Slack频道,打电话给Zoom客服。

“你们整天都在这里吗?”我问一位无脸男子,另一方格里一位戴鼻导管的老妇人警惕地看着摄像头,背景是棕榈树。

“差不多,”无脸男冷笑。

“希望你们工资高。”我真诚说。

“不高。”他说,然后告诉我我已是Slack成员,只是错过了五个必做的入职测验。

三分钟后,我被挂断。“我呢?”老妇人通过管子嘶哑问,“我等了15分钟。”

我进入已加入的Slack,气氛高涨。前20%表现者将获徽章,展示在个人资料上,可能带来更快就业和更少空闲。徽章引发争议:谁能得?谁会被误判?因为徽章意味着认可。

我完成了漏做的测验,等待24小时内获准访问。时间过后,我重读入职文件,发现需再次参加Zoom签到。无脸团队告知我又错过了测验,无法批准访问。我崩溃大哭。

他们将我踢出Zoom,阻止我重进。

24小时后,我被项目除名。

现实中,如果你有潜力,可能会被邀请面试。AI领域,面试成了常态。有人怀疑面试本身是免费训练AI的手段,但我们仍坚持,因为Reddit上有人吹嘘赚了“改变生活的钱”,让我们相信能拿到时薪150美元的好工作。

到2026年2月,我在Project A视频注释项目已工作五周,AI训练界的“长寿”。我放弃社交,利用所有空闲时间做任务,筛选最复杂、最边缘的视频,如带浓重方言的演讲,音频失真刺耳。通过做没人愿意做的任务,我勉强维持就业。实际上,我没赢系统,系统一直在击败我。

项目负责人是另一位22岁刚毕业的经济学硕士,LinkedIn头像穿着学位袍。他是唯一工作经历。数百人用简陋界面为视频打字幕,质量控制人员暗中监控评分。

起初我们看不到评分,几周后有人建议公开分数激励竞争。评分严格,满分5分,最低1分。大多数人得分约2分,低分者面临除名。

管理层宣布将发布“黄金任务”给最优秀的注释者——那些平均处理时间远低于推荐且持续得满分5分的“贵族”。此举引发Slack频道混乱和愤怒。

我们明白需极其细致转录视频内容,准确标注时间戳。但分数不断下降,反馈却是荒谬细节纠正:“把‘t-shirt’改成‘a t-shirt’”“‘red’换成‘maroon’”“‘grunt’改为‘grunting’”。评分标准模糊且不断变化。

管理层两位严肃年轻女性加紧工作,劝慰最愤怒者“保持积极”,声称没人理解她们的压力(可笑,因她们管理的多是有十年以上经验的专业人士)。她们拒绝改善工作环境建议,但设立了“咖啡时间”Slack线程,鼓励团队精神,提出破冰问题:“如果你是一种调味品,会是哪种?”

我估计95%的注释者是三四十岁的专业人士,深恨Z世代上司——“一群毫无工作经验的无知孩子”,一位同事如此形容。剩下5%是拍马屁者,知道智斗老板无用,唯有顺从才有出路。六十多岁的Linda在Slack写道:“我相信大家都为我好。得1分我会研究任务,得5分我也会研究,确保理解对错。”我觉得Linda不是我的同类。顺便说,如果我是调味品,我会是Marmite。

无论多努力,分数都在下降。管理层不断招募高分者“晋升”为审核员。我的同事Melanie最近被降级回注释,“晋升没加薪,全是谎言。”(为保护匿名,我修改了部分细节。)

这些荒谬逻辑摧毁了我们的士气。我变成了暴躁野兽,边敲键盘边吃麦当劳冰淇淋和速冻食品,没时间做饭。后台继续申请AI训练工作,越来越不尊重AI面试官。随时可能被解雇,我频繁放飞自我。

现实工作中,面对面交流能强制人们保持基本礼貌,善意和同理心让冷酷职场稍显温情。AI零工环境?别想了。偶尔有人在FAQ频道大写字母怒吼“到底发生了什么?”最激烈者逐渐消失,我们希望他们进入了“黄金任务”,但更担心他们被淘汰。

我也开始在Slack鼓励反抗,被运营经理盯上。她是个无趣的年轻家庭主妇,有宗教背景,批评我亵渎上帝,要求我“保持专业积极”。我开始用ChatGPT润色回复,发现它是优秀的合作伙伴,擅长无聊的企业语言和职场策略。

但ChatGPT也有限度:“去一个欢迎你独特才能和技能的地方吧!把愤怒转化为生产力,揭露这个系统的荒谬。你不是渺小,只是暂时租住这里。”

我怎么告诉ChatGPT,我真的很渺小?小到被压缩成每平方英寸72像素?但这份工作是我唯一的租金来源。我在一个写自动割草机和红光疗法面罩购物提示的项目三天赚的钱,比我在UCLA教三小时一个月还多。(购物提示项目是我最喜欢的,持续一周后被解雇。)

我已不知自己生命中的“黄金任务”是什么。Mercor回应称尽量提前通知项目变动,其他公司也有类似说法。2026年2月至4月,我在四个平台七个项目间被雇佣和解雇,解雇总是突然且令人震惊。某刻我还在Airtable输入评分,排队参加24小时Zoom任务讲解,下一刻界面消失,Slack频道关闭,谷歌文档锁定。无消息,无警告,无解释。

我本无意写这行业报道。作为一名失意破产的电视编剧,我只是想还清学生贷款,继续支付洛杉矶房租,看着行业衰落。但与AI共事比我想象的更残酷。Mercor称有约300名全职员工,每周却有约3万独立承包商陷入无尽的紧迫感和迷茫,被年轻人驱使在凌晨3点发消息“加油”“冲刺”“锁定”“Go Team GO!”,为史上最宏大目标服务:用鼠标一键将潜水员从照片中移除,送上月球无瑕疵,再带回地球。

未来的团队领导不会了解我们的独特才能,只会关注我们注释一段模糊视频所需的平均时间。他们的任务是让我们更快、更久、更精准、更受控、减少错误、降低成本。为了让机器更像人,他们会让我们更像机器。