新智元报道
编辑:庸庸耳朵
市值 140 亿美元的初创公司 Scale AI 正在招聘博士训练 LLM,用人成本的升高让该公司的毛利率在 2023 年有所下降,但创始人 Alexandr Wang 预计今年营收将增加两倍,突破十亿美元。
上个月,由 27 岁华裔天才少年 Alexandr Wang 创办的 Scale AI 获得 10 亿美元巨额融资, 估值飙升至 138 亿美元 ,获得了广泛关注。
这波流量还未减退,上个月末,Alexandr Wang 又推出了号称是最有实力的全新 LLM 排行榜——SEAL,与此前深受 AI 圈欢迎的 UC 伯克利团队的 LLM 排行榜对打,获得了 AI 大佬的转发。
创始 Alexandr Wang19 岁就瞄准了数据标注这一风口,毅然辍学创业,如今坐拥全球 AI 数据铸造厂 Scale AI,这位「全球最年轻的白手起家的亿万富翁」和他身后的明星公司都十分令人瞩目。
根据 The Information 最近的独家报道,Scale AI 正在招聘博士训练 LLM,让他们灵活办公,开出高达 40 美元的时薪。
数据标注的门槛已经这么高了吗?过高的劳动力成本是否会让 Scale AI 烧掉融资?
根据 MEI 招兵买马
劳动力聘用标准转型
Scale 过去主要雇用非洲、印度和菲律宾的廉价劳动力。
例如为 Alphabet 的 Wayo 和通用汽车的 Cruise 等公司标注自动驾驶汽车传感器数据,类似于行人、红绿灯和交通标志的图像,或者为 Instagram 标注购物图片。
但最近,随着 Scale AI 在新一轮融资中获得大量资金,公司已将重点转向在美国招募具有专业知识的高技能承包商来帮助训练模型。
也就是说,随着对高质量数据的要求,需要更加专业的人员来训练人工智能该做什么和怎么做。
LLM 的预训练过程需要大量的资金投入和长时间的等待,但这还不足以确保 Anthropic 公司的 Claude、OpenAI 公司的 ChatGPT、Meta 公司的 Llama 能提供符合人类常识的准确答案。
要做到这一点,还需要第二步:微调,这涉及到大量的人工承包商。
他们有的是公司内部雇佣的,有的是从 Scale、Surge AI 和 Labelbox 等其他初创公司雇佣的。对于提交给聊天机器人的问题,这些承包商会撰写合理回答作为 ground truth 来训练人工智能模型。
成立于 2016 年的 Scale 公司率先开展了这方面的一些工作。
它在 2019 年与 OpenAI 合作,研究一种通过人类反馈进行强化学习的方法(即 RLHF),成为使聊天机器人产生类似人类响应的重要途径之一。
根据 The Information 获得的一份 Scale AI 在 2 月份与投资者共享的演示文稿,他们将正在运行的系统称为「人类与人工智能混合系统,以低成本生成高质量数据」。
招聘新思路马斯克点赞
Alexandr Wang 深知,一个生成高质量数据的模型的背后,站着一整个人类智囊团,人才对 AI 发展的重要性是不可估量的。但他最近在推特上发布的招聘准则,却引发了轩然大波。
6 月 14 日,Wang 在社交媒体上分享说,他的公司已经正式制定了 MEI 招聘政策。即「优绩、卓越和才智」,与其他公司流行的 DEI,即多元化、公平和包容的政策相比显得独树一帜。
在评论区,马斯克前排留言为他点赞。
在 Scale 取得成功融资之后,Wang 说他收到了一些关于 Scale AI 人才的问题。他分享说,他亲自面试公司的每一位员工,或在每一份候选人资料包上签字,因为「人才是我们的第一指标」。
每当我们邀请某人加入我们时,这都是一件大事,这些决定从未被正统观念、道德标榜或任何普世的价值观所左右。 我认为我们的指导原则是 MEI:优绩、卓越和才智。这意味着我们只雇用最适合这份工作的人,我们追求卓越,我们毫不掩饰地偏爱非常聪明的人。 Scale AI 将应聘者视为个体,而不是群体的代表。我们不会不公平地将任何人刻板化、标志化,或以其他方式将其视为某个群体的成员而非个体。
在这种观念的指导下,结合当前对 Scale 服务需求量暴增的情况,Scale 招聘高学历、高智商、高能力人才训练大语言模型成为大势所趋。
预计今年营收翻两倍,突破十亿美元
2022 年,Scale 的收入增长跌破 50%,大大落后于它之前在 2019 年与投资者分享的收入预期。在当时,每 1 美元的收入要花费超过 1.4 美元的运营成本,简直入不敷出。
ChatGPT 的推出引发了对 LLM 的投资热潮,也带火了 Scale AI。
该公司预计今年的营收将从去年的 3.34 亿美元增长两倍多,略高于 10 亿美元,而且现金消耗极少。
但这种增长也是有代价的。
用人成本高启毛利率下滑
Scale 不得不转向美国受过高等教育的劳动力,包括博士、医生和律师,这大大提高了其劳动力成本。
在 2022 年至 2023 年期间,该公司的毛利率从 59% 下降到了 49%。
根据 2019 年一份给投资者的演示文稿,在非洲、印度和菲律宾工作的员工平均时薪为 1.5 美元,而 Scale 支付给受过良好教育的美国员工的时薪却高达 40 美元。
这让 Scale 难以为继,Scale 告诉投资者,它正在努力降低成本。该公司预测,今年将把毛利率提高 5 个百分点,到 2025 年将提高到 60%。
它正在使用内部工具自动识别「高效专家」来降低人力承包商队伍的成本,并且依靠计算机生成的数据来增强人力工作。
Scale 还在 4 月下旬给承包商发送电子邮件,称公司正在削减他们进行任务培训的工作报酬。
一名美国工人的新拿到的培训工资时薪只有 17 美元,其他人的工资也由 40 美元降至 22 美元左右。
AI 数据工厂
Scale 在一次投资者推介会上表示,它正在建设关键的人工智能基础设施。
Scale 己开始将自己打造成人工智能的「数据铸造厂」,Wang 曾公开谈论过博士、医生和律师在训练人工智能系统方面的优势。
他在上个月的播客中谈到,「我们需要最优秀、最聪明的人才贡献数据。他们通过工作能产生非常大的社会影响。换句话来说,为人工智能系统提供数据具有近乎无限的影响力。」
Wang 在视频中提到了前沿数据的重要性,大量的前沿数据对于模型非常重要。涉及复杂的推理链、复杂的讨论、模型的代理链、数据检索、自我修正等等,这些都是 Agent 的重要组成部分。
Scale 为了在美国业务的扩张,已从其海外业务中撤出。据 Rest of World 报道,Sacle 最近关闭了在肯尼亚、尼日利亚和巴基斯坦的承包商分支机构。
亚马逊前高管 Jeff Wike 于 2021 年投资了 Scale 公司,并为 Wang 提供咨询。
他在接受采访时说,「并不太了解 Scale 过去所从事项目的具体类型。但现在的工作是为非常复杂的技术挑战给出精密的答案。」
他补充说,技术性更强的工作对「工作人员来说有许多好处」。「物以稀为贵,如果能够胜任的人不多,工资就会很高。」
Scale 合同工的 AI 工作体验
Melissa Quashie 是马萨诸塞州一名自由撰稿人和编辑,几个月前通过 LinkedIn 入职 Scale,成为了一名合同工。
Quashie 说,在 Scale 的工作感觉就像是「我玩过的最无聊的电子游戏」,她的任务包括对 LLM 生成的不同回答进行评分,评分依据是,模型是否有效回答了人们的问题以及回答的文字水平。
有一次,她花了两个小时为一个聊天机器人编写了一份膳食计划,来帮助改进聊天机器人的自动回复。
为了满足 Meta 和 Alphabet 等客户的需求,Scale 储备了庞大的员工队伍,到了供过于求的程度。
接受 The Information 采访的 10 名员工都表示,尽管这份工作的薪酬和灵活性都很诱人,但同样意味着它很不稳定,而且压力很大——
训练任务很快被分配一空,人们无事可做,「曾经定期流入的项目开始枯竭」。
工人们还抱怨 Scale 延迟支付工资、没有兑现承诺的奖金、培训不到位以及系统经常崩溃等问题。
Scale 发言人 Amy Swanson 在一封电子邮件中回应道,「该项目是灵活的工作,而不是全职工作」。
Scale 还试图让这些打「零工」的临时雇员建立一些友谊,方法是组织员工飞往 AI 公司的写作工作坊,进行长达数天的「驻场」工作。
一位曾飞往德州奥斯汀的员工说,当时有 50 位和他一样的雇员在为 Alphabet 的 Bard 聊天机器人项目工作,他们查看了每个人针对不同提示所写的回复,晚上还一起唱了卡拉 OK。
Quashie 在「团建」中,遇到了大学教授、博士生、编剧和播客主理人,他们在一起相谈甚欢,每个人都对让 LLM 变得更好而兴奋,但无人提及一个问题——
「谁会因为我们正在做的这项工作而丢掉工作?」
参考资料: