GameLook 报道/昨天,AI 快杀疯了。
北京时间 3 月 21 日晚,英伟达举办了 2023 春季 GTC 大会,创始人黄仁勋照例身着皮衣真人(大概)亮相演讲,在时长 1 个多小时的分享中,因为实在太重要,老黄把“AI 的 「iPhone 时刻」已经到来”这句话重申了一共三遍。
可能是提前约好一般,在英伟达办开发者大会的同一天,多家巨头来了一次集体“大约八点二十发”,微软、谷歌、Adobe 相继官宣了各自的 AI 产品——微软 Bing 上线了 AI 绘图功能、谷歌正式开放了聊天机器人 Bard、Adobe 也为自家的模型 Firefly 新增了 AI 绘图产品。
巨头们不约而同的动作很难不让人意识到,短时间内 AI 已经从蓝海快步迈入了红海拼杀阶段,谁能抢占先机,不谈击败竞争对手,也至少能在新时代到来后赢得生存机会。
从敲门到踹门,AI 发展神速
iPhone 的出现代表手机市场功能机旧王落幕、智能机新王登基,尽管重复声称“iPhone 时刻”已经到来有为自卖自夸的嫌疑,但老黄的说法其实并没有什么大问题。
严格意义上,今天的 AI 浪潮大致可以追溯到 2016 年。当时,谷歌 DeepMind 项目训练的围棋 AI“阿尔法狗”(AlphaGo)在 2016 年击败一众围棋高手,之后又在 2017 年在与世界排名第一的柯洁对弈中获胜。
数月后,宣布不再参加围棋比赛的 AlphaGo 以 AlphaGo Zero 名头重出江湖,开启了维持至今的不败统治。也正是 AlphaGo 的出现,给 AI 时代打开了一道门缝。
但由于围棋离普通人的生活太远,此后 AI 重新进入了“闷声发大财”的状态,也使得原本一马当先的谷歌,反而在后来的 AI 绘画、聊天机器人的抢先机中掉队。
2021 年,OpenAI 发布了新的 AI 绘画模型 DALL·E,相较 2012 年科学家吴恩达早期的探索、2015 年谷歌 Deep Dream 的致幻和精污,以及同一年 Gan 算法的高消耗,新模型采用的技术 Diffusion Models 更加易用,最关键的是进步神速。
如 2022 年 2 月,使用 Diffusion Models 技术的 AI 绘画 Disco Diffusion 画风还相当抽象,但 3 月就已经高度接近人类水平。同一时间,从 Disco Diffusion 分离的一支团队打造了新的 AI 绘画产品 Midjourney,AI 绘画水平已经难辨真假。
后来,一名叫 Jason Allen 的好事者用 Midjourney 生成了一张名为《太空歌剧院》的画作,并在美国科罗拉多州博览会的年度艺术比赛以压倒性的票数拔得头筹。尽管画作出自 AI 之手一事被曝光后引发大量争议,但也加速了 AI 绘画的出圈。
毕竟,《太空歌剧院》的出现代表着,不仅普通人无法分辨,AI 绘画的水平已经让拥有专业艺术鉴赏能力的评委也为之折服。
有用户有收入,烧钱不成问题
如今,只在 Discord 上发布的 Midjourney 已经拥有超过 1300 万用户,今晚该频道同时在线用户数更是达到 135 万,已经相当于 Steam 最顶级游戏的人气水平(目前 Steam 排名第一的 CS:GO 历史最高在线为 142 万人)。
值得注意的是 Midjourney 创始人早在 2022 年 8 月就透露 Midjourney 已实现盈利,根据业内人士估算、Midjourney 的年收入已超过了 1 亿美元。
而另一个 AI 绘画产品 Stable Diffusion,在去年 10 月就吸引了超过 20 万开发者下载和获得授权,多渠道累计日活用户超过 1000 万。旗下付费在线平台 Dream Studio 也拥有超过 150 万用户,生成超过 1.7 亿图片。
更不用说 2022 年 11 月发布的 ChatGPT,在短短两个月时间里做到月活破亿,成为史上用户数增长最快的应用,甚至比 TikTok 9 个月破亿的成绩还要快一大截。
ChatGPT 的出现也真正意义上踹开了 AI 时代的大门,无论是海外巨头的谷歌,还是国内大厂百度,都在短时间里快速反应,推出了相应的 AI 聊天机器人如 Bard、文言一心。
与元宇宙光打雷不下雨的态势不同,AI 绘画、AI 聊天几乎是消费级应用甫一推出便风靡世界,除了效果惊人,也与 AI 商业模式直接明了有关。
如 Midjourney、Stable Diffusion、ChatGPT 都有付费订阅服务,用户虽然可以免费使用,但付费可以解锁更多图片制作,以及机器人聊天更快响应等服务。用户对于 AI 的热情相当之高,而 Midjourney 甚至已经实现盈利,为众多公司加码投入 AI 坚定了信心。
有人气,还能在短时间内盈利,AI 显然不只是一门好技术,更是一项好生意。
“卖水人”稳坐钓鱼台,竞争态势已明盘
众所周知,AI 训练依赖大量显卡计算,成本十分高昂,能实现盈利相当不容易,目前还普遍处在烧钱状态。也因此当下各式 AI 要么是巨头推出、要么背后有巨头的身影,如 ChatGPT 母公司 OpenAI 就被微软收购。
据悉,Stable Diffusion 最初就用了 4000 张 A100 显卡来训练 AI 绘画,这块 2020 年发布的顶级专业卡单张价格至今仍需1~1.5 万美元。而 ChatGPT 级别的 AI 更是需要超过 3 万张 A100 显卡,每训练一次的成本也高达 1000 万美元。
不过在英伟达创始人黄仁勋看来,ChatGPT 一次训练成本 1000 万美元并不算贵,他在接受 CNBC 采访时表示,英伟达成功将“原本价值 10 亿美元的基于 CPU 的数据中心,缩小为价值 1 亿美元的数据中心”,还可以让 100 家公司分享分担成本。
所以,英伟达准备继续拉高专业显卡性能,在 GTC 大会上英伟达便发布了新一代专供 AI 训练的专业显卡 H100 NVL。H100 NVL 是 2022 年发布的 H100 的改进版本,可以简单理解为将两张 H100 用胶水黏在了一起,但理论上,H100 NVL 可以支持 256 张 H100 拼接,组成 AI 超级计算机,对 AI 格局造成巨大影响。
黄仁勋明确指出,H100 NVL 不是一张消费级显卡,而是为大语言模型专供的产品,计划今年下半年发售。
当然,基于美国芯片法案,无论是 H100 NVL、H100 还是更早的 A100 都不允许在中国大陆出售,不过就与 A100 英伟达就搞出了阉割版的 A800 一样,英伟达发言人也表示已经基于 H100 开发出中国特供的 H800 芯片,而且正在被腾讯、阿里等中国公司使用。
虽然英伟达没有说明两款芯片具体有何不同,但按照路透社援引一名中国芯片从业者的说法,H800 数据传输率只有 H100 的一半左右。英伟达提供特供芯片,可能也是美国芯片法案的目的:即让中国无法拥有最先进的芯片,同时又不使美国企业蒙受损失。
这一形势造成的影响是,在当下的 AI 竞争中,原本已经落后的中国企业可能没有与海外厂商站在同一起跑线的机会。但即便如此,AI 仍是一个不投入就落后,一落后就要挨打的未来核心产业。