文明晰野望,作者丨林森
Open AI 作为 AI 时代的科技先锋,每一个动向都备受关注。但是吃多了“网红化”带来的流量红利,Open AI 似乎很难像学者一样老实待在实验室了。
马斯克犀利批判,AGI 团队负责人黯然离职,光环下的深度推理大模型性感却似乎遥不可及。
中国 AI 行业在 ChatGPT 的刺激下这两年集体追赶预训练大模型,对资源、数据、算力大笔投入。
面对 Open AI 抛出的新动作,从预训练模型到深度推理模型转技术路线,跟或不跟?选择发展应用还是死磕大模型技术?这些都成为全球 AI 圈新的选择题。
李开复揭秘 o1 模型上线幕后
Open AI 越来越喜欢搞大新闻。
2024 年 9 月,在 ChatGPT4o 模型推出没有几个月,Open AI 就发布了号称“迄今为止功能最强大”的 o1 系列模型,其首席执行官山姆·奥特曼称这是“新范式的开始,人工智能可以进行复杂推理了”。
这就是所谓的“深度推理模型”。简单说,它最与众不同的是,回答之前会思考,产生一个很长的内部思维链,逐步推理,模仿人类思考复杂问题的过程。
o1 模型是首个通过大规模强化学习算法训练的模型,其对“算法”和“算力”的要求,可能更甚于“数据”。
如果预训练模型是 “数据贪吃蛇”,那么深度推理更需要“算法大师”,并同样是“算力消耗大户”。
有人说,“以前的预训练大模型是学习数据,o1 更像在学习思维。”预训练模型是靠海量数据和算力堆砌的高级版信息搜索和提炼概括,推理则被认为是 AI 实现人类或超人类水平智能的关键。o1 模型似乎离真正的“人工智能”更近了一步。
Open AI 犹如新的大杀器,搅乱全球大模型圈。
从 OpenAI 公布的评测结果来看,o1 在 Codeforces 编程竞赛中超过了 89% 的参赛者,在美国数学奥林匹克竞赛的资格赛中名列全美前 500 名,在物理、生物和化学问题的基准测试中超越了人类博士水平的准确率。
之前 Open AI 将 AGI(通用人工智能)划分了五个发展阶段,其中第一级「ChatBots」聊天机器人,典型的就是 ChatGPT;第二级「Reasoners」推理者,解决博士水平基础问题的系统。o1 模型发布代表 Open AI 在向外宣称,其实现了 AI 能力的跃迁,达到了人工智能发展阶段的第二级。
如果真是这样,这也将意味着 Open AI 再次大幅领先,把其他所有还在发展预训练模型,追赶 ChatGPT 路线的一众大模型厂家再次甩在身后。
目前 o1 仅有少数模型对高级别付费用户开放。但根据实测来看,o1 的水准可能差强人意。
例如,o1 在很多方面甚至不如 GPT-4o,仅支持文本,不能看,不能听,没有浏览网页或处理文件和图像的能力。还有内测的 AI 安全研究公司 Apollo Research 发现,o1 可能会假装遵循规则完成任务。数学家陶哲轩直言,“使用 o1 就像在指导一个水平一般但不算太没用的研究生。”
更有甚者,苹果日前放出了一篇论文,暗示了 Open AI 的 o1 模型不会推理,这篇论文论证了例如给小学数学题加句“废话”插入无关信息,就会干扰推理。
Open AI 用 o1 模型“卷”同行,真的是技术能力的跃迁吗?
近期零一万物 CEO 李开复在一则公开对话里透露的“八卦”道出了内幕。
他直言,“我刚从硅谷回来,听说 GPT5 的训练不太顺利,因为 10 万张集群蛮难搞定的。但是 Open AI 又要融资,GPT5 没有出来,没有一个由头让投资人投资,因为大家都在追赶,有些也快赶上了,所以他只有祭出了一个内部准备不发布的 o1。”
不过李开复并没有过多评价 o1 模型,对 Open AI 的评价依然很高,他援引 Open AI 内部人士说法,Open AI 还有很多“好东西”没有发布,很多已经做出来了。
Open AI 原本定位是一家非营利组织,但它正在迅速转变为营利性公司。近期 Open AI 以 1570 亿美元估值融资 66 亿美元,成为硅谷史上最大的一次融资。据《华尔街日报》报道,微软和 OpenAI 都聘请了投资银行,以咨询重组后的治理权和股权安排。
初心之变的背后,不仅有 o1 模型的仓促面世。今年以来,Open AI 已经有十余位中高层领导先后出走。就 11 月 9 日,上任 OpenAI 研究与安全副总裁仅 3 个月后,OpenAI 安全系统团队负责人翁荔(Lilian Weng)宣布将离开O这家自己已经工作近 7 年的公司。
这些迹象都在表明,Open AI 正在从“学者”变成了“网红”,似乎一刻也不想离开热搜。但如果企业一直没有实质性技术进展,人们的阈值将会不断改变。
大模型竞赛转向“务实化”
在大洋的另一边,中国大模型公司走出了另一条道路。
在追赶算力和数据方面,正如李开复所言,许多同行包括中国公司,已经追平 ChatGPT4o。
例如,腾讯的混元大模型今年不断升级,根据官方资料,相比前代模型,最新的混元 Turbo 性能显著提升,训练效率提升 108%,推理效率提升 100%,推理成本降低 50%,效果在多个基准测试上对标 GPT-4o,且第三方测评居国内第一。
李开复的零一万物也在 10 月份官宣,其新的预训练旗舰模型 “闪电”,在国际权威盲测榜单 LMSYS 上超越了 Open AI 。
预训练模型对大数据和算力投入要求极高,再加上新的 o1 模型面世,还是有人动摇了。近期业内关于“中国 AI 六小虎”(智谱 AI、零一万物、月之暗面、百川智能、MiniMax、阶跃星辰)中有公司要放弃大模型的消息喧嚣尘上。
但是许多互联网头部公司仍在坚持投入大模型技术。根据最新财报,腾讯一个季度在研发上的投入就高达 179 亿元,阿里也高达 142 亿元。两家公司不约而同强调,要继续投入 AI。
观察发现,中国大模型行业已经出现了两种发展路径——
第一种,例如腾讯、阿里、字节跳动、百度这样的互联网头部公司,仍在坚持预训练模型这一战略级技术路线,并持续投入,走出了“内部应用提效+外部行业输出”的务实路径。
在巨额投入后,技术快速成熟,这些大厂的大模型能力不仅追赶上 ChatGPT,其大模型技术还在内部和各业务结合落地,带动业务新发展,例如百度的搜索、腾讯的广告和 SaaS 产品、阿里的电商等业务都已经受益于 AI 提效升级。阿里巴巴在最新财报表示,AI 收入连续五季度增长。
同时,这些大厂把成熟的大模型算力和技术向行业输出,一方面实现新的商业化,另一方面助力各行业搭上 AI 的快车,带动整个中国人工智能的发展。今年中国快速出现大模型技术降价潮,不得不说正是头部大厂们通过资源投入快速带动了行业发展,是件好事。
第二种,中小型创业公司同样务实,聚焦发展各类 AI 应用创新。
以“大模型六小虎”为例,它们在今年前 10 个月的技术进展中,纷纷展示了各自在 AI 应用领域的成果。
月之暗面的 Kimi 探索版具备 AI 自主搜索能力,智谱 AI 的 AutoGLM 实时语音互动应用开始内测,百川智能推出首款 AI 助手“百小应”,MiniMax 将发布端到端实时语音通话 API 产品……
这些应用不仅丰富了 AI 产品的形态,也为创业公司们带来了商业化的可能。
营销数据也从一个侧面说明了国内创业公司在 AI 应用商业化中的大胆试水。有数据统计,今年前三个季度,各大 AI 应用在全网的广告投放支出超过了 3 亿元人民币。其中,kimi 智能助手以 1.99 亿元的投放金额位居榜首,远超其他竞品。
其实硅谷的 AI 创业者同样在如火如荼进行应用和产品的创新。周鸿祎近期公开提到,硅谷“没有人在卖大模型了,大家都在卖产品。”发展垂直化应用就是用 AI 聚焦去解决一个痛点问题。
“大模型就像一个发动机一样,它隐身在很多产品和解决方案之中。模型只是能力,模型不是产品。”周鸿祎直言。
如此,中国大模型发展的现状图已经清晰:大厂做底层能力的投入,并且快速向行业输出能力,而更多 AI 时代的创业者越来越年轻化、团队微型化,他们聚焦场景,创新各类C端和B端的 AI 产品应用。
无论“网红化”的 Open AI 未来商业化之路如何,我们都要肯定,这家公司为人工智能发展拉开了时代的大幕。
从大模型底层能力,到应用创新,中国人工智能行业已经快速加入了这一轮科技竞争的浪潮。从中国头部公司用一年时间追赶上美国预训练模型的速度看,我们对未来中国企业参与第二级甚至更高阶的人工智能发展竞争都抱有信心。
正如李开复预测:“未来两年,AI 将会有惊人的变化。”