OpenAI的四大争议与两个深层危机

  文硅谷 101

  随着 OpenAI 首席科学家 Ilya Sutskeve 官宣离开,他所带领的“超级对齐团队”成员接连离职,团队也随后解散。OpenAI 在创立之初的使命是构建安全的 AI 守护人类,但是如今却解散了内部关注模型长远安全的团队,并在公司章程中删除了不能用于“军事与战争”的条款。

  而就在团队大动荡、公司负面新闻频出之时,作为 CEO 的 Sam Altman 依然周旋于媒体与政客之间,这给极度擅长于公关与营销的 Sam 也带来了很多公关灾难。

  本期《硅谷 101》邀请到了Fusion Fund 创始管理合伙人张璐 及 硅星人创始人骆轶航,他们将从硅谷的视角出发,聊一聊正在走下神坛的 Sam Altman 的商业布局与个人投资,以及隐藏在 OpenAI 深处的两颗大雷。当算力资源从技术倾向商业化,OpenAI 还能领先多久?

  以下是部分访谈精选:

  争议一:安全对齐团队离职

  《硅谷 101》:关于 Ilya 和 OpenAI 安全团队的离职,我觉得可以追溯到去年 11 月的 OpenAI 风波——Sam Altman 被赶下台又光速回归这件事的后续,大家怎么看?

  张璐:其实去年我们也聊了 OpenAI 架构的问题,Ilya 的离开与其说是第二次宫斗,不如说是另一只靴子终于掉下来了。在去年 11 月,Sam 为什么可以在非常短的时间获得员工的支持然后光速回归,其实有一个重点原因也是员工希望能够促成比较大的一个融资。

  其实如果你还记得的话,上次的董事会风波之后,他们专门有讲会在内部加强安全对齐。现在相当于这个承诺没有兑现,这也是为什么在 Ilya 离职后,超级对齐团队直接离职。我觉得他们可能预计到了 Ilya 会离职,但至少希望新的管理人会尊重当时对于安全考量的约定,然而没有发生。

  骆轶航:对的。我觉得每一步可能都是安排好的。如果说这件事发生在去年 12 月的话,场面会比现在难看。如今也许他们已经达成了某个共识,选择在这样一个时间做出这样一个决定,但是有些事情还是令他们意外了。我记得有一位离职员工说,他离职的原因就是这段时间都没有机会和 Sam Altman 谈话,因为他不是在录节目,就是去录节目的路上,不是在接受访谈就是在参加会议。

  张璐:这些成员在公开的 Twitter 上去发表言论证明分歧确实很大了。因为我们都知道 OpenAI 其实内部有股权协议,如果你在公开场合去讲公司的不好,你的股权是会被收回的。所以他们愿意牺牲这么大的利益也要讲,就证明这个分歧非常很严重。另外还有一点我想提出来,不知道你们有没有看到,之前退了董事会的那两个女性成员也最近出来了,说 Sam 有很多谎言。

  骆轶航:对,那两个人说的比较尖锐了,直指 Sam Altman 这个人有问题。

  《硅谷 101》:但是没有具体展开说谎言是什么?

  张璐:对,我觉得从她们的角度可能确实跟这个保密性相关,但是这两个人的背景也确实可能更加在乎整个人工智能安全和监管的问题。不管怎么说,种种事情累加起来,我觉得 OpenAI 现在确实是处在一个相对敏感和关键的时刻。那在这种时刻,你当然希望公司的 CEO 是进来稳定军心的,而不是又去演讲,又去参加一些非常亮眼的活动。当然你去融资是一方面,但是你去结交各种各样的名流政客,到底对公司的价值在哪里?所以这可能也是为什么现在团队对他的一些反馈和评论变多。

  争议二:不签“封口费”收回股权

  《硅谷 101》:其实刚刚在讲这一段的时候,张璐有提到一个细节,就是说如果员工现在在 Twitter 上公开发声的话,公司是有可能把他们已经发出去的股权作废的。我看最近 OpenAI 的第二个风波,就是一份极为严苛的离职协议,协议要求他们终身禁止批评前雇主,不能说公司坏话,如果违反文件可能会失去股权;如果不签署这份严苛的离职协议,也是放弃股权。这件事在 OpenAI 内部,包括在推特上还是引起蛮大风波的,你们怎么看 OpenAI 这一招?

  张璐:其实我觉得这个事情引起这么大的争议,主要也是因为这样的条款让大家觉得有点霸王条款,而且可能不太符合整个硅谷的一个基调。在硅谷这边很多朋友也知道,无论是大公司还是小公司,离职之后如果有股权的话,你还是可以保有股权。那从初创企业来讲,可能你拿到的是一个股票期权的话,会有一个时间段可以把这个股权买回来,有些时候是几个月,如果说创始团队比较善良的话,可能时间可以延长到一年,甚至很多年。甚至还有一些机构,它会提供这种过桥贷款,让离职的员工可以把自己的股权买下来又去保住。所以其实整体上如果你拿到 RSU 的话,那当然就是拿到了,像他这样一个条款要求你不能够去说坏话,否则就把股权取消,确实是非常不硅谷。

  另外一点,坏话这个事情也很难去界定。举例来讲,那如果我离职后,我就客观评价 OpenAI 最新这个发布,这里做的可能不是那么好,不过另外的部分还可以。我是一个从某种角度来讲很客观的评价,但是从 OpenAI 角度就觉得说你可能在说我坏话,因为你说我的产品没有 Gemini 好,所以这还是会让大家觉得比较反感,而且很不公平。

  骆轶航:我接着刚才张璐的话去讲,的确这个事儿很不硅谷。起初我刚看到这个新闻的时候,我第一反应是这个事不是挺正常的嘛?后来仔细一想,或者你在推特上看他的反应,就发现这个事的确引发的反弹是非常大的。

  我老爱举 Yann LeCun 老师的例子,他是一个我非常喜欢的人,尽管他说的很多话他的学生都未必同意,但是这个人太可爱了。你看他经常说一些其实跟 Meta 主流在做的事情不相符合,离经叛道的事情,他是一个非常纯粹的科学家。但是呢,我也没有见到 Meta 把他怎么样。当然,Meta 其实也不是一个以宽厚待所有人而著称的公司,但即使如此好像也没怎么样,对吧?所以我觉得 OpenAI 这个事情如果从这个角度上去说的话,确实是挺不硅谷的。随便举一个例子,你一对比都能看出来。

  争议三:抢竞争对手发布节奏

  《硅谷 101》:最近其实 Sam 还有一个争议。大家看到 GPT-4o 发布的时间刚好在 Google I/O的前一天,其实不仅仅是 GPT-4o,就像之前的 Sora 跟 Gemini 的发布,还有 Anthropic 的发布会,包括之前 ChatGPT 的发布时间,Sam 好像一直在卡竞争对手发布会的节奏,而且就在别人前一天或者几天。你们怎么看待这种竞争行为?

  骆轶航:我有时候觉得挺唏嘘的,因为我觉得 Google 被按在地上打是大公司的宿命。从 ChatGPT 诞生到今年初,一年多一点的时间里,OpenAI 一直享受着舆论红利,它做什么在公众看来都是突破的、创新的,舆论真的对它很包容。而 Google 我记得特别清楚,最开始大概在 23 年 2 月份宣布做这个事,并随后给了一个非常简单的 demo 测试,但是出现了一点错误股价就下来了,媒体就在批判。其实你说 Google 当时真的做得很差吗?ChatGPT 这方面真的做得就很好吗?不是的,但是这就是小厂初创公司和大厂在舆论上受到的一种不同的待遇。

  最近这个发布会也是,GPT-4o 是在 5 月 13 日,Google 是 5 月 14 日,我认为两家都不是一个大更新。但是二者比起来的话,我觉得 Google 的进步可能会更明显一点,4o 更多是架构和工程上的打包。

  这里边我可能会疑问的一个点是,我们理论上发布会应该是产品早就已经准备好了,但是有没有可能 4o 很早就准备好了,如果没有 Google 的发布会,他们可能会选择不发布或者晚发布?Google I/O这样一个活动,全公司至少得有千人以上参与进去,准备得非常充分,而 OpenAI 可能 20 多个人就能搞定了。

  在这种情况下,享受着这样的红利,还在抢这样的发布时间,有人说 Sam Altman 是 PR 大师,我不知道这到底应该怎么去看,但是他的确吸引关注度的能力是很强的。

  张璐:对,Sam Altman 确实是 PR 大师,这可能也是他作为创始人和 CEO 的特质里面最强的一点。在硅谷确实存在这样一个现象,创新者去挑战巨头的时候是有优势的,整个公众环境对你的包容度比较高。OpenAI 也是一样,它用很少的人、相对少的资源去挑战这样一个非常巨大的科技公司,那么大家在舆论层面上会给他更多的关注度和支持。但是另一方面他的内心还是有点没底,因为他也知道要去应付的这个对手有多么强大。

  Google 之前确实让大家觉得挺失望的,因为它的人才属性、资金属性、算力等等方面都很强,然后也有非常强的大杀器 DeepMind,各方面都占有优势,但是发的东西却不是那么惊艳。不过你会发现今年它开始使劲儿后,这次 Gemini 的发布就非常惊艳。

  所以其实回到刚才的问题,我觉得去挑选市场时机、在竞争对手发布之前去抢占这个先机,这种竞争手段当然是没问题的。因为也不止是 OpenAI 在打听 Google,他们其实是互相打听。只是说 OpenAI 作为一个小团队,他的决策速度可以更快。他听说大厂要发布,那很快就可以把自己的事情推出去,可以抢到曝光点。但是就像骆老师提的,首先你的产品要够硬。

  《硅谷 101》:所以大家普遍觉得 GPT-4o 没有那么惊艳?

  张璐:我可能不一定说得很准确,但是它就像一个整合的大礼包,我觉得在产品体验上更好用了,但是从基础技术层面上,模型是不是更优了呢?其实不一定像大家想象的那么好。但是 Gemini 这次的发布确实是更好了,长上下文窗口的效果非常好,大家可以去测评。

  所以其实 OpenAI 抢了发布的先机,但结果不一定是最好的。确实现在市场竞争越来越激烈,他们的这种心态是可以理解的,不过 Sam 作为一个 CEO,虽然非常擅长融资和 PR,但是在这样一个多事之秋,也需要花更多时间在内部把产品、技术,以及技术团队内部调整好,这些都很重要。

  《硅谷 101》:对,但我觉得归根结底不管怎么 PR,终究还是得靠产品说话。

  争议四:删除模型不得用于军事与战争条款

  《硅谷 101》:OpenAI 最近还有一点比较有争议的,是他悄悄删除了针对军事和战争使用 ChatGPT 的禁令。我们记得其实在 OpenAI 刚刚成立的时候,成立的初衷是有一点受 DeepMind 的刺激,同时想要建立一个安全的 AGI。但是现在堂而皇之地把针对军事跟战争的条例删除了,我不知道这在硅谷有没有引起风波?

  张璐:当然有些议论,不过从另一方面来讲这也是不可避免的。之前大家会反对人工智能的武器化,但是说实话,按照现在这个技术发展速度的话,对于军工方面的植入是必然的。现在军工角度的应用也是一个非常大的市场,订单的数量和量级越来越大。那如果你有这样的一个限制,就拿不到这方面的订单了,所以从他们的角度讲这是非常现实的。

  OpenAI 其实现在最大的一个困境,就是你不能一开始声称一件事情,最后做的是其他的,就比如说其他公司一开始也没声称说我要去保护 AI 安全,去捍卫世界和平,我说的就是我要赚钱,我要用人工智能赚钱,那公众对你的预期就是这样,你去赚钱也不会遭到太多批评。但是 OpenAI 一开始的初衷甚至说架构都是非营利架构,而现在做的完全是一个商业化的运作产品。

  两大深层危机:与微软的关系与非营利架构

  张璐:并且从 OpenAI 现在的商业化路径来讲,它也没有表面上大家看得那么顺利。当然C端是一方面,但是大家都知道C端的粘性比较差的,流动性比较强。相对而言,B端会是非常大的订单,而且可以拿到高质量的工业数据,对于产品的植入和发展是很重要的,所以 OpenAI 从一早就开始想大规模做B端,因为它应该也不甘心做微软的分销商。

  但是现在最大的问题就是它打不过微软。因为客户想用 OpenAI 的模型,就直接去找微软了,微软不仅有一模一样的模型,还可以把它整合得更好用,同时有非常强力的销售和售后服务。所以 OpenAI 其实就会越来越被禁锢住,它会觉得自己和微软之间的话语权完全不对等了,所以也想要自己去开拓一些新的市场机会。现在全球政客们都对人工智能有恐慌的心态,从这个角度,去兜售军工订单的产品,可能也能带来一些大的机会。

  骆轶航:去年那场风波之后,我们私下有一种预测就是 OpenAI 会不会借着这个时机把董事会的结构和公司的性质彻底变了?以后我们就是一个正常的商业化的公司,去掉非营利组织这个标签和使命。结果怎么样?你发现他就是羞羞答答、犹抱琵琶,这个事是没有完成的。

  张璐:本身他最早搭建的这个架构,我们讲好听一点是创新,难听一点就是怪胎,它当时就是为了保证之前的捐赠方还有现有股东各方面的一个价值体系。并且它通过非营利拿到了很多相对低成本和免费的资源。包括招人的薪水也很低。但是人家为什么愿意为你去贡献?因为你告诉我这个事情不只是商业的回报,更多是要去改变世界,这还是能够吸引到很多人的。所以现在它要完全变成一个商业化的架构,从整个公司的调整来讲也非常的不容易,甚至可能是一场更大的冲突和风波。

  所以我们去年在讨论的时候就讲过说,OpenAI 的组织架构是一个雷。当时的风波之后,一只靴子掉下来了就是指 Sam 的回归,另外一只靴子到现在也掉下来了,就是 Ilya 要离开。但是还有一个雷一直没有引爆,就还是 OpenAI 这个架构的问题。

  骆轶航:其实 OpenAI 还有另外一个雷,也就是它跟微软的关系。去年三四月份我和国内一个大佬聊一些在硅谷发生的事情,他就说我其实觉得 OpenAI 会把微软掏空,意思就是如果 OpenAI 给微软提供 Copilot 服务或者其他软件服务的这样一个基础的话,那你自己不就变成一个分销商了吗?现在看来这种关系没有想象中乐观,微软没有想的那么怂,或者那么不经打,像微软一边在扶持 OpenAI 并且以 OpenAI 占主导,一边也有在投资其他公司。我觉得未来的关系是微软想在自己的所谓的 Copilot plus 这个体系里边加各种各样其他 AI 元素, 而 OpenAI 想拿更多独立的、销售的、售前售后的体系,建立一个商业化的团队。那这个合作就很难这样下去。

  张璐:这个时候你也要比较到底哪件事更难,其实大家都觉得是不是做 AI 更难?其实不是,你搭建这个销售团队和新闻分销渠道才是更加困难的。

  核心护城河:技术而非产品

  《硅谷 101》:所以你们觉得 OpenAI 的护城河是什么呢?

  张璐:它的护城河还是它的模型,它的技术。当它开始说技术层面上不去持续的增加,而是在产品优化上想去建立自己的护城河、去打销售的时候,他和微软的关系就会越来微妙。

  微软当时看中的就是 OpenAI 独一份的模型,而且你需要有巨大的算力,这正好是我可以给你的。但是现在如果说他们的模型不能够迈向下一阶段,同时市场上又有那么多的选择,作为微软来讲,如果你不是我唯一的选择,议价权就差很多。

  我举一个例子,去年在 Sam Altman 风波之后有很多的讨论,我们也有几个初创企业一直是在调用 OpenAI 的 API,从 GPT-3 开始就跟他们合作。但是当时发生这个事情后,创始人当然就觉得有点不安全,不知道 OpenAI 未来前景会怎样?要不要干脆就移到微软的 Azure 平台上?Sam 那件事发生在周五,转天周六创始人就有了这个想法。我和他们说,你们始终都应该去探索其他的可能性。

  接着仅过了一个六日,微软 Azure 平台已经把他们的产品纳入了,也就是说,微软的销售团队能够在周末时间对一个非常早期的初创团队都下这样大的心力。当然了,那个初创公司也非常好,他们在微软选的几百个最顶尖 AI 公司的清单里。所以说只要你是好的公司,即使非常早期,微软也会马上让你纳入,之后产品整合各方面都特别顺畅,完全没有耽误产品的发布。这个公司在下一周,也就是这个周五之后的周一发布了产品 。那时微软在明面上对 OpenAI 还是非常支持的。

  再举一个例子,因为我们在美国投的所有公司都做企业级销售,大家总觉得说 OpenAI 的模型是最好的,但你真的去销售给大企业的话,大企业其实首先担忧的是合规数据隐私,以及你是否理解我公司内部的结构和整合度,其次才是说你的产品和技术是不是最好的,因为有些时候他们也不需要最好的技术。

  骆轶航:尤其要卖 API 的时候。

  张璐:对。所以我经常讲这三个词,Better、Faster、Cheaper,不仅是更好、更快,还有更便宜。微软在价格层面上有空间,它可以打包说你已经是我的客户,给你便宜一点卖。所以这些所有的优势加到一起,OpenAI 想和微软去竞争是很困难的。因此 OpenAI 就要考虑其他的一些路径,比如说现在 OpenAI 内部好像也在说可以给一些特定的行业做专属模型,什么讨论都有,当然也可能都是谣言,它还在探索自己长线可持续的商业模式到底是什么样子。

  《硅谷 101》:Sam 之前投过一家公司叫做 Indent。最近 OpenAI 的安全团队离开以后, Sam 让 Indent 整个团队加入了 OpenAI,但他们不是负责超级对齐那一块的事情,而是负责商业化的。相当于他把自己个人投资的一家公司现在引入到 OpenAI 里面去了,至于商业上到底是怎么运作的,我们就不知道了。

  骆轶航:这也是一个八卦,我看到一些媒体报道和一些人在X上发贴,说现在 OpenAI 的算力资源可能优先于产品和一些功能,而不是优先于模型架构本身的进步。我觉得一个人是有自己的惯性的,Sam Altman 的成名出道起步其实是在上一个周期里边,如果准确的讲,他是 2008 年出道的, 2007 年是 iPhone 诞生,所以他的整个经验来自于 2008-2022 这个周期,他会试图让 ChatGPT 的生态体系像一个 iOS 的生态体系,因为这是一个 2008 年在苹果发布 APP Store 的那一年登上了 WWDC 舞台的人。所以 16 年过去了,我觉得他会本能地想让 GPT store 变成那样一个东西,用那种商业方式,用那种流量去变现,这可能是他本身比较习惯的一件事。

  《硅谷 101》:但是这是不是一个正确的路径?就像我们刚刚提到 OpenAI 现在的护城河,大家还是认为是技术?

  骆轶航:模型是模型,产品是产品,这是不存在的。模型即产品,产品即模型。什么叫 Technology Product Fit?这俩东西不是契合不契合的,这俩东西就是一体的。

  《硅谷 101》:因为我们之前一直都觉得 OpenAI 是一个上升期的明星公司,是做 AGI 最有希望的一个公司。你们觉得所有这些对 OpenAI 的争议,是从什么时候开始的呢?

  骆轶航:刚才我讲说 OpenAI 一直享受着作为一个初创公司和创新者的流量红利和舆论红利,但是我老觉得刚刚过去的这两周其实是它的一个 turning point。大家意识到你的问题很多,而且是非常深层次的结构化的问题,另外你已经在市场上处于很领先的一个位置,大家普遍认为你现在是一个领先者,甚至某种程度来说你是一个主导者。

  所以现在我们应该把 OpenAI 看作是一个只有六七百人的人工智能巨头,而不是只有六七百人的创业公司。因为它成长的太快了,人们开始用过去一年看 Google 的方式来看它了,尤其是现在当它放慢了脚步,比如 GPT-5 可能拖得更久一点,比如之后某一次小发布也许出现一些小问题,人们的质疑可能都会变得更多。

  张璐:一方面 OpenAI 的很多问题也不是现在才有的,而是之前的一个累积,包括架构、内部团队的一些矛盾路线之争等等,毕竟做学术的人对 AGI 的定义和做产品的人对 AGI 的定义也都不一样。但是即使如此,OpenAI 也一直是把 AGI 作为一个目标去做,所以我觉得这还是一个预期管理的问题:现在大家对你的期待是你可以更快去到那个目标,而不是专注在现有的模型上去赚更多钱,你的预期管理让大家觉得和自己的不一样,失望了,那自然就会回头看到它还有一些其他问题。

  但另外一方面这也是 CEO 的问题。就像刚才说过的,Sam Altman 确实有他的优势,他非常会融资。对于像这样的一个初创企业,这么多的竞争对手,他确实在融资这个技能层面上可能是最顶尖的创始人,而且在品牌和市场方面都做得非常好,但是你光有这些是不够的,这些东西会让你发展得更快,但是你的基础还要持续往前走。

  作为一个 CEO,你是不是花时间去做内部管理了?是否花时间去调和团队之间的矛盾了?公司最优质资产就是人才、产品和模型,你是不是在对的路线上去发展,还是说在这个非常关键风雨飘摇的时刻,你的精力和时间分散到各种各样的地方,却没有集中到最重要的事情,没有专注在解决公司的最主要矛盾上?这可能是一个 CEO 需要反思的问题。

  大模型的价格战:创业公司的鸡尾酒分层大打法

  《硅谷 101》:现在好像很多人开始选择用别人的 API,然后给一些特定的行业做一些 fine tuning 或者专属小模型,大家的心态是怎样的呢?

  张璐:去年开始我们就在各种场合都表达了对开源模型的看重,初创企业去做模型优化和产品创造现在有很多样的打法,其中一种我们觉得比较成熟的,是像鸡尾酒一样的打法。

  它的底层可以去调用 API,上层放一个开源小模型,在这开源小模型的基础之上,用高质量的数据或者产业数据、客户的数据去进行模型优化和模型的个性化。比如底层用 GPT-4,突然间出了5,没关系那就只换底层就好了,上面的模型优化还是自己原来那部分,或者说你觉得 Anthropic 的模型更便宜,那我就换一个底层模型就好了,并不影响上面优化好的模型。

  骆轶航:好像 Perplexity 就是这么干的,下面接了一堆模型,并且 GPT 用的不是最先进的那个版本,上面有一个自己的一个小模型再加上它的搜索引擎,然后又把这个交互做得很时髦。

  张璐:不只是他们,我们投了很多种行业专属模型的公司,就专门做行业垂直领域应用的,基本上都是这个打法,而且这个打法的好处是很便宜,在下面你有灵活度,不绑定一家可以来回跳,下面底层又安整。有些时候这个应用场景真的需要用到 GPT-5 吗?不一定,用 4 就够了,因为我的应用场景或产业不需要覆盖所有的问题,对吧?所以上面那个小模型的话,你的参数就可以越做越小。像开源模型,我们有家公司那个模型参数做到十亿 token 以下,这个是非常夸张的一个数字,然后它在树莓派上都可以运行,运行后的表现比 GPT-4 还要好。而且这个打法已经不是说几家独特的公司在用,基本上我看到的很多做得好的、做应用的初创企业,都是这个鸡尾酒打法。

  当然其实还是有很多创始人的做法实际上还是 API 套个壳,这个最大的问题就是你没有自己的护城河,但是像鸡尾酒打法,它的护城河很明确,就是我已经优化了这个小模型,而且这个小模型直接对我下面最底层的模型隐形,它要换成什么不影响我客户对接的那个小模型,或者说你换了一个就让它更便宜或更快了,但是你优化的这个准确度和专业度是由自己的独立小模型完成的。

  《硅谷 101》:我观察到其实中国的大模型已经开始打价格战了,你觉得未来大家到底用谁的这个接口,接谁的 API?价格会是一个很大的影响因素吗?

  骆轶航:GPT 的 API 接口价格从 2022 年 12 月开始到现在将降了 90%。人家是一年半降 90%,中国一天降 97%,我觉得其实大家价格上都在降。前两周,我在旧金山参加一个活动,现在 Snowflakes 的 CEO Sridhar Ramaswamy,也就是过去 Neeva 的那个 founder,他把 API 看作是一个所有人都能用上的东西,他说你永远不要试图从哪个公司的 API 更好来获得你的一个竞争优势,否则创业也太容易了。之后就赶上中国的大模型搞价格战了。我觉得它应该是个拼盘,张璐说的鸡尾酒是最漂亮的一个比喻,如果让我形容它大概是分层。

  张璐:现在这些模型越来越多样,创始人的选择也越来越多。但是从创始人的角度,现在成本还是比较高,到后面一定还是价格为先的,这也是为什么说未来可能大规模的应用确实是需要产业的模型,或者是针对特定产业、特定应用场景的小模型。因为模型小了,耗电量才会低,GPU 算力也会低一些,否则现在对算力的需求确实不太可持续发展。我们现在电力也不够、算力也不够,当然在未来能看到一些新的架构出来,non-Transformer 的架构或者在 Transformer 的基础上做一些优化和调整的架构。

  另外就是这个成本的问题到底在哪?我前阵子跟头部几家公司的首席科学家聊,他说以前可能 20% 的成本是在推理的基础设施这个部分,另外的 80% 在数据训练,现在的比例是 50%、50% 这样的变化趋势。所以后面你会发现训练成本在降低,但是反而是推理成本在上升。

  这也是非常有意思的一些变化。像比如说 Alphafold3 出来了,很惊艳,但是我们在内部看了一些数据和讨论时,发现其实 Alphafold3 有些时候在 CPU 上跑的效能比 GPU 上要高,而且它不是一个简单的 Transformer 的模型,所以我觉得未来还会有很多新的东西跑出来。从这个角度看来,对大的创业生态来讲是个好事情,对于初创企业来讲,它的选择越来越多,成本当然也可能会逐渐降低。你说 OpenAI 的 API 价格降了 90%,这哪够呀?我们需要降的是十倍、百倍以上,才可有显著影响。

  相关补充信息:

  • 小模型:AI 小模型是指相对于大规模模型而言参数量较少的深度学习模型,通常具有数百万到数千万个参数,相比于大模型更加轻量级、易于部署,适合在资源有限的设备上运行,适用于执行简单任务或作为复杂系统的辅助。
  • Humane:由苹果公司前高管于 2018 年创立,于 2023 年 11 月发布首款 AI 硬件产品 AI-Pin,计划于 2024 年 4 月开始发货。
  • Perplexity.AI:Perplexity AI 是一个创新型的搜索引擎,成立于 2022 年 8 月。它基于 GPT-3.5 加上自己的模型对 URL 内容进行处理并输出摘要,可以看作是 ChatGPT 和 Google 搜索的混合体,旨在提供更加精准和个性化的搜索体验。官网:https://www.perplexity.ai/