OpenAI得爆火再次说明了,中国也需要有自主“大模型

  文|云羽

  AI 的讨论并非首次,早在 AlphaGo 战胜人类棋手时,业界便展开了一波关于“AI 能代替人类吗”恐慌性的大讨论,但是,在接下来的岁月里,AI 还没有跳脱出人类一直以来的理解。我认为主要还是由于这道菜的口味太差。一直到 2022 年才会有这一次,AI 不仅能与人类畅所欲言;能快速解答人类所需 10 分钟内解答的问题;能够快速检索到人类大概在数小时内就能够采集到的信息;还能让人类在家里就能够欣赏到自己喜爱的电影,音乐以及其他艺术形式。更能创造出令艺术家们惊叹的具有“创造力”的作品。

  人工智能公司 OpenAI 成为这一激烈讨论的中心。其 CEO Sam Altman 表示:“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性工作。现在看起来,它会以相反的顺序进行。”这场由人工智能引发的讨论,在科技新闻领域已经持续多年。推出 ChatGPT,颠覆人类对于 AI“侵占”整个人类世界。它通过让机器人在人类无法理解的情况下完成任务来挑战人类的智慧和能力。这段肇始于硅谷 AI 的宏大叙述,因参与门槛低,很快就闯进了普通人生活中。人工智能的出现让人们看到了一个新时代,即人工智能正在改变我们生活方式和思维模式,也将带来一场前所未有的革命。ChatGPT 自 2022 年 11 月上线以来,人工智能公司 Open AI 估值已达到 290 亿美元。随着越来越多的人加入到这个领域,越来越多的企业开始关注这一技术带来的改变和冲击。科技巨头们如临大敌、AI 创业公司纷纷摩拳擦掌、一般人和 AI 交谈时,玩得很开心。

  与此同时,一连串的问题又摆在我们面前:

  • 生成式 AI 技术能否掀起与移动互联网媲美的商业新浪潮?
  • 它能否使当前商业格局发生重大变化?
  • 生成式 AI 赛道上,究竟有什么样的商业模式可供发掘?
  • 中国头部科技企业是否已经捕捉到这新一轮 AI 浪潮?
  • 高端芯片被限制中国是否还能开发出属于中国的 AI 大模型?

  腾讯科技与全球科技创新行业专家对话、王煜全,科技投资人、海银资本创始合伙人,据其全年在全球科技产业中的观察和亲自实践,试图解答上述难解问题。在互联网时代,人工智能与人类智慧如何结合?这类问题没有标准答案,但希望通过对行业深度参与者进行多角度的观察,为关心“生成式 AI”的广大读者提供参考,带来了一定的启示。

  01

  AI 的产生必然会受到科技巨头们的关注

  Q1:为什么生成式 AI 会受到科技巨头们的重视?

  王煜全:第一,AI 绘画、ChatGPT 和其他应用应运而生,使更多普通用户能利用人工智能。第二,人工智能技术与人类社会的结合也会产生更多新的问题。美国经济学家 Diego Comin 认为,经济体的实力并不依赖于其先进科技引进的速度,而是要看采用先进科技是否深入。

  例如,互联网在不发达国家得到迅速介绍,但在引进互联网之后,使用的比重较小。因为技术本身并没有改变人们生活和工作方式,而是改变了他们的思维模式,行为模式,以及习惯。技术能够促进社会发展的原因,由于科技能的广泛应用,广泛提高效率或带来新技能,若仅为少数人用之,其提升效率或带来新技能都将是微乎其微。现在很多国家都把注意力集中到了人工智能上,因为它能够提高生产力和改善人们生活质量。因此,OpenAI 比用户谈论更晚更热地进行商业探讨,较少见到,因此,随后人工智能的话题热度不减,就是自然而然、水到渠成。

  其次,生成式 AI 类应用为未来提供了很大想象空间。目前,国内人工智能技术发展非常迅速,但是真正落地到生活中还存在很大差距,这主要是由于用户和开发者对人工智能产品缺乏深入理解所致。在笔者看来,生成式 AI 在模式创新方面仍有不少空间,远远达不到高点。因为我们还处在一个不断变化和升级中,而这正是未来人工智能技术所面临的最大挑战。尽管目前有一些 AIGC 使用方式被探讨,但是,这还远非结束。我们可以看到,随着人工智能技术和商业不断地融合与碰撞,人类社会也发生着翻天覆地的变化。尤其是当年互联网,从早期门户网站、网游、电商,及至现在短视频走红,不断迭代发展。

  世界上第一部采用 AIGC 技术协助制作的商业化动画片《犬与少年》中的动画场景是 AI 制作的

  而且 OpenAI 这一技术凭借其设计模式,可以进行更加广泛地运用,甚至说要做一个更大、更成功的创业公司,这才是想象的空间。

  以前人工智能创业公司及创始人均为人工智能专家,如今已经拥有 AIGC,Chat GPT 等技术,我们也许渐渐就能找到答案,许多人工智能创业企业的创建者都可能并非技术专家。他可以直接跟人工智能行业的创业者沟通。他可以先有一个 idea,那就去找个 CTO,帮他搞定,而 CTO 则更容易找到,由于这些基础技术的发展,帮助他完成任务并非难事。如果你觉得人工智能创业还不容易的话,那么就需要把这个项目做好了,否则很难成功。此时,人工智能领域创业将变得更加积极,即万众创新。在这种背景下,“我”成为了非常重要的一个角色。正因为如此,人们对其进行了热烈讨论,大家会觉得这事距离“我”很近了,除可日常应用外,更重要的是,或许“我”也可以创业,这实际上是在降低创新的门槛,允许更多的人参与进来,将使科技创新加速市场的渗透,能让创新价值得以彰显,这些尤其合理。

  Q2:怎么看老牌科技巨头微软与 OpenAI 合作?

  王煜全:首先是减少算力支出:对于 Open AI 而言,算力的代价非常巨大,所以,其选择与微软的合作,能够显著减少算力支出;如果不合作,那么我们只能把硬件升级到更高的水平才能实现这个目标。二是将来的云计算和人工智能、大数据将被深度融合,而且海量人工智能应用都建立在云上部署,算力亦由云供给。所以,在云上部署一个大规模机器学习系统,必然要有海量的计算能力作为支撑。OpenAI 如果想合作,一定会考虑挑选 3 朵云中的 1 朵(谷歌云,亚马逊云,微软云等),终于配合了什么人?这就是一个比较大的问题。首先,一定要选择最有合作愿望的人,此前,微软一直在 Open AI 上进行投入,还显示出愿意进行合作。

  三是从今后发展的角度,在三朵云当中,亚马逊云客户类型较为单一,以电商客户为主,而且谷歌开拓商业客户方面也做得并不出色,尽管谷歌 DeepMind 对人工智能有深入研究,但是商业化落地的效果不是很突出。所以,我们应该把更多的精力放在商业客户上面。微软在商业化方面做到了极致,并拥有一大批企业客户,今天,微软可以做到“三朵云”之后,在于广大企业客户上云里雾里。对于 OpenAI 而言,它同样是非常重要的,产品与服务能够使顾客最终用得起,付得起,这才是最重要的,能够被广大的用户所采用,然后打开市场就是共赢。

  我们还发现 OpenAI 和微软之间并没有排外。OpenAI 的开放 API,表示创业者只需要 Idea,便可从事有关创作工作了,对于微软而言,它也是一个巨大的突破。回顾微软发展,不是第一个进入互联网行业的人,但凭借全面网络化,却赶上其他互联网企业。值此人工智能大潮的推动,微软的速度还略慢于谷歌云,亚马逊云,但是,目前仍然重新赶上了前一个。现处于三朵云之中,微软隐约有种获胜之势,理由也是直接的,是运用中组合较好。亚马逊是第一个也是谷歌最有技术能力的,但是它们在与应用结合上都没有微软做的那么出色。现在的趋势是融合,而不是简单的叠加。OpenAI 集成到其他应用中,将成为必然趋势,将更多的人工智能与其他应用相结合,使更多人能够享受人工智能所提供的便捷,使更多富有创见者加入进来,整体的行情才能更热闹,因此,在应用方面,它是一个很大的扩充。

  另一方面微软也很聪明,它在 OpenAI 上增加了 100 亿美元的资金投入,但这些投入要求 OpenAI 经过协作,若获利则先向微软分红,以还清投资,更换一部分股份,如果 OpenAI 没有赚到钱,那个微软只占原来的股份,无需创业者赔付。这就好比一个人在创业初期,有了一定的资本以后,再去投资,会比投资以前更划算。多赢了一个图案。

  02、现在的生成式 AI,

  有点类似互联网瀛海威时代

  Q3:生成式 AI 方面,是否已经观察到了逐步明晰的商业模式?

  王煜全:一些端倪。那时的门户网站基本上都是以个人为中心,门户也是个人用户为主,所以当时的门户主要就是提供一个信息服务平台。如今有点类似于互联网刚开始火爆的那年,那时,有一家叫瀛海威的企业,堪称“启蒙”中国普通民众网络意识之作,很多人随着瀛海威进入互联网的世界。现在看来,这个市场已经进入一个成熟阶段,但是我们还没有完全理解这个概念,也不知道它是否能够真正带来价值。但是瀛海威与门户之间只差了一步之遥,门户真正的商业影响远高于瀛海威。目前有些在中间阶段,大家看的仍然是 BBS,起码到不了门户阶段,这意味着也许会出现一个很庞大的新模型,于今明两年问世。

  我们概述了原则,未来最大的模式应该不是叫“AIGC”而是叫“AIGS”,由于C(Content)存在局限性,就算 AIGC 再好也有本事,在C意义上,也许是同组关键词,出了C也差不多,不符合人的个性化需要。所以,我把它叫做“智能化服务系统”,这个系统是要实现用户的个性化需求、让每个用户都成为自己的一部分,从而产生一个新的经济增长点。而真正最重要的价值在于能使其转化为服务(Service),要啥定制啥,如此,每个人所获得的也就不尽相同,每个人的需要都可以得到个性化的满足,也与我们所说的服务规模化时代已经来临不谋而合,在此大规模服务,指的是“人工智能的服务”(而不是人的服务)。因为人工智是可以被复制的“服务规模化个性化”。

  高端服务以个性化为特色,第一,“我”给“你”量身打造,因此被称为高端的,并且应该是设计出来,内容应表现出一定复杂度。其次是产品本身必须非常好,这个东西可以让用户体验到很高的价值,这也是高端的一个标准。正如 ChatGPT 和您的交流一样,正如 ChatGPT 写的那样,都够复杂度够了解自己。

  例如 2022 年 11 月 28 日,26 岁的纽约华艺人米歇尔·黄(Michelle Huang)微博微火。在过去几个月里,她和她的朋友们每天都会通过微博分享他们生活中一些有意思的事情。她将 10 年日记上传到 GPT-3,培养出一个 AI 分身小米歇尔,并且把她们聊天的截图在微博上面,消息一经公布,引起了人们相当大的兴趣,一周的时间点赞量已突破 5.1 万。在这期间,她还通过这个系统与朋友们进行了互动,获得了不少点赞和评论。聊天内容很治愈,米歇尔·黄把这种体验描述得如同镜子,帮助她重拾许多她身上不曾变过的,还使她找到许多已失去的东西。她说,在她和朋友的生活中,“我们每个人都拥有一个数字化的大脑,这个大脑可以用来管理我们所有的信息和想法,而不是去思考那些事情”。这好比是一个真知己,按理说,知己是能够自我疗愈的,做“我”的毛病,委屈,难处,知己对自己的认识,远远超过了我,那么,将来这个“数字分身”也许会成为服务,而其特色就是“你”以个人资料来养活,你会对自己的个人形成深刻的认识。

  用户所需要的从来不是产品,而应该是服务,这是时代的要求,所需服务规模化,由于人工智能的出现,机器人的出现,企业规模化服务能力可以实现个性化,以“我”之能,解“你”之需:怎样能个性化的与客户进行交互,如何在这种个性化互动的进程中,能够提供高端服务,也许将来生成式 AI 方面具有很大的商业潜力。

  Q4:生成式 AI 在应用方面的探索仍以“科技圈”和具备专业技术者为主,是不是说明普及门槛还相对较高?

  王煜全:我想,这并不涉及技术门槛。如果没有足够高的起点和能力,很难达到这个目的。任何事物总有一个过程,技术人员自身也更接近新技术。另一类是那些已经开发出了产品的用户,这部分人群在过去的一段时间里都有一种习惯,那就是不喜欢别人用自己的产品来替换别人的产品。20 年前,硅谷一位非常著名的营销专家 Jeffrey Moore 提出了,提出了“跨越裂谷理论(Crossing the Chasm)”,他将市场上的人群分为 5 种类型,最领先的那一类人被称为创新者(Innovator);另一类是早期采用者(Early Adapter),他们尤其愿意申请新产品,采用新产品的两种人群都是高科技产品最早的使用者。

  这两种类型的人会对新鲜的东西马上用上,也许此时的产品体验存在较大的缺陷,但他们并不惧怕使用,看准了新功能,新能力。这也正是高科技产品快速发展的原因所在。因此,许多高科技产品一经推出,市场便出现了快速增长,是因为这批用户。

  但后一个主流用户却被划分为前期主流、后期主流与拖用户后腿,后三种用户与前两种用户行为习惯截然不同,他不因你有新功能而用你,而是要看看自己的使用体验是否获得了满足,是否惬意。所以说,要想让主流用户使用我们的产品,首先就要了解主流用户的需求。怎样使主流人群使用“你”这个应用程序,这是首要问题。所以,在发展过程中,我们必须要注意,不要让那些主流人群觉得你做得不好。一些高科技公司,取得第一波高速增长时扩产了,其实并没有被主流人群所接受,此时扩产其实会加快企业财务问题的解决,甚至会出现企业破产的现象。

  所以说好的 CEO,往往都是 Early Adopter(早期采用者)。他是互联网时代最重要的创始人之一,在互联网领域已经摸爬滚打多年。他未必能成为创新者,比如,马云并非创新者,互联网并非他所创造,但他却是较早的采用者,他深知,互联网的好处是,“你”可以上网搞电商,不过,他也明白,互联网的弊端在于电商没有信用证明,于是,后来,他就创立淘宝,通过淘宝先学习 eBay 模式,在实践中,我们发现 eBay 并未解决诚信问题。于是又提出“第三方支付”模式,将平台作为买方和卖方之间的中间媒介,在这个过程中,买卖双方进行交易并收取佣金,平台负责回收佣金。为解决诚信问题,支付宝应运而生,以平台为第三方的中间人,待买方证实后支付,这种模式就很好地解决了诚信问题。

  因此,阿里巴巴之所以能在以后取得成功,并不在于其技术有多领先,但由于其技术应用的应用痛点得到解决,这种情况很平常。现在很多企业都在做一个非常重要的事情——让技术落地。为什么多数人没有“马云”,由于首先接触到科技的,通常都是技术人员,而且多数技术人员都会用到技巧,不会解题,将问题技术转化为推广。

  谁能做到?属于非技术使用人群。在他们无法用科技来解决问题的时候,不得不找到解决问题的方法,那时“你”就可以解决问题了,具有普及性的特点,因此,在用户表示由于 OpenAI 技术并没有特别大众化时,因此,被热烈讨论的首批人士肯定是技术专家,但是,目前已出现大众化苗头,由于许多热烈讨论者不再是技术专家了。

  因此,OpenAI 旗下 ChatGPT 已为大众降低了很低门槛,此时市民又不会用了,不在于有没有门槛,但由于多数市民并不知道要跟上前沿科技的步伐,不知作为早期的采用者,不知实时感受运用,只是感觉这远离了“我”的存在,由于技术在一般人看来,容易下意识地以为“搞不懂”,其实,这个问题并不真想不通,而是观念的问题,是心态。

  问题将逐步逆转,当有成功的事例出现时,在公众看到应用能够如此运用的真实案例时,做一个非技术人员,同样可以玩技术,多了一批人加入,因此,起码现在觉得不再是什么技术门槛了。

  03、一些专家纠缠 ChatGPT“有无技术突破”,实际上是揭露无知

  Q5:AIGC、Chat GPT、AlphaFold,人们常常把它合在一起讨论,他们能否划入同一类创业方向,是否可以称之为“AI+”?

  王煜全:我想是有的。它们是 AI 能力的输出,当然,AI 还有N个功能,可进行文字输出,可进行图片输出,可进行音乐输出,还可进行内容修改,优化内容,因此,生成式 AI 技术大潮中,将产生各种新的功能,这些特性将作为能力来提供。

  任何一项新技术取得突破之后,都必须进行一轮模式创新,使技术突破这一优势得以充分发挥,而模式创新的前提是要解决“技术易于获得”的问题,因此,目前我觉得 OpenAI 表现得尤其出色。我们现在使用的很多技术是比较成熟的,比如人工智能,大数据等。但是 AlphaFold 等人也很相似,坦白讲我认为它们确实有欠缺。

  OpenAI 要使用其云端,就必须与微软谈论合作,但是 Google 自己也有云,在这一方面,Deepmind 具有较大先天优势,并其科研成果先进。如果你想了解什么叫“智能”,就得先了解一下“人工智能”。但能够使普通用户普遍调用的应用程序基本上是不存在的,就连当年围棋高手 AlphaGo 也应运而生,但是很多人都没有发现 DeepMind 对推广的贡献,于是兴起了一股生成式 AI 热,笔者以为,其核心是要看到人工智能在一些功能上取得了新突破。现在我们要做的事情很多,其中一个就是把现有的技术进行整合,将一些功能重新定义为可操作的东西。余下的任务是怎样使功能得到广泛应用,拉动了应用大面积推广。

  Q6:有专家认为 ChatGPT、GPT-3 没有技术创新,最底层还是 Transformer 语言模型,怎样看待这一认识?

  王煜全:当互联网刚刚火起来的时候,还有人认为,互联网并不意味着技术创新,最早的技术创新是 Tim Berners-Lee(蒂姆·伯纳斯·李,世界互联网发明者),为公众利用互联网作出贡献。现在看来,这并不能说明创新就是技术进步或新事物出现了。对于大众而言纠结于技术创新没有太多的意义,关键在于利用。现在很多人都在谈技术创新,我觉得这个事情应该说是一个很有意思的话题。探讨此事固然有一定道理,原因何在?因为技术创新是个非常重要的概念。我们应该明白,何谓技术创新,由于强调创新是端到端的创新,来自实验室的研究开发最终应得到大众的广泛应用,真正优秀的创新,并不在于你能给公众展示有多酷,而在于它能得到广泛应用。

  许多优秀技术在专利到期时,在无任何新技术发明突破时,有的发现了应用痛点、在解决了应用痛点之后,由此形成了推广。比如,我们看到的一些技术突破就是这样的一个过程,但是我们也应该看到,很多技术发明出来以后,很快就会被市场淘汰掉。例如特斯拉在技术方面取得的突破?就是用了一个非常普通的电池,把它变成了电动汽车。锂电池并非是其所发明,电池组管理在许多情况下是不成其为技术的,我们能找到特斯拉赢得了生产,批量制造仍可维持廉价、产品体验非常不错。“专利”这个概念是一个比较宽泛的概念。但是,制造可以升级,同样属于“技术”范畴。如果没有技术,那就不叫技术了,甚至可以说是“专利化”的结果。因此,我们不应片面强调“专利”是一种技术,“应用创新”,同样是人类经验和知识的累积,“无法专利化”经验积累在某种意义上更为重要。在一个产业中,如果有大量的人参与到创新活动当中,就会出现大量的“创新”,但是这种“创新”往往被认为是技术问题,而不是商业问题。多数革新的推广,发明人为一群,走向市场,又多了一群人,在产业界常态下。

  如果一定要纠结于“是否确有技术上的突破”,那么,科技创新这一过程就应全部由科研人员承担,但是事实上,科研人员完全不善于把科技创新向公众普及。科学家最主要的工作就是把科技成果变成商品,通过市场销售出去,让社会认可。他们善于创造新事物,但新鲜的事物应该得到社会的认可,要 Early Adopter(早期采用者)去发现,找到使用过程中的痛点问题再解决问题。所以说科技创新本身就是一个漫长的工程。新技术的出现和原理上的突破都是 Innovator(创新者)所为,像那年锂电池的问世,它装车续航仅 100 公里,要求工程师,技术人员做好性能调优工作,最终能得到社会的认可,这一切并非科学家们能够做到。

  真正做到了为了科技向社会普及,作出最重大贡献的并非科学家,而是一个科技企业家。因为他们有能力把科技成果转化成生产力。例如,马斯克虽然不是技术人员,但却是 Early Adopter 的学生,他了解电动车是如何制造的,为了使社会得到普遍的认可。他也不是工程师,但他能把很多科技成果转化到现实中去。作出这一断言的那些所谓的专家,正是揭露了他们的愚昧,不了解科技创新怎样向社会普及。很多人认为科技创新可以用科学家来推。他认为,只有科学家才有效,实际上还不够,唯有科学家的一句话,一大批科研成果,将被困在高校而不能为社会所采用。

  马斯克有时会张开嘴,但有一段说得好,英文有个词叫“Rocket Science”,但是没有“Rocket Scientist”,由于火箭原理早已经发明了,Space X 之所以能取得成功,并非建立在科学上取得了突破性进展,而是建立在对科技的改进之上,提高性能调优,完成这一切被称为“Rocket Engineer”,真正促使火箭得到推广的,并非火箭科学家,而是火箭工程师。如果一个公司能把所有的科研成果都应用到商业中去,就一定会带来巨大的经济效益。科技企业也是如此,就这个意义而言,OpenAI 作为一家标准科技企业,科技不一定就是其独创的,却能实现大幅度推广,正是应归功于 OpenAI,使科学家们的研究结果不至于付诸东流,能为社会所采用。

  Q7:有人断言:“这些与 Transformer 相似的基础模型就是将来通用的技术,像蒸汽机,印刷机和电动机一样,这句话是否正确?

  王煜全:关键是如何认识 Transformer,其自身并不具有通用智能,因其并非无所不能,为通用训练模型。

  一,问题的提出过去对于每个领域中的人工智能都应该首先构建训练模型,接着进行培训,建立一个训练模型最困难,一定要由人工智能技术专家来完成。其次,以前人工智能的训练模型都是在特定环境下使用才有效果,所以不能通用。而目前的训练模型,就是只需要使用不同的数据进行训练,便可以变成不同的“专家”,但仍不够普遍,意为利用围棋来培养,是围棋专家,以象棋培养之,是象棋专家。如果你是棋手,你可以通过这个机器来学习棋艺,但是它却无法学会下棋。培养其下象棋的能力,就不下围棋了。所以人工智能训练起来有很多困难。不过,至少门槛已经下降,训练工具相同,因此,Transformer 值多少钱,门槛得到一定的降低。

  二是在使用通用训练工具对通用数据进行训练之后,供公众使用的技能,就是今天的 GPT-3,其每年都要就互联网上所有数据进行培训,在培训结束时,所有的问题都已得到解答,相当于其把互联网作为大数据的集合,这句话尤其神奇。

  人的核心价值体现在我们聚集,分享,继承知识。知识的汇聚、共享和传承也就意味着知识创造能力的提升。我们提出的是“积木式的创新”,人类的每一次创新,都如同一个崭新的积木,怎样把积木叠放起来,就构成了一种新工艺,即依靠知识汇集,分享与传递。这也就是为什么今天大家都要谈“知识管理”这个话题的原因吧!我们本来有一项研究就是竞争情报、Competitive Intelligence,其中之一就是这样,在人类知识中,隐性知识占绝大部分,在一个人心中存在并不外显。这个概念提出后,人们认为知识都是隐形的。但有 PC 后,人类知识加速显性化。因为计算机可以把文字转化为声音、图像等形式,并且能让人们随时通过电脑看到、听到、想到、操作等等,这使得隐性知识得到很好地传播与分享。以往,人类都是以“写书”来进行创作,开展知识显性化相对缓慢,并常有图书馆烧毁这样的事。现在互联网出现以后,人们可以通过电脑来写作和阅读信息,这就大大提高了人类知识显化的效率。但进入互联网时代后,人类以网络为载体进行记录,隐性知识的显性化速度明显加快。

  OpenAI 能够自动地去产生一个段落,它并非新产生,而是互联网整体知识的精炼,到目前为止,人工智能并不具备创造力,人工智能并不能产生新的知识,人工智能仅仅是为了更好地将旧知识进行整合与展现。我们要学习人类的智慧,而不是被机器复制,这是一个大问题。即没有人的认识,那 GPT-3 就是“傻子”。人类大脑怎么会有如此强大的能力呢?为什么会比大家更聪明?因为它学习了人类最伟大、最经典的智慧。其下围棋何以能够赢得李世石的胜利?因为人类所有的棋手都是通过学习和训练才成为高手。由于人类一切围棋经验都集于此。

  Q8:AI 在将来得到大爆发、大推广,其核心在于模型,或者大数据?

  王煜全:当然,都是要有的。互联网在过去十几年中取得了巨大的发展。但是最重要的还是全民认知问题。所以我觉得人工智能应该成为一个时代的主题,这个时候大家都会用人工智能来做事情。我们发现,互联网以后的兴盛,有赖于公众对于互联网认识的日益充实,应用日益推广、参与人数不断增加。目前至少 OpenAI 已经建立起一个先例,向公众展示人工智能能够出现的“新玩法”,每个人都能感受到人工智能的应用,但是经历的时候目前仍然是规定动作,即自然语言问答,今后,自选动作或许还会增加。

  于是,我有了一个认识,模型固然重要,大数据也非常重要,但更为重要的还是要全民去利用,去尝试,去创新。因为人人都在用这个系统来做事情,人人都可以成为创业者、发明家,甚至成为科学家。门槛下降之后,每个人都有条件去创新。如果人人都能成为发明者,那么我们就可以创造出一个新时代。便由量变转化为质变,在人类中,聪明人总是存在的,许多科技发明、应用的产生,并非是一种目的明确的发明,但却在某天某人“灵光一现”。如果没有人的参与,这个过程就不可能持续下去。当公众共同投入这奇思妙想的盛筵时,将产生更加有趣的效果。

  04、高端芯片受到限制,

  我国是怎样开发出属于我国的“AI 的大模型”的?

  Q9:如何看到国外的“大模型”的开源,为什么我们现在没有一个自主大模型?在国际上,“大模型”有哪些特点和发展趋势?我国是否有必要开发我们的“大模型”?

  王煜全:中国需要构建属于自己的大模式。一方面,中文的环境与英文有所不同,在中文环境下,中国自己成立,将取得更优异的成绩。另外一个方面就是在这个基础上进行国际化,这对国内学者来说可能比较困难。第二,大模型的构建本身并不困难,事实上,在有关学术论文公布之后,基本上懂得如何执行,因此,不外乎就是怎样练习这个问题。

  关于大模型落地的效果,部分是由于前期投入,云计算付出了很大代价,考验投资者与企业家胆识。所以现在大家都在谈这个问题,大模型到底怎么搞?中国本身的大模型是可以做到而且有必要做到的。我个人觉得现在的大模型还不够成熟,但是可以说已经开始了一个新阶段。我想,到目前为止,中国之所以没能做到,并不在于能力,也并非是模型自身出了什么问题,是因为我们的开放性问题,更多的时候是不想公开的,而没有开放,正是无法前进的核心理由。

  在早期的 OpenAI 中出现了各种各样的玩笑,出现了种种蠢事,却揭露了愚蠢,揭露错误,慢慢地改正,会变得更好的。比如,当你在一个人面前说话,说错的话是可以理解的。但是害怕说错了,也不会开口说话,那么,人工智能是无法学习语言的。如果人工智能不会说话,那他就无法学习,也很难成长为一个优秀的人。仿佛儿童学语言一样,说错话的多,但要改正,他缓缓地说好。这里面有一个非常重要的环节,就是要让人工智能知道自己的优点和缺点,然后根据这些优点进行改正。人工智能最突出的特征,在于其在研究中不断完善,尤其重视反馈。在人工智能领域里,我们一直有一个非常大的共识——我们必须要有一套好的技术平台来支持,才能够使我们真正走向产业化。OpenAI 实际上是惊人的,他向每个人无偿地提供了各种工具,让每个人都去进行各种各样的尝试,甚至在前期顶撞不少骂名,但从这一过程来看,是不断走向成熟的。所以我们现在还需要一个大环境来支持。中国产业头部企业缺乏开放性,不甘心将实验室成果公之于众。所以开放是一个趋势,开放后的结果可能比以前好一些。一方面是免费开放,算力成本将增加,就得掏钱让市民自由使用;另一方面,用户也可以通过第三方平台分享自己的产品和经验,帮助你改善产品性能。但实际上恰恰相反,大众还会帮助你磨平产品完善性,以众包形式帮助您改进产品。

  此外,还有被称为 IT 传统。这个开放的传统,也有其局限性。OpenAI 自身就是建立在整个 IT 基础上的开放传统。其实这也不是什么新鲜事儿,但是在这个时候,很多企业却没有意识到它的重要性。长期以来,总有(企业)的人挺身而出,登高一呼“你就用它”。中国的这一开放传统,相对而言要薄弱得多,业内没有一家公司挺身而出,登高一呼,却闷声独自钻研,与他人合作性相对薄弱,因此导致我国普及性要逊色许多。

  OpenAI 热度之高实际上也为中国头部科技企业敲了一记警钟,事实上,我们这些头部企业正在做着,但人们喜欢把它放到幕后去做,弄好了再显摆。因为大家都知道,如果没有这些技术支撑,就不容易有新产品出现。但老百姓不能参与,“藏于深闺人未识”高科技到头来却有可能落后,唯有每个人广泛地参与到你们黑科技的打磨中来,为了构建更加丰富的业务模式。“互联网+”时代,我们要把自己打造成一个平台,而不是做一些小项目,做一个产品。以 OpenAI 为基础的创业,慢慢均已初具规模,多了许多商家都特别想看的境界,以本人平台为依托,开创事业,我这个平台才会充实,才会积极。我认为,现在我们做的项目,大部分还是基于底层技术的应用和落地。可谓是我国头部科技企业错失第一波行情,还是晚半,能否尽快赶上,我认为这很重要。

  Q10:怎样认识开源?OpenAI 开源是否能类比安卓开源?我们可以看苹果生态其封闭,但在苹果这个平台上,还长有多种用途。

  王煜全:“开源”和“应用功能的自由调用”是两回事,我们实际上更加关心的并非开源问题,但自由调用功能。我今天想跟大家分享一个很有意思的问题,为什么现在越来越多的人愿意用开源软件?是包含了目前大量应用 OpenAI,实际上并不建立在开源的基础上,您可以把构建 ChatGPT 平台看作一个建立在开源基础上的方案,但是在搭建全过程中,会出现大量 knowhow 现象,因此,许多企业都没有将整个 GPT 是怎样构建起来、怎么操作 knowhow 发布了。

  那么严格地说,ChatGPT 平台并不开源,不过,这并没有影响到我对它的大量运用,等于众所周知苹果的平台是不会开源的,但是,并不影响大量应用的存在,只需满足 2 个前提。首先要有用户的数量,第二个先决条件是能让开放调用的功能,在用户充足的平台上进行功能调用,以达到应用的目的,则足以使用户获益。

  那么,其开放性已经够了,因此,我们实实在在地强调开放性,而且不必非要强调开源不可。开放是相对封闭而言的,在一个开放环境下开发出来的东西才是开放的,才可以让用户使用。开放性目前含义比较大,称为开放调用,更有开发者可以去呼叫,将平台功能转化为其应用部分,该平台的作用实现了现实的价值,那么,更多的一大批开发者将积极地在他们的应用程序里植入您的特性,这便建立起来。

  Q11:中国高端芯片受到限制,而开发 AI 大模型,则需要大量算力作为支撑,是不是也封中国 AI 行业未来的发展?

  王煜全:目前,市民中存在着两种声音,一个声音是中国芯片落后,还有一种声音,那就是我们要在芯片上独立自主。这两个声音其实都是针对我国的芯片现状而言的。自主创新芯片产业的口号已提出 20 年,其间进行了多种尝试,最终的结果不尽人意,加之伴随中美贸易摩擦愈演愈烈,另一方使用封锁手段。这两种情况下,我们要想摆脱这种不利局面,就必须从核心技术上有所突破。近 20 年来的种种创新努力均未打破美国在中国芯片卡脖子问题上的局限——高达真相。

  导致这种状况的因素有哪些?这是因为在芯片制造技术上存在差异。美日荷联盟的原因?由于美美荷的提前结盟,不就是现在的联盟吗。纵观芯片产业的产生之初,美国占据了主导地位,日本少数公司,荷兰 ASML(阿斯麦)和少数欧洲公司参加。科技创新是需要长木板才能支撑的。其中涉及科技创新木桶理论问题。众所周知,传统木桶理论提出,企业不可能存在短板,后也谈到新木桶理论,企业应有长板,再配合别的长板,而芯片产业的整体生态是在六七十年代才得以确立的。

  任何一个新生态的构建初始阶段,没有一块长板就是一块短板,但是问题在于,创新生态之初,合作发展需主动参与,尽管是短板但在与别人合作的产业发展过程中各个短板逐渐的演变成长板,最后一块木桶长板长在一起,没有东拼西凑。

  由此我们可以看出,中国现在为什么要在芯片上做出突破是特别难的,因为别的国家的公司都是在合作中发展起来的。为什么荷兰要听美国的?就是经过长时间的合作,互通有无,乐于相互合作,利益保持一致。现在问题是,我们怎么利用短板,和别人一起成长?我们必须先把自己的优势发挥出来。一方面是理论的自主创新,慢慢地解决这个问题,但是速度可能较慢,由于创新还需要全行业生态合作来实现,若仅是其中一环,其他协作方不予合作,那么,创新突破将是极其困难的事情。

  哪里是机遇?过去几年,我们经历了互联网+,移动互联网,大数据,云计算等技术革命,这些都推动了芯片行业的变革和发展,而这次弯道超越则会更快。芯片产业发展的时间不长,但芯片产业发展至今,已经发生了新一轮革命,上次的科技革命还没追上,但是,下一波科技革命,我们应该引起重视,因此,说弯道就可以超车了。人工智能的弯道到底有多大呢?现在,我们尽管慢下来,但不必郁闷,由于弯道较多,弯之一是人工智能。从硬件、软件和算法都会发生改变。人工智能弯道都有哪些特征?人工智能的发展需要从底层技术入手,但底层技术并不容易做到,必须在顶层设计上进行创新才能解决这个问题。其生态比较复杂,较少单纯。在摩尔定律中,每个处理器都需要处理不同类型的数据、指令和算法,但每一类又会出现新的变化,因此也就产生了很多异构性。以往为单芯片计算,必须遵守摩尔定律,现在我们常说“摩尔定律无效”。例如,各家公司都推出了 SOC(系统级芯片),在一个芯片组中包含了N颗 CPU、N颗 GPU 甚至 GPU,因此称为异构计算,具有通用计算单元与专有计算单元两种,而专有的计算单元也在差异化。

  例如,手机上专门用于图像处理的,具有计算单元,专用于视频处理的又一计算单元,因此,形成了一个通用带几个专用结合在一起,该结构大大提高效率,使能耗减少,因而对计算速度要求不高,才能取得较好的成绩,它还意味着,对单芯片能力的追求方面的需求能够减少,要么单芯片最优,要么综合最优,从而使我们国家单芯片的不利地位能否得到补偿?

  另一方面,中国的优势在哪里?这也是人工智能技术发展的方向之一。能使得更多大数据应用主动去与人工智能相结合,特别是现在,系统芯片具有算法固化等特性。自动驾驶技术的出现改变了世界经济格局。从理论上看,针对某一个产业对产业数据进行专门的培训,获得了优化后算法,然后将算法凝固在硬件上,芯片上,利用凝固的芯片来解决现实中人工智能的问题,将是更好的选择,其中以自动驾驶芯片的应用最为典型。因为它拥有自己独特的一套体系。特斯拉为何要独立研发驾驶芯片?究其原因,自动驾驶中遇到的问题都比较特异,若使用海量自动驾驶相关数据进行培训,进而获取对于自动驾驶进行优化后的信息,这样做效率最高。

  中国怎样弯道超车?在系统芯片进行异构计算的今天,能呼吁有资料的组织参加预训练,再和具有芯片计算架构的企业进行深入合作,这类芯片制造水平并不一定最佳,但是芯片训练出来的模型才是最优秀,最后,总体 SOC 芯片系统输出能力最高,还有获胜的可能。

  一方为芯片企业,一方为人工智能企业,一方是应用能够产生大量数据的应用企业,能有较多数据训练模型,并最终凝固在硬件上,那么,中国将转败为胜。这就是人工智能在未来的发展趋势。在自动驾驶行业中能够看到最为清晰的一面。自动驾驶是一种基于计算机视觉技术的无人驾驶技术。在自动驾驶行业中,主要存在三种类型的公司,第一类为自动驾驶整车企业,生成车辆,并在道路上生成数据。第二类是无人驾驶系统和算法,产生软件或者硬件,然后形成一个完整的自动驾驶体系。另一种为芯片公司,第三类则以人工智能公司为主。这三部分企业分别以不同的方式进行自动驾驶研究和开发。自动驾驶的研发公司靠的是硬件,通过对硬件软件系统进行数据训练,使自动驾驶能力得到了提高,最终真正能达到自动驾驶能力够出色的效果。自动驾驶技术的发展需要大量数据支持,所以数据成为了自动驾驶最重要的资源之一,也就是所谓的“大数据”。自动驾驶在人工智能中具有示范性,这一格局应存在于所有行业领域,凡是拥有充分资料的行业领域,均应将其作为一种范式,那么,中国很可能会转败为胜。

  笔者以为,这无异于中国在众多行业数据应用企业参与下,从系统芯片水平上帮我们取胜,不要在 7 纳米的范围内纠缠,大概 48 纳米也足够了吧,绕过单芯片之死,也能使应用普及,在系统芯片中做到与应用深度融合,形成了以数据优化为核心的算法,固化在芯片行业解决方案上,在这轮芯片竞争中,它将成为竞争的焦点。