拆分平头哥,阿里在犹豫什么?

文|光锥智能,作者|周文斌

大厂造芯已经逐渐进入第二阶段。

5 月以来,阿里巴巴旗下芯片业务平头哥多次被传将被拆分独立融资。11 月 3 日,阿里智能云总裁张建峰在 2022 年云栖大会上再次回应,对拆分平头哥仍持开放态度,“我们今天没有说不融资,也没有说一定要怎么样,我们在探讨一定的可能性。”

继百度将昆仑独立之后,阿里是第二家计划将芯片业务独立的互联网公司。

芯片业务独立背后,有几个主要的推动力。

推动力之一,来自于芯片业务的逐步成熟。

在今年云栖大会上,平头哥公布了许多重要的成果。比如,将 Android 10 移植到 RISC-V 芯片上,并开源了全部相关代码;倚天 710 成为中国首个云上大规模应用的自研 CPU,以及发布全新 RISC-V 高能效处理器玄铁 C908 等等。

推动力之二,在于内部人才的激励。

据晚点报道,自去年 10 月平头哥发布倚天 710 以来,市场上就突然涌现出十几家 CPU 创业公司,其中多数都拥有平头哥背景。

例如去年下半年成立,今年 5 月获得 6 亿A轮融资的启灵芯,其核心技术人员林葳(Wei.L)就来自阿里平头哥美研,为前阿里 P10。

去年 8 月成立的鸿钧微,在今年 5 月完成近 8 亿人民币 Pre-A 轮融资,其 CTO Daniel Chen 曾担任平头哥 SoC 研发总监,参与倚天 710 的研发。尚未浮出水面的还有西芯,其核心人员也参与了倚天 710 的研发,如今也在接触投资人。

这些人员的流失,一方面是因为目前正处于创业热潮的芯片行业并不缺少热钱。另一方面也来自于芯片从业者并不适应阿里互联网式的管理方式。

此外,独立融资之后,可以大量获得外部资金,缓解芯片研发的高额成本。

几大驱动力在前,独立似乎应该箭在弦上。但平头哥独立融资一直未定,阿里巴巴在犹豫的究竟是什么?

01 阿里造芯,自用优先

平头哥借助阿里云业务兴起,人们一直将其与华为海思相提并论。

两者都是母公司的重要战略补充,产品都主要围绕着母公司的业务需求展开。

在海思的产品阵列中,除了因为智能手机被人们所熟知的麒麟系列之外,还有以巴龙系列为代表的基带芯片,以天罡系列为代表的通信基站芯片,以昇腾系列为代表的 AI 芯片;以鲲鹏系列为代表的 PC 及服务器芯片等等。

而平头哥的首要目的也是为满足阿里自用。截至目前,阿里平头哥已经形成了玄铁、倚天、含光、羽阵四大系列。

首先是玄铁系列,这是平头哥最早推出的 CPU 芯片,其第一款芯片是玄铁 E902。从成立到发布,这款芯片只用了 9 个月,但更重要的是,它是一款基于 RISC-V 构架的芯片。

作为第一款芯片,玄铁 E902 性能并不高,能够拿得出手的只有基于 RISC-V 构架的低功耗特性。但正是 E902,开启了平头哥在 RISC-V 的大门。

在刚过去不久的云栖大会上,平头哥发布了最新的 RISC-V 处理器玄铁 C908。相比上一代 C906,玄铁 C908 在图像分类任务中性能提升了 3.5 倍;典型神经网络计算性能提升 50% 以上,较业界同性能处理器能效提升超 20%。

玄铁 C908 的发布,意味着玄铁 RISC-V 处理器已经形成了分别面向高端复杂计算场景、低功耗低成本场景以及高可靠、实时处理场景的体系化产品矩阵。

当然,这一次更重要的信息,还在于平头哥将 RISC-V 架构引入安卓开源生态体系,这意味着 RISC-V 正式与全球主流移动操作系统生态接轨。目前为止,从端到云,平头哥完成了 RISC-V 与 RTOS、Yocto Linux、Android、龙蜥、统信等国际主流和国产操作系统的深度适配。

通过平头哥依靠玄铁系列在 RISC-V 架构上的布局,我们其实也能明显地看到,平头哥并不想一直只为阿里一家公司服务,而是已经将目光放到了更广阔的半导体市场。

倚天系列目前只有倚天 710 一款芯片,发布于去年 10 月,这是一款应用于数据中心的 Arm 架构的服务器 CPU。

要知道,过去 CPU 市场一直泾渭分明,在手机等移动设备上,CPU 追求低功耗,并一直被 Arm 架构主导;而在服务器和电脑 CPU 上,要求的则是多核心和高性能,应用的一直是英特尔的 x86 架构。过去 20 年里,云服务器 CPU 市场一直被英特尔的 x86 架构统治,市场份额甚至一度超过 90%

在国内,服务器 CPU 是最后空缺的一块,一直也没有大厂在这方面有所作为。所以倚天 710 的发布,其实是补齐了国产 CPU 在云服务器领域的最后一块拼图。甚至于,以倚天 710 发布为起点,国内半导体还掀起了一波 CPU 的创业热潮。比如前面提到的鸿钧微、启灵芯,西芯,都是在这个节点前后出现的。

在 2022 云栖大会上,张建峰表示倚天 710 已经在阿里云的数据中心上大规模部署,成为中国首个云上大规模应用的自研 CPU。相比同类产品,倚天 710 算力性价比提升超 30%,单位算力功耗降低 60%,未来 2 年,阿里云 20% 的新增算力将使用自研 CPU。

相比玄铁,发布于 2019 年 9 月的含光 800 受到的关注要多很多,因为这是平头哥发布的第一款通用 AI 推理芯片。凑巧的是,华为在同月发布了 AI 训练芯片昇腾 910。

平头哥和海思,作为很长一段时间里中国半导体最具代表性的公司,在这一刻有过一个短暂的交集,他们站在同一个起跑线上,向 AI 芯片进发。

但相比沉淀已久的海思,平头哥更像一个不折不扣的新手。

“2018 年四五月份,阿里内部设立做芯片的目标并开始做 PR 的时候,我们实际上一行代码都还没写,压力非常大。”谈及首款 AI 芯片的诞生,平头哥研究员骄旸在接受媒体采访时这样说道。

但实际上,含光 800 的研发效率非常高,仅用了 7 个月的时间就完成了前端设计,之后又用 3 个月成功流片,这个速度甚至比英特尔、英伟达这些芯片大厂还要快。

到 2021 年双 11 期间,含光 800 就已经作为淘宝搜索推荐等场景的算力主力,支持全球规模最大的电商搜索任务,这也意味着含光 800 已进入规模化应用阶段。

含光 800 的设计也具有许多创造性,比如采用了自研的芯片架构,通过软硬件的协同设计实现性能突破,在当时创造了性能和能效比两项纪录,相比传统 GPU,含光 800 运行的算法效率最高可提升近 2 倍,单位算力能耗降低 58%。

平头哥市场副总裁高慧表示:“得益于软硬协同设计带来的性能提升,含光 800 在特定 AI 场景里的优势明显,在吞吐量和时延等核心指标上表现都很优秀,这是含光 800 能大规模应用的基础。”

除此之外,平头哥还有羽阵 RFID 电子标签芯片,这是一款面向物联网场景的感知芯片,用于智慧物流、智慧仓储、智慧零售、资产管理等场景。

整体上看,玄铁系列为 AIoT 终端芯片提供高性价比 IP;AI 芯片含光 800 通过阿里云为人工智能场景提供极致 AI 算力;通用服务器芯片倚天 710 则通过阿里云为云上客户提供差异化的顶级算力。

而从玄铁 910、含光 800,到倚天 710,平头哥实现了从专用到通用芯片的跨越。但回过头来,无论是云端计算、推理,还是云端 AI 训练,平头哥的产品矩阵都是以阿里云为核心,再辅以阿里擅长的智慧零售业务作为补充。

用起来,用自身业务场景打磨产品,阿里巴巴造芯算是走完了第一阶段。

02 向外求,平头哥需要市场化

满足自用,是国内大厂造芯走的基本路径。

除了平头哥和海思,在今年 7 月份确认造芯的字节跳动,下场的一个重要原因就是云业务无法找到能够满足需求的供应商。字节方面也同时强调,芯片将仅供内部使用,不会向其他公司销售。

更早一些入局的百度,拥有“昆仑”和“鸿鹄”两大主打芯片。其中昆仑作为一款 AI 芯片,除了常用深度学习算法等云端需求,还能适配诸如自然言语处置、大规模语音辨认、自动驾驶、大规模引荐等详细终端场景的计算需求。鸿鹄是一款远场语音交互芯片,主要应用在车载语音交互、智能家居等场景,都与百度的业务协同。

阿里想要将平头哥拆分也不是个例,早在去年三月份,百度宣布将旗下昆仑芯片拆分,并完成独立融资,投后估值约 130 亿人民币。

百度拆分昆仑的原因有很多,比如战略层面,百度最近几年一直在分拆非核心的互联网业务。但最重要的一个原因还是芯片的发展问题,百度内部的市场已经很难支持昆仑进一步发展。

有业内人士表示,“一方面,受限于在云计算、人工智能等场景体量问题,昆仑芯片在百度内部应用到一两万片可能就进入了一个相对瓶颈期;另一方面,人工智能芯片是随服务器一起更新的,现在服务器更新周期有些从过去的 3 年延长到 5 年,这也给昆仑芯片的发展带来了阻力。”

因此,在这样的情况下,昆仑独立之后,其实可以服务更多百度之外的客户,这有利于昆仑扩大市场,获得更多经济效益。而更重要的是,造芯片非常烧钱,大量的外部融资有助于减少母公司投入。

虽然阿里的现金流更加充沛,阿里云的内部需求也更大,但一家的需求毕竟有限。

但无论是百度还是阿里,要打开外部的市场上并不容易。

纵观过去 50 年,芯片半导体的发展跟硬件市场的趋势息息相关。

在国外,英特尔的崛起伴随着 PC 行业的繁荣,高通的发展依托于智能手机的扩张,即使英伟达的后来居上,也是乘上了游戏、加密货币和 AI 的东风。

在国内,华为海思的第一笔订单是大华股份的安防监控,然后依托华为在通信领域的市场,研发基站、基带芯片,再然后就是大众所熟知的麒麟系列,依靠华为的智能手机,面向千万消费者。

而目前为止,平头哥还在寻找能够帮助它从服务阿里,到服务整个市场的新增长点。

从目前平头哥的产品矩阵来看,云计算只是阿里自用,而且在这个市场中,英特尔 x86 的 CPU 构架仍然占据绝对的优势。AI 芯片主要用途是云上训练,这一块英伟达占据了大部分市场,2021 年市场份额大约在 90% 左右。

除此之外,今年 7 月份,平头哥和爱普特达成合作,要一起研发 RISC-V 构架的 MCU 芯片。但 MCU 市场情况却比较复杂,高端 MCU 被英飞凌、恩智浦等国际巨头把控,而低端 MCU 则差异化较大,毛利率低,这一块市场被中小企业占据,他们具有极高的市场敏锐度,能够更快地调整产品。

所以对现在的平头哥来说,最重要的其实是找到一个属于自己的应用场景,无论是云计算、AI 训练、还是 MCU,有没有竞争力,能不能打,都需要在市场中去尝试。而从阿里分拆出来,独立融资,可能是平头哥市场化的必经之路。

这些年来,对于外部增长点,平头哥其实一直也有一些探索。比如前面提到基于 RISC-V 构架的玄铁系列芯片。

目前,玄铁系列可广泛应用于智能交互、多媒体终端、AR/VR、无线通讯等场景,且出货量已经超过 30 亿颗,是国内应用规模最大的国产 CPU。

而对于一款芯片来说,性能好不好只是决定这款芯片能不能用,而真正决定好不好,以及能不能留住用户的,还在于芯片的开发工具和生态。

平头哥在玄铁系列上,从端到云打通各个操作系统的生态,根本上是在扩展玄铁、甚至整个 RISC-V 架构芯片的使用场景和范围。而在这之前,平头哥还提供了 HHB 的编译工具,使用这个工具,不仅能很好地使用玄铁 CPU 的 AI 能力,也能很好地支持第三方的 AI IP。

平头哥半导体副总裁孟建熠表示,平头哥不仅自身提供完备的开发工具,还与越来越多的生态公司合作,让越来越多的第三方商用和开源工具支持平头哥处理器的特点。

当然,目前 RISC-V 构架的芯片也还存在许多问题。比如开发者关心的外设 IP 授权问题依然在短期内难以突破,以 RISC-V 构架为基础的处理器性能和稳定性还待提升等等。毕竟有处理器的性能得到提升,才能适配各种各样的软件,而稳定性则是应对复杂应用场景中软件移植的基础。

中国科学院软件研究所总工程师武延军直言,虽然中科院软件所在国际上游开源社区、国内开源欧拉社区、平头哥等做了大量 RISC-V 基础软件适配工作,但依然有很多核心基础软件无法在 RISC-V 平台上流畅运行。

这是因为之前许多软件都是在 x86 或者在 Arm 上运行的,迁移到 RISC-V 之后,很多指令集规范都不够成熟。

总而言之,以 RISC-V 构架为基础的芯片生态还处在早期阶段,要期待 RISC-V 能与 x86 和 Arm 有一战之力,并非一朝一夕之功,也并非平头哥一家企业能够建设的,它需要更多的玩家,更多的生态协作者共同努力。

03 结语

平头哥,大名也叫蜜獾,因为它头顶扁平,还带有一层白色毛发一直延伸到整个背部,所以也被网友亲切称为平头哥,他们日常出没在非洲的热带雨林,或者西亚的开阔草原之中。

国家地理频道曾专门为这种动物拍摄过一部纪录片,记录了蜜獾抓老鼠、攻蜂巢,捕长蛇的过程。在纪录片中,平头哥几乎有什么吃什么,并且几乎不害怕任何天敌,它们不是在打架,就是在去打架的路上,所以获得了一个“生死看淡,不服就干”的标签,并被吉尼斯世界纪录以“世界上最无所畏惧的动物”收录数年。

阿里的平头哥诞生在中国半导体最艰难的年代,取这样一个名字显然也有一些对待半导体艰难险阻的态度在其中。

而如今,当平头哥走过了最初的创业阶段,拆分、还是不拆分成为了一个新的选择。在阿里的襁褓中固然安逸,但这显然不符合平头哥不服就干的性格。