国思软件 - 追赶ChatGPT，我们的差距在哪里？

　　文元宇宙日爆

　　又一家中国互联网巨头在追赶 ChatGPT 了。

　　3 月底举行的博鳌亚洲论坛上，腾讯集团高级执行副总裁汤道生披露，腾讯正在研发 AIGC 以及大模型相关技术，类 ChatGPT 的对话机器人也在酝酿中。

　　百度、华为，如今再加上腾讯，ChatGPT 出现之后，中国的互联网科技企业似乎一夜觉醒。不光公司，还有资本及创业大佬。

　　3 月 19 日，创新工场董事长兼 CEO 李开复在朋友圈高调宣布，正在亲自筹组中文版 ChatGPT 公司“Project AI 2.0”。重燃创业野心的也不止李开复，美团王慧文、阿里贾扬清、搜狗王小川、京东周伯文均亲自下场，赶赴大模型赛道。

　　“大佬攒局”往往是赛道火热的信号，仅今年前三个月，上万家新注册的公司在经营范围中写上了人工智能。企业如雨后春笋般涌现，人才紧俏起来。应了周鸿祎那句话：一人捅破窗户纸，千军万马独木桥。

　　这一次不光是资本生意，还有需求催生。在人工智能上，以 OpenAI 为代表的抢跑选手引领自然语言大模型风潮，从产品上甩开中企老远，而中国还没有合格的 ChatGPT 满足各行各业对 AIGC 的体验。

　　腾讯们、李开复们现在做大模型还来得及吗？投入 10 年的李彦宏说，应用更靠谱。但真正稀缺的，仍然是底层基础设施。

　　互联网大佬带头组队

　　作为目前全球最火的自然语言大模型产品，ChatGPT 至今不对中国用户开放，背后的算法、芯片、数据更是全部被控制在美国公司手中。国产 ChatGPT 进入需求井喷期，一大批中国公司赶来，有互联网大厂，有资本大佬，也有创业公司，谁都不想错过这一次的 AI 革命。

　　3 月 19 日，创新工场董事长兼 CEO 李开复在朋友圈宣布，成立 Project AI 2.0 公司，“不仅仅要做中文版 ChatGPT，”他这个公司定位为 AI 2.0 全新平台和 AI-first 生产力应用的“世界级公司”，野心颇大。

　　一个月前，美团联创王慧文在朋友圈发“英雄帖”，出资 5000 万美元，要创立新公司打造中国版 OpenAI。此外，阿里巴巴“框架大神”贾扬清、搜狗前任 CEO 王小川、京东曾经的 AI 掌门人周伯文都表明了同样的意愿。

　　互联网大佬蜂拥入局，中国企业重燃热情，包括创业企业和上市公司。

　　企查查数据显示，近三个月共有 108601 家新注册业企业在经营范畴中标注了人工智能，同比增长超 24%。《元宇宙日爆》统计，截至今年 3 月，已有 20 家上市公司布局了 AIGC 相关应用，涉及世纪虚拟人、AI 写作、AI 视频、AI 绘画、AI 营销等。

　　国内上市公司 AIGC 相关布局

　　AIGC 创业公司千帆竞发，涉及领域包括上游的底层框架与工具、中游的行业服务、下游的包括文字、图像、视频、音频、游戏等应用场景，创业方向也从C端的娱乐游戏拓宽至工业、金融、医疗、教育等 2B 领域。不同应用场景已出现了一批代表性的玩家。

　　国内创业公司 AIGC 相关布局

　　而在底层大模型上，中国互联网科技巨头的动作则最受瞩目，包括百度、华为、腾讯在内大厂均有自然语言大模型布局。

　　3 月 16 日，百度履行承诺，发布基于文心大模型的生成式 AI 产品文心一言，27 日又面对企业发布了智能云 AI 底座文心千帆。

　　3 月 27 日，华为云官网显示，旗下的盘古系列 AI 大模型即将上线，涉及 NLP（自然语言）大模型、CV (计算机视觉)大模型和科学计算大模型（气象大模型）。

　　3 月 30 日，腾讯集团高级执行副总裁汤道生披露，腾讯正在研发 AIGC 以及大模型相关技术，并向澎湃新闻表示，正在研发类 ChatGPT 的对话机器人，对于腾讯的聊天机器人是集成到 QQ、微信，还是通过腾讯云向B端用户服务，汤道生说：“都会有。”

　　国内 AI“三算”与海外存差距

　　人工智能在当下的中国展现出全面开花的热闹。而资金雄厚、人才济济的大厂被视作最能与 OpenAI 比肩的选手。但最早发布产品的百度，其文心一言在文本、代码生成上尚不及 ChatGPT 的体验，图片生成的效果则被 Midjourney 拉开了距离。

　　赛道火热，产品不佳。中国的人工智能发展进入至暗时刻。缺的不仅是有实力的大模型，还有与之直接相关的人才和 AI“三算”，即算力、算法、算据。

　　先是业内曝出，百度文心大模型团队内的研发人员近期受到了其他公司的疯狂追捧，有 3 年左右相关经验的员工，可以直接给到原先年薪的两倍。而有涉及海内外人才市场的猎头称，诸多互联网大厂的第一诉求就是想找 OpenAI 项目里的华人。猎聘大数据研究院的统计数据也显示，近一年，AIGC 相关新发岗位同比增长了 42.5%。

　　抢人大战不仅在国内上演。

　　由于一大批硅谷 AI 大牛排着队挤进 OpenAI，谷歌一度遭遇 AI 人才流出。据外媒体统计，近几个月 OpenAI 已经雇用了超过 12 名谷歌的 AI 人才。

　　但从公开消息看，到目前为止，还没有哪位 OpenAI 背景的华人专家流入中国大厂。

　　AI 人才紧俏，以芯片为核心硬件基础的算力一直被视为“卡脖子”的状态，而国产大模型的算据也与 GPT-4 存在肉眼可见的差距，预训练等大模型算法的距离直接以“肉眼可见”的产品拉胯摆在了用户面前。

　　在算据上，国产大模型也与 GPT-4 存在差距。

　　在自然语言大模型中，参数是衡量一个深度学习模型复杂度和能力的重要指标。参数多，意味着模型能够处理更多的数据，学习更多的知识。国外有研究人员将 GPT 参数规模与大脑神经元做类比，GPT-3 的规模与刺猬大脑类似，GPT-4 拥有 100 万亿个参数，基本达到人类大脑的规模。

　　大模型参数对比

　　再看国产大模型，即使是排名靠前的 M6 大模型，其参数规模也仍与 GPT-4 相差一个数量级，更多的大模型仍在“原始阶段”。

　　GPT-4 百万亿的参数需要强大的算力来完成训练。算力，同样是 AI 的核心竞争要素，核心的核心是芯片。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

　　在 AI 芯片竞争方面，英伟达处于垄断地位，该公司推出的 A100 与 H100 是目前性能最强的数据中心专用 GPU，市面上几乎没有可替代的方案。ChatGPT 的训练用的正是英伟达顶配版 A100。

　　然而，在中美竞争下，A100 与 H100 已被限制出口中国，中国厂商只能用阉割版 A800 芯片，数据传输速度被降低了 30%，影响着 AI 集群的训练速度和效果。而国产优质芯片，虽能够为预训练大模型提供算力支撑，但仍存在明显差距。

　　芯片性能对比

　　以 OpenAI 为例，该公司使用了数万块英伟达 A100 进行海量数据训练和推理。如果以 1 万枚英伟达 A800 GPU 为标准，仅 GPU 采购成本就超 10 亿美元。

　　如此现状下，国内的大模型研发机构面临两种选择，“烧钱”购买更多的芯片，等待国产芯片的算力突破。但现在的竞争态势下，等已经等不起了。

　　高昂的前期投入成本绝非普通创业公司可以负担，还要具备绝对顶尖的研发技术。很显然，AI 大模型仍是巨头的游戏。但掌握先发优势的 OpenAI 以“日更”速度向前跃进，互联网巨头与资本面临着一场“烧钱”硬仗。

　　OpenAI 抢跑，中企如何赶超？

　　回顾 ChatGPT 的迭代，OpenAI 至少进行了三次技术路线的"自我革命"。

　　从 2018 年 GPT-1 的推出到今年的 GPT-4，OpenAI 用了近 5 年。而百度在自然语言大模型的研发上用了 10 年。

　　连李彦宏也认为，中国基本不会再出现一个 OpenAI，“没有必要再重新发明一遍轮子”，在他看来，“大模型时代，最大的创业机会在应用，”他的判断基于上一次的移动互联网变革，“操作系统其实没几个，最成功的是微信、抖音、淘宝这些应用。”他指出，未来 10 年，应用领域可能诞生 10 倍价值的机会。

　　周鸿祎也在公开场所表示，目前中国发展 GPT 技术，首先要占据应用场景，同步全力发展核心算法技术。为什么要同步？如果等算法赶上 GPT-4 再上马，市场就错过了。

　　另辟赛道，在现有大模型的基础上创新产品应用可能是大部分企业的超车机会。

　　就像移动互联网时代，尽管中国没有自己的操作系统，但仍有 Tiktok 这样的超级应用在海外市场杀出一片天。应用先行的优势是能快速的将 AI 生产力转化为商业价值，这是在移动互联网时代中国互联网企业探索出的超车捷径，也是在激烈的 AI 竞争中，大部分中企们赶超 ChatGPT 最经济、最现实的路径。

　　但由于 GPT-3 之后，OpenAI 的所有模型就没有再开源，GPT-4 的运行机制是什么，国内企业仍无从得知。

　　面对竞争对手全面的科技封锁，中国人工智能想要长期发展就不能没有“根”。旷视科技 CEO 印奇认为，中国攻坚 AI 大模型目前最重要的是要先能把 GPT-3.5 复现出来，"这是所有事情的起点"。

　　无论如何，发展好自身的硬实力，不在关键技术上被“卡脖子”，将是 AI 时代下中企们无法逃避的“必修课”。

　　针对国产 AI 大模型，周鸿祎指出：“发展大语言模型，别人已经指明了技术路线，剩下的就是长期主义指导下的时间问题，”他认为，“中国有能力发展自己的 GPT，差距大概 2 年。”

　　百度有文心大模型，阿里有 M6，华为的盘古大模型箭在弦上，腾讯的混元大模型也在不断迭代。当李开复、王慧文等一众互联网大佬也亲赴大模型战场时，底层的重要价值已经不言而喻了。

　　就像《三体》故事里的明喻一般，“基础科学”一旦被“智子”锁死，人类便永远失去探索宇宙真相的机会。底层大模型就是那个基础科学，在人工智能上，中国想要超越，不光需要资本、巨头，更需要的是能顶得住研发压力的“面壁人”。

追赶ChatGPT，我们的差距在哪里？

我们的产品

相关链接

关于我们

联系我们