面壁智能 CEO 谈 GPT-4o mini:轻量高能模型潜力极大

  关于 OpenAI 日前推出的 GPT-4o mini,国内 AI 初创公司面壁智能 CEO 李大海在个人社交媒体分享了自己的看法。

  李大海对 GPT-4o mini 感到「英雄所见略同」,认为在不断提升大模型参数的方向之外,在更小尺寸方向上追求高效高性能,是另一条挖掘智能潜力极限、又可降低成本的路径。

  李大海声称,知识密度是大模型另一个核心指标,是模型能力除以参与计算的模型参数,类似芯片制程。轻量高性能模型潜力极大。

  李大海也猜测,GPT-4o mini 估计是一个「宽 MOE」,即 expert 的数量比较多的模型,应该不会是一个端侧模型。他也谈到了 GPT-4o mini 可能带来的行业变革:

作为一个性价比很高的云端模型,一方面把云端 API 市场卷到了一个新高度,另一方面也极大降低大模型落地产业成本,让我们对大规模行业应用的兴起抱有更强信心。