10 月 23 日消息,今年早些时候,在内罗毕初创公司 Qhala 的总部,一群来自非洲大陆各地科技公司的高管齐聚一堂,聆听关于人工智能(AI)前景的演讲。主讲人是华为云撒哈拉以南非洲地区首席解决方案架构师 Harrison Li,演讲主题聚焦于全球人工智能竞赛中备受瞩目的新秀 DeepSeek(深度求索)。
华为与 DeepSeek 的母公司幻方量化早在几年前便已开始合作。如今,华为向客户打包提供 DeepSeek 大语言模型的访问权限和自家的云存储以及计算服务。Harrison Li 主推的核心卖点在于:中国的 DeepSeek 性能足以媲美硅谷 OpenAI,但成本仅为其零头,并且能在价格更低的硬件上运行。“DeepSeek 现在太火了,”Harrison Li 说,“没人想谈其他。”
对在场听众而言,这番话正中下怀。非洲大陆(南非除外)的计算资源往往稀缺又昂贵。降低 AI 成本和功耗,有望让这项全球最炙手可热的技术惠及数百万民众,也让非洲初创企业有能力为非洲用户设计本土化产品。
Harrison Li 翻动着幻灯片,展示为各类用户和企业量身定制的套餐:免费套餐、托管在华为云上的 DeepSeek 模型按时付费服务,以及为开发者构建聊天机器人和应用提供的高算力选项。他还向政府部门客户介绍如何“本地化部署”私有云系统。
这场晨会的主办人是 Qhala 首席执行官 Shikoh Gitau,她正负责开发自家 AI 聊天机器人。在过去一年里,这位肯尼亚计算机科学家试用了一系列西方模型——Anthropic 的 Claude、谷歌 Gemini 和 Meta 的 Llama,每一款都给她留下了深刻印象。但对于一家正在构建大规模应用、注重成本控制的年轻企业而言,这些选项在经济上都并不可行。直到今年 1 月,DeepSee 才进入了非洲市场。
“我第一次听说 DeepSeek 时,简直欣喜若狂,” Gitau 提到“极其低廉”的定价时说。她很快就把 Qhala 聊天机器人迁移到这一中国系统上。现在,Harrison Li 希望她的决定能推动其他非洲企业家和公司效仿。
尽管全球的目光大都聚焦于西方科技公司在美国和中东争夺利润丰厚的企业合同,但内罗毕的这场会议却说明它们的中国竞争对手正采取截然不同的策略。OpenAI 及其美国竞争对手几乎完全专注于“专有 AI”,即公司完全控制模型软件、训练数据和算法,客户付费获取访问权限。相比之下,华为和阿里巴巴等中国公司正用开源 AI 模型吸引非洲初创企业和创新中心。这些开源模型可以免费访问和修改,让企业无需支付昂贵授权费用就能构建产品。
这一策略与中国的“一带一路”倡议有异曲同工之妙,都不是为了眼前利润。非洲整个数字经济的价值约 1800 亿美元,与 OpenAI 高达 5000 亿美元的估值相比简直是小巫见大巫。相反,这是一场旨在赢得客户、软实力以及关乎 AI 未来海量数据的长期布局。中国企业在非洲和在拉美和东南亚市场一样拥有“后端优势”。中国企业已经花费数年时间构建起多层次的技术基础设施,让 AI 产品得以顺畅流入。当美国科技公司瞄准富裕地区时,华为则以低成本和积极营销策略争取新兴市场消费者。华为和中兴为非洲提供了数据中心、5G 无线系统和光纤网络所需的大部分设备。在技术栈的更下游,中国企业同样占据主导地位:传音占据了非洲智能手机市场大部分份额,小米和荣耀也在稳步增长,而字节跳动旗下 TikTok 则是当地下载量最大的应用程序之一。
对许多非洲科技创业者来说,中国轻量化、低成本的 AI 模型是他们构建应用的最佳选择。“在整个非洲,许多小型团队都在努力为本地化应用微调 DeepSeek,”比勒陀利亚大学计算机科学教授、研究实验室 Lelapa AI 联合创始人 Vukosi Marivate 说,“我们将在今年晚些时候开始看到成果。”
总部位于拉各斯的初创公司 EqualyzAI 致力于为非洲企业定制小型 AI 模型。公司联合创始人兼首席执行官 Olubayo Adekanmbi 起初根本不想碰大语言模型。在他看来,它们太贵,需要太多算力,而尼日利亚根本没有足够的基础设施来确保正常运行。Adekanmbi 想构建基于非洲数据训练的、轻量化的专用模型。当中国开发者开始将他们的模型开源后,Adekanmbi 评论道,“中国模型灵活且成本低,还有助于实现本地数据主权。”
在有近 2.4 亿人口的尼日利亚,OpenAI 的 GPT 和谷歌 Gemini 均难以普及,原因是成本高、授权限制,以及缺乏对本地语言的支持。“数据隐私问题、监管不确定性以及‘供应商锁定’等风险,都让许多尼日利亚机构对采用西方专有 AI 平台望而却步,” Adekanmbi 表示。
为此,EqualyzAI 工程师们利用 DeepSeek 的开源架构作为“脚手架”,打造面向特定行业的小模型和自动化智能助手。非洲的绝大部分数据尚未数字化,因此他们雇佣大量外包员工收集农业、医疗和金融记录,并采集包含各类方言和口音的音频内容。EqualyzAI 再用这些数据集训练单个模型,并根据每个客户的需求逐一调整“开源权重”。由此开发出的聊天机器人和应用程序已经被金融科技公司、在线教育平台和医疗保健初创公司所使用。像所有基于 DeepSeek 构建应用的公司一样,他们可以选择本地部署、自行支付算力和存储费用,或使用华为等提供商。EqualyzAI 选择了前者。不同于按授权和基础设施收费的专有模型,DeepSeek 按模型计算量计费,依据模型处理的 Token 数来定价。华为每天为 DeepSeek 用户提供 200 万个免费 Token。
Adekanmbi 表示,对于 EqualyzAI 这样的非洲初创公司来说,DeepSeek 便宜了“好几个数量级”。例如,DeepSeek Chat 处理每百万个输入 token 收费 27 美分,生成每百万个输出 token 收费 1.1 美元。而 OpenAI 的 GPT-4o 分别要价 5 美元和 15 美元。如果 EqualyzAI 用 GPT-4o 训练一个用于在线教育的小模型,每月需支付约 12500 美元,而使用 DeepSeek 仅需 2700 美元。
Gitau 曾在谷歌和微软研究院工作过,五年前创办了 Qhala。她解释说,硅谷模型不适合非洲用户的原因有很多。美国开发模型在处理外语和不熟悉词汇时需要消耗更多 token,因此对于非英语用户而言,计算成本往往更高。此外,由于训练数据主要来自西方,这些模型也无法捕捉文化上的细微差异,有时甚至会根据名字错误判定性别,或生成带有种族刻板印象的图像。“在旧金山眼中的世界里,”她说,“非洲的本土语境被彻底抹去了。”
硅谷公司虽然尝试将非洲的 2000 多种语言和方言中部分整合到模型中,但相关开源项目仍处于起步阶段。
与此同时,尼日利亚教育初创公司 Cereloop 一直在微调阿里巴巴的 Qwen(通义千问)模型,开发可离线使用的理科学习 AI 产品。总部位于内罗毕的云基础设施提供商 Pure Infrastructure 正基于 DeepSeek 探索安全应用,并为一家肯尼亚大型企业分析经济数据。肯尼亚金融科技初创公司 Innova 则使用 DeepSeek 分析商业数据、评估投资风险,而东非最大的云服务提供商 Angani 也在部署 DeepSeek、Llama 及其他开源模型。
“很多科技公司都在使用像 DeepSeek 和 Qwen 这样的中国模型,” Pure Infrastructure 首席执行官 Phares Kariuki 说,“非洲的大企业也开始采纳,但规模还不大。”
关于非洲 AI,一个挥之不去的担忧是,非洲大陆的初创企业最终可能被卷入中美科技战中。今年 5 月,美国商务部收紧了对中国 AI 硬件的限制,警告称全球范围内任何使用华为昇腾 AI 芯片的行为都可能违反出口管制规定。非洲人工智能研究院执行主席 Terrence Okeke Taylor 担心,如果特朗普政府采取进一步措施,“非洲可能会被‘拒之...门外’。”
此外,今年 6 月中旬,为防止高考作弊,阿里巴巴、字节跳动、腾讯和 DeepSeek 都暂时禁用了其消费级 AI 产品上的图像识别和即时问答功能。一夜之间,远在阿克拉、拉各斯和内罗毕的聊天机器人、图像识别工具和 AI 分析应用纷纷出现卡顿和服务中断,开发者们束手无策。
总部位于内罗毕的 AI 战略家 Sidney Essendi 表示,这“无疑证明非洲大陆在数字层面对海外 AI 基础设施的依赖性与日俱增”。
数据隐私是另一部分创业者担忧的问题。总部位于内罗毕的教育科技公司 LoHo Learning 首席执行官兼创始人 James Ong’ang’a表示,这是他选择 AI 模型时的重要考量。
非洲拥有全球增长最快的人口,数字经济预计到 2050 年将激增至 7120 亿美元。面对这一前景,非洲各国政府和初创企业都在思考:能否拥有更独立的科技未来?理想情况下,这意味着在非洲本地建设 AI 基础设施与生态系统,用非洲语言和数据训练模型与应用,并在本地部署和运行。
目前来看仍是任重道远。非洲绝大多数地区缺乏投资、能源基础设施、工程人才以及高效数字化海量数据的能力,短期内难以改变。因此有实力的公司都在“两头下注”。一些企业已经开始将中国支持的云服务、AI 模型与美国 AI 产品混合使用。非洲最大电信公司 MTN 集团已开始建设自己的 AI 数据中心,并表示会优先在现有平台或内部开发应用,或主要与能够提供可扩展技术的西方 AI 公司合作。
在东非和西非拥有超过 6000 万客户的金融服务集团 NCBA 表示,正考虑在其现有的西方 AI 产品组合中增加 DeepSeek。
“我们预计中国模型会发挥作用,尤其是在短期内,” NCBA 集团首席数据官 Patrick Kariuki 说,“但未来发展将需要一种更平衡、多模型并行的策略。”(辰辰)
