记者|董温淑
编辑|高宇雷
8 月 15 日,港股上市企业、中立音视频云服务商“七牛云”官宣发布新一代智能硬件语音交互解决方案“灵矽 AI”。
“灵矽 AI”是一个可供硬件厂商与开发者直接接入的端到端开放交互平台,旨在以自然智能语音对话能力、无缝接入的多模型能力和丰富的 MCP 生态,打破算法与硬件算力壁垒。
据官方信息,借助灵矽 AI,七牛云希望把 AI 硬件的开发门槛降到“做一款 APP”的难度,把创新者从底层技术之中“解放”出来,让其专注于应用和场景创新,在教育、智能家居、机器人领域具备应用潜力。
“未来,我们将持续探索语音交互与具身智能的融合,让 AI 真正成为人类生活的好伙伴。”七牛云 CEO 许式伟表示。
具体来说,在模型接入上,灵矽 AI 支持 DeepSeek、通义千问、豆包、智谱 AI 等主流大模型无缝切换;MCP 生态方面,灵矽 AI 通过开放协议把地图、股票数据、快递查询、天气查询等能力模块化,开发者既可按调用量向B端可客户收费,也可在C端硬件上实现增值订阅;算力方面,灵矽 AI 覆盖亮牛、国芯微、跃昉科技等芯片量产平台,并配套完整 SDK,可以把传统 6 个月的适配周期压缩至 4 周。
功能方面,据官方信息,灵矽 AI 已实现端到端小于 600ms 的超低延迟交互体验,灵矽 AI 以声纹识别与语音生成为技术核心,构建了从用户识别到情感表达的完整语音交互链路;系统能够精准分辨不同个体,还能结合动态降噪算法,在嘈杂环境中清晰捕捉用户声音、提升语音识别准确率;更进一步,其语音引擎可实时感知交流情绪,生成具有人类语气特征的自然语音输出——包括呼吸节奏、语言停顿与语调变化。
此外,灵矽 AI 还支持高效的个性化声线定制,仅需 10 秒语音样本,即可完成专属语音克隆建模,极大提升用户的沉浸感与专属性。
2024 年报显示,七牛云营收来源于 MPaaS、APaaS、SPaas 及其他云服务,营收占比分别为 72.32%、24.63%、0.25%、2.8%。
借助灵矽 AI,七牛云有望收入结构将从单一云资源租赁,扩展至授权费、调用费、分成费三重叠加。