7 月 2 日消息,2026 科大讯飞智能交互生态发布会在深圳举行。会上,科大讯飞同步升级 AIUI 交互平台、AIUI 多语种交互平台和机器人超脑平台三大核心平台,进一步完善从设备端到云端、从国内到全球、从语音到多模态的 AI 交互能力体系,为智能硬件和机器人产业提供大模型时代的全球交互底座。
据了解,AIUI 交互平台迎来近年来最大规模升级,平台定位由语音交互平台升级为多模态 AI 交互平台。
在语音交互方面,AIUI 交互平台支持低功耗唤醒能力,可在 100MHz 主频、140KB 存储芯片上稳定运行,-5dB 场景下唤醒率达到 97%。平台还推出产品级定制唤醒方案,据科大讯飞介绍,仅需 50 人音频录音即可实现 94% 的综合唤醒率,定制周期由数月缩短至数周。
同时,平台升级双流 VAD 全双工能力,在高噪环境下,聆听误响应降低 95%、播报误打断降低 93%、交互抢答率降低 85%。此外,平台开放 100 余种超拟人音色,支持轻笑、喷嚏等副语言表达,并支持基于 Prompt 生成角色音色。
多模态方面,AIUI 交互平台融合云端 VAD、意图分发、图像理解回复、图像生成智能体及视觉语言模型,支持语音生图、画面描述、风格化创作等能力。同时发布 AIUI Code 和声学检测工具,形成覆盖能力接入、开发调试和体验验证的开发闭环。
面向智能硬件出海需求,科大讯飞同步发布 AIUI 多语种交互平台。
据介绍,该平台覆盖 40 余种语言,英语唤醒率达到 97%,小语种唤醒率达到 95%,语音识别端到端全场景准确率达到 95%。平台围绕个性化聊天、命令控制、知识问答、多语种翻译和多模态交互五大场景进行了端到端优化。
同时,平台已在新加坡、东南亚、中东、欧洲、北美等区域部署服务节点,并适配 GDPR、CCPA、PDPA 等国际合规要求,为企业提供一站式全球化 AI 交互能力。
机器人超脑平台此次也完成升级,重点围绕机器人感知、理解和执行能力展开。据介绍,平台融合全景摄像头和环形麦克风阵列,实现 360°全向拾音和视听融合感知,可在多人、高噪环境下精准锁定对话目标,并针对“鸡尾酒会”等复杂场景融合人脸识别、人体追踪、手势识别等多模态能力。
此外,机器人超脑平台进一步完善“通用能力+行业方案”体系,支持裸板接入、降噪板、封装麦板及多模态软核授权等多种接入方式,并面向陪伴机器人、扫地机器人、康养机器人、四足机器人及人形机器人推出针对性行业方案。
据科大讯飞介绍,目前机器人超脑平台已连接 120 家机器人客户和 400 家泛机器人客户。发布会上,搭载机器人超脑平台的专业级服务导览机器人 Guide01 同步亮相。该产品集成自主导航、实时避障和多模态感知能力,可应用于展馆、文旅、零售等场景,承担智能导览服务。
科大讯飞方面表示,此次三大平台同步升级后,AIUI 交互平台实现从语音向多模态升级,多语种交互平台助力智能硬件全球化,机器人超脑平台则进一步推动机器人进入真实应用场景,共同构建覆盖设备端、云端及全球市场的 AI 交互能力体系。
