字节首款AI耳机评测来了!豆包大模型加持 交互体验仍有提升空间

  《科创板日报》10 月 16 日讯(记者唐植潇) 字节跳动加入 AI 耳机战场。

  近日,字节跳动发布了首款 AI 智能体耳机 Ola Friend。根据此前《科创板日报》独家报道,字节跳动于今年 9 月份前后正式完成对 Oladance(主体公司:深圳市大十未来科技有限公司)收购。而 Ola Friend 耳机的硬件部分正是由原 Oladance 团队完成。

  字节跳动首款 AI 硬件 Ola Friend 耳机意义非凡,其背后连接的是字节自研的豆包大模型。有观点认为,豆包大模型更贴近中国用户习惯的语言理解和生成能力。鉴于字节跳动旗下还拥有抖音、汽水音乐等热门 APP,这也为其日后的 AI 硬件应用场景提供了更广阔的想象空间。

  据悉,Ola Friend 已经在各大电商平台开启预售,将于 10 月 17 日正式发货,售价 1199 元。而我们也在第一时间拿到了这款产品并做了评测。

  沿用开放式设计,单只耳机重量仅为 6.6g

  中国通信工业协会数字经济平台分会副会长高泽龙对《科创板日报》记者表示:“硬件行业确实需要长期的研发投入和市场培育,字节跳动作为一个以软件起家的企业,进入硬件领域意味着将面临新的挑战。”

  因此,字节跳动并没有选择直接下场,而是采取收购方式,结合豆包大模型的能力,进入生成式 AI 硬件领域。

  公开资料显示,Oladance 成立于 2019 年,由前 BOSE 高管李浩乾与多名 BOSE 工程师共同创立。Oladance 是业内最早提出 OWS(全开放穿戴式耳机)专利技术的专业耳机厂商,还推出了全球首款 OWS 全开放耳机。此前,Oladance 一直主攻海外中高端耳机市场,被黑蚁资本和蓝驰创投等投资机构看好。

  《科创板日报》记者注意到,Ola Friend 耳机也沿用了此前的 OWS 开放式耳机设计,主打无感佩戴,单只耳机重量仅为 6.6g。

  此外,为了确保耳机佩戴的舒适性,在耳机发声单元与供电单元之间,Ola Friend 使用了亲肤硅胶进行连接,耳机并不影响佩戴眼镜用户的使用。同时,支持 IP54 级别防水,能够有效防止运动过程中的汗液,以及小雨的淋溅。

  与传统的设计方案不同的是,Ola Friend 耳机盒有着自己的巧思。采用类似“零钱包”式外观设计,一侧印有产品标识和“Creating Sound to live with”的标语,另一侧预留有开孔,可挂在钥匙扣上。

  根据官方提供的数据,仅聆听音乐的情况下,单只耳机可实现 8 小时续航时长,搭配充电盒可实现 28 小时续航时长。

  耳机本体标识为触控操作区域,长按两侧可激活配对,用户可通过“豆包”App 中设置页面,就可以连接豆包 AI 账户和耳机,以实现 AI 语音助手功能。

  使用中,任意一侧双击为播放/暂停音乐和接听电话,长按为快速开启单轮对话,用户也可以通过唤醒词“豆包,豆包”以进入到豆包 AI 的连续对话。

  买 Ola Friend 送豆包大模型?

  体验中《科创板日报》记者注意到,在安卓手机上,用户必须要允许豆包 App 常驻后台,iPhone 上需要开启允许后台 App 刷新功能,并保持网络通畅,否则仅能唤醒豆包,但无法调用其 AI 能力。

  以音乐功能为例,《科创板日报》记者体验中发现,豆包 App 默认集成的音乐服务为抖音旗下的汽水音乐,购买设备赠送了一个月 VIP 会员,结合目前汽水音乐签到赠送 VIP 资格的活动,暂时不用担心歌曲收费问题。

  不过,豆包 AI 无法直接切换音乐播放源为 QQ 音乐、网易云音乐和酷狗音乐等第三方音乐 APP。相比较之下,QQ 音乐的曲库规模更为庞大,大约有 2300 万首曲目,拥有的版权包括索尼、华纳等全球三大唱片公司的音乐,以及其他众多唱片公司的独家版权。而网易云音乐的曲库在 1000 万左右,拥有天娱、爱贝克思、丰华、华研国际等版权。

  现阶段打开上述 APP 后,通过 Ola Friend 的指令,用户只能实现简单的歌曲切换歌曲。但记者也从业内人士处获悉,目前字节方面正和某第三方音乐平台商谈相关合作。

  同时,记者也注意到,在直接语音询问 Ola Friend 与文字提问豆包 AI,有着差异化的回答。

  (上为文字版豆包,下为 Ola Friend 回答)

  《科创板日报》记者以相同的问题询问豆包,文字版回答提供的数据和内容更为详实。而 Ola Friend 提供的语音回答,则更口语化且简洁,并且每次回答提问之后,Ola Friend 还会抛出引导性的问题,引导用户继续追问。

  按照官方的说法,Ola Friend 可以落地多个生活场景,化身“随身百事通”、“英语陪练”甚至导游。

  作为英语陪练,Ola Friend 的英语识别准确率很高,并且能够及时指出用户表达中语法错误的部分,但目前还不能期待它能给出更准确和地道的表达词汇。

  如果用户向 Ola Friend 发布指令,分析某只股票或者上市公司的业绩,也可以回答出相对专业的解读内容。

  整体体验下来,《科创板日报》记者发现豆包 AI 能力与 Ola Friend 的配合仍然有提升的空间。

  比如当记者提问“与马踏飞燕和长信宫灯同时期的,有什么出名的青铜器吗?“,豆包大模型只能重复介绍上述两件青铜器,而不能举例回答其他青铜器。

  有观点认为,字节跳动选择耳机作为 AI 硬件的切入点,可能是因为耳机是人们生活中常用的设备,且与人的听觉和语言交互密切相关。

  对此,中国人工智能学会专家郭涛认为,将 AI 技术应用于耳机,可以提供更智能、更便捷的语音交互体验,满足用户对于智能化生活的需求。

  在郭涛看来,考虑到字节跳动在 AI 领域的布局和发展,以及其在短视频平台等领域的成功经验,后续可能还会在硬件领域持续投入以寻求长期发展。

  AI 大模型接入,无线耳机迎来新机遇

  根据洛图科技监测数据,2024 年 8 月,国内 AI 耳机销量及销售额分别同比增长 763% 和 1447%,其中具备“商务办公+日常娱乐”功能的 AI 耳机销售额同比增长 574%。

  除了字节跳动的 Ola Friend 之外,三星早于今年 7 月 10 日发布了布两款耳机新品——Galaxy Buds3 Pro 与 Galaxy Buds3。其中 Samsung Galaxy Buds 3 Pro 耳机主打 AI,具备自适应降噪、环境分析等功能,并能够配合 Galaxy 手机完成即时口译。

  由科大讯飞孵化的 iFlyBuds 也推出过支持 AI 录音降噪会议耳机系列产品,该产品不仅支持全场景录音转写,包括线上会议与沟通、音视频录音、现场录音等,还支持同传翻译等多项功能。

  洛图科技预测 2024 年国内 AI 耳机电商市场销量或突破 20 万,同比增速可达 489%。

  值得注意的是,以字节跳动、三星、科大讯飞为首的企业对 AI 无线耳机的布局,也给产业链带来了新机遇。

  以 Oladance 前几代的产品为例,有机构拆解过 Oladance OWS Pro,发现该产品采用了 Cmsemicon 中微 CMS8S5887 单片机、思远半导体 SY8809 蓝牙耳机充电仓解决方案、BES 恒玄 BES2600YP 蓝牙音频 SoC、以及艾为 AW86862 压力感应 IC。

  这些供应商中,恒玄科技近期就推出新一代 6nm 智能可穿戴芯片 BES2800,集成 Wi-Fi 和蓝牙模块,支持本地传感网络算法处理,能够为 TWS 耳机、智能手表、智能眼镜、智能助听器等产品提供算力支持。

  而思远半导体的电源管理类芯片目前已被 OPPO、小米、vivo 和 Oladance 等企业应用在其蓝牙耳机充电仓上。

  此外,《科创板日报》记者联系了艾为电子和中微半导体方面,其中艾为电子证券部相关人员告诉记者:“与我们合作的客户比较多,也有很多大型芯片经销商代理我们的产品,因此我们无法确认哪些产品会采用我们的芯片。但我们确实有压力感应 IC 应用在无线蓝牙耳机上面。“

  中微半导体方面则对记者表示:“我们有耳机主控芯片相关业务,此前也与 Oladance 团队有过接触,但出货是 ODM 厂商,因此出货规模取决于他们耳机的规模。“

  截止至发稿前,玄恒科技与思源半导体方面并未回复记者。