OpenAI 上线 OpenAI.fm 网站

  今天凌晨,OpenAI 上线了全新语音模型 API,具体包括:

  • gpt-4o-transcribe (语音转文本):单词错误率 (WER) 显著降低,在多个基准测试中优于现有 Whisper 模型
  • gpt-4o-mini-transcribe (语音转文本):gpt-4o-transcribe 的精简版本,速度更快、效率更高
  • gpt-4o-mini-tts (文本转语音):首次支持「可引导性」(steerability),开发者不仅能指定「说什么」,还能控制「如何说」

  为了让用户体验这些全新的语音模型,OpenAI 上线了一个新网站:https://www.openai.fm/

  用户可以在 OpenAI.fm 网站上体验并制作 gpt-4o-mini-tts 的相关音频,这个演示网站可谓是功能齐全,其中包含了官方的预设模板,提供人设、语气、方言、发音等设置。

  值得一提的是,OpenAI 还举办了一个广播比赛。用户可以在 http://OpenAI.fm 制作音频,接着使用 OpenAI.fm 上的「分享」按钮生成链接,然后在 X 平台分享该链接。

  最具创意的前三名将各获一台限量版 Teenage Engineering OB-4。音频时长建议控制在 30 秒左右,可在语音、表达、发音或剧本语调变化上尽情发挥创意。