OpenAI发布三款语音AI模型 GPT-Realtime-2支持实时翻译转写

5月8日，OpenAI官宣升级实时API接口，推出GPT-Realtime-2、实时翻译模型与实时转写模型三款语音AI，支持70余种语言识别，大幅提升人机语音交互体验，适用于智能客服、在线教育等场景。

5月8日，据外媒TechCrunch报道，OpenAI正式官宣升级实时API接口，一次性推出三款全新高阶语音智能模型，全面强化AI实时听觉、口语交互、翻译与转录能力，大幅降低企业开发智能语音应用的技术门槛。

本次更新核心产品包含GPT-Realtime-2、实时翻译模型与实时转写模型。其中GPT-Realtime-2搭载GPT-5级别的推理能力，人声仿真度更高，相较于前代产品，可精准理解并处理复杂人类指令，实现更自然、更智能的连续对话交互。

翻译方面，GPT-Realtime-Translate支持70余种语言识别、13种语言语音输出，可同步人声语速完成实时翻译，实现无卡顿跨语言沟通。配套上线的Whisper实时转录模型，能够在人机互动过程中同步完成语音转文字，适配会议记录、实时笔录等高频办公场景。

OpenAI表示，本次升级将AI音频交互从基础问答升级为综合性智能语音操作系统，集聆听、思考、翻译、转写、实时响应于一体，实用性大幅提升。行业应用场景覆盖智能客服、在线教育、媒体直播、大型国际活动以及创作者平台，商业化落地空间广阔。

原文链接：点击前往 >

文章作者：环球Tech

版权申明：文章来源于环球Tech。该文观点仅代表作者本人，扬帆出海平台仅提供信息存储空间服务，不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任，如若转载请联系原文作者。更多资讯关注扬帆出海官网：https://www.yfchuhai.com/

好文章，需要你的鼓励

“越境”新增长——中越数娱增长实战沙龙&走访

海外 · 越南

07.16-07.16

GAME ON！游戏产业出海峰会

上海市 · 上海市

07.31-07.31

扬帆出海，专注服务中国互联网出海！