{{!completeInfo?'请完善个人信息':''}}
5月8日,OpenAI官宣升级实时API接口,推出GPT-Realtime-2、实时翻译模型与实时转写模型三款语音AI,支持70余种语言识别,大幅提升人机语音交互体验,适用于智能客服、在线教育等场景。
5月8日,据外媒TechCrunch报道,OpenAI正式官宣升级实时API接口,一次性推出三款全新高阶语音智能模型,全面强化AI实时听觉、口语交互、翻译与转录能力,大幅降低企业开发智能语音应用的技术门槛。

本次更新核心产品包含GPT-Realtime-2、实时翻译模型与实时转写模型。其中GPT-Realtime-2搭载GPT-5级别的推理能力,人声仿真度更高,相较于前代产品,可精准理解并处理复杂人类指令,实现更自然、更智能的连续对话交互。
翻译方面,GPT-Realtime-Translate支持70余种语言识别、13种语言语音输出,可同步人声语速完成实时翻译,实现无卡顿跨语言沟通。配套上线的Whisper实时转录模型,能够在人机互动过程中同步完成语音转文字,适配会议记录、实时笔录等高频办公场景。
OpenAI表示,本次升级将AI音频交互从基础问答升级为综合性智能语音操作系统,集聆听、思考、翻译、转写、实时响应于一体,实用性大幅提升。行业应用场景覆盖智能客服、在线教育、媒体直播、大型国际活动以及创作者平台,商业化落地空间广阔。
原文链接:点击前往 >
文章作者:环球网Tech
版权申明:文章来源于环球网Tech。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励
已关注
关注