扬帆创投微信小程序
更聚焦的出海投融资平台
精准高效领先的融资对接服务
微信扫一扫进入小程序

2025年9月29日,DeepSeek发布V3.2-Exp模型,在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制,专为长文本场景优化。

摘要

首次实现细粒度稀疏注意力,在几乎不损失模型质量的前提下,显著提升长文本训练与推理效率。

V3.2-Exp与V3.1-Terminus在相同训练设置下对比测试,结果显示两者在主流公开评测集上表现几乎持平,验证优化有效性。

新模型已同步更新至App、网页端及小程序,API调用价格下调超50%,大幅降低开发者使用门槛。

V3.2-Exp模型已在Huggingface与魔搭平台开源,支持用户自由访问与二次开发,推动社区共建。

2025年9月29日,DeepSeek-V3.2-Exp模型发布,V3.2-Exp在V3.1-Terminus 的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

DeepSeek Sparse Attention的核心创新在于首次实现了细粒度的稀疏注意力机制,这一机制能够在几乎不影响模型输出质量的前提下,大幅提高长文本的处理效率。

并且,为了确保优化效果的可验证性,V3.2-Exp的训练设置与V3.1-Terminus进行了严格对比,结果显示,V3.2-Exp在各大公开评测集上的表现与V3.1-Terminus几乎持平。

图片

与此同时,DeepSeek还宣布,V3.2-Exp版本已同步更新至官方App、网页端及小程序,并且API价格大幅度下调在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

图片

此外,DeepSeek表示,V3.2-Exp模型已在Huggingface与魔搭平台开源,用户可以直接访问并进行二次开发。

原文链接:点击前往 >

文章作者:凤凰网科技

版权申明:文章来源于凤凰网科技。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/

{{likeNum}}

好文章,需要你的鼓励

请前往扬帆出海小程序完成个人认证
认证通过后即可申请入驻
扫码添加小助手
微信扫描二维码,添加小助手
微信号:yfch01
扫码添加小助手
微信扫描二维码,添加小助手
微信号:yfch01
APP
小程序
微信公众号
微信小程序
扬帆出海APP
扬帆出海APP
微信
公众号
微信公众号
关注扬帆出海
专注服务互联网出海!
出海人
社群
微信公众号
扫码进群
与16万+出海人同行!