{{!completeInfo?'请完善个人信息':''}}
谷歌因Gemini API请求量翻倍,开始对Gemini应用实施算力额度限制。Meta因需求量大受影响最明显,多项AI项目推进受阻。此举凸显AI算力供给仍是产业发展瓶颈。
谷歌因Gemini API请求量翻倍,已经开始对Gemini应用实施基于算力额度的使用限制。知情人士透露,谷歌无法向Meta足额供应其所需的Gemini模型算力额度。
据报道,谷歌正在收紧其Gemini人工智能平台的资源供应,因为开发者、企业以及科技巨头的日益增长的需求正威胁着现有容量。
这一举措背后,是2025年3月至8月期间Gemini API请求量翻倍,这一点迫使谷歌重新思考应该如何分配科技领域最抢手的资源之一——原始人工智能(AI)计算能力。
据知情人士透露,谷歌在今年3月前后告诉Meta,无法足额供应其所需的Gemini模型算力额度。由于Meta对谷歌模型的需求远高于其他客户,因此受到的影响也最为明显。
此举打乱并推迟了Meta多项内部人工智能项目的推进节奏。受该算力限制,叠加公司整体压缩人工智能成本的战略,Meta已要求员工节约调用AI令牌,提升使用效率。
除Meta之外,其他谷歌客户也受到算力不足影响,但程度相对有限。
自2026年5月17日起,谷歌对Gemini应用实施了基于算力额度的使用限制。这类似于手机流量套餐:用户不再拥有无限请求,而是需在每周滚动更新的5小时刷新窗口内使用,并且每周有使用上限。
这些限制适用于广泛范围,而不仅限于一家公司。谷歌已记录了速率限制和支出层级,旨在确保在该公司所称的快速增长阶段,所有客户都能公平使用API。
谷歌选择实施使用量限制而非单纯扩大基础设施,这正说明了其经济考量。即使对于拥有谷歌资源的公司而言,要满足不受约束的人工智能需求所需的资本支出也令人望而生畏,因此有必要在短期内采取需求管理措施。
这起事件再次凸显,即使全球科技巨头持续投入数千亿美元兴建数据中心并采购人工智能芯片,整体基础设施仍难以追上生成式人工智能快速扩张所带来的需求,算力供给仍是目前产业发展的重要瓶颈。
谷歌云端事业最新财报也反映相同问题。在截至2026年3月底的2026财年第一季,谷歌云营收达200亿美元,但Alphabet CEO皮查伊当时表示,算力限制使谷歌云无法承接更多客户需求,也让该部门积压订单较前一季接近倍增。
原文链接:点击前往 >
文章作者:科创板日报
版权申明:文章来源于科创板日报。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励
已关注
关注