微软和Google都找到了自己的AI重心

微软的Build 2025大会和Google的I/O开发者大会都在本周举办，且核心议题都是AI。微软侧重于展示如何搭建Agent，吸引开发者构建开放Agent网络，这是一个AI智能体在多层面协同运作的体系。而Google致力于展示围绕Gemini搭建的AI操作系统雏形，强调将Gemini能力融入C端产品。

摘要

微软和Google的AI战略规划都已具备整体性，不再是散点尝试，而是开始将散落的点串联成体系，使命是让研究成果转化为现实应用。这与国内大厂目前的情况形成对比，国内大厂虽在积极布局，但尚未能像微软和Google一样提炼出指引整个企业向前推进的明确旗帜。

微软在Build 2025大会上将重心放在吸引B端企业和开发者，为其提供丰富的工具和设备。包括提供开发环境的基础能力（如Windows AI Foundry和Azure AI Foundry等）、提升Agent开发效率（如GitHub Copilot功能的升级和Microsoft 365 Copilot Tuning的推出）、提供Agent的载体（重点介绍对协作产品Teams的升级）以及提供网络连接能力（全面支持MCP协议并提出NLWeb概念）。微软围绕开放代理网络完成了自身业务的基础梳理，旨在延续互联网时代的荣光。

Google在I/O大会上展示了大模型能力的升级和C端产品的AI化改造。模型层面，Gemini 2.5 Pro等模型推出，具备更丰富能力。基于模型发展出不同基础Agent能力，如Project Astra和Project Mariner，并将其应用在AI搜索、Chrome浏览器、Gemini App、智能眼镜等C端产品以及Android XR等硬件上。同时，还升级了AI化的编程工具，如Jules编程Agent和Gemini Code Assist。Google的策略是通过将Gemini的模型能力产品化，融入现有和未来场景，搭建面向AI时代的系统雏形。

阿里、腾讯、字节等国内巨头虽在AI应用大趋势下各有侧重，但尚未找到真正突破口。阿里在大模型和云服务上有优势，但电商业务难以转换为AI时代C端应用支点，夸克的重要性提升；腾讯类似Google，有C端产品体系，但模型能力较弱，需增强研发；字节有C端流量，但短视频难直接转换为C端入口，重视多模态能力和AI硬件探索，To B业务欠缺生态基础，需开放Agent生态。

微软的Build 2025大会和Google的I/O开发者大会都选择了在本周举办，并且两场活动谈论的核心都是AI。

不同的是，微软的重心是向行业展示如何更好搭建Agent。微软在Build 2025大会上向用户呈现了一套更加成熟的Agent基础设施，想要吸引更多开发者加入到构建开放Agent网络（Open Agentic Web）的进程中——这是一个 AI 智能体能够在个人、组织、团队乃至整个端到端业务流程中协同运作的体系。

Google则致力于展示一个围绕Gemini搭建的AI操作系统雏形。谷歌首席执行官Sundar Pichai在演讲中使用了「Gemini时代（Gemini Era）」来描述未来。一方面，Google展示了更强的模型研发能力；另一方面，Google在将Gemini的能力融入到各个C端产品中。

微软和Google虽然重心不同，但其面向AI的战略规划都具备了一定的整体性，不再是进行散点的尝试，而是开始找到一条线，将散落的点串联起来，成为一个体系。这个体系的使命就如Pichai所言——让研究成果真正发挥作用，将其尽快转化为现实应用。

这是目前我们在国内大厂中尚未观察到的一种变化。我们能够观察到阿里、腾讯、字节都在模型基础层、业务AI化和产品创新方面进行着积极布局，但很难像总结本次微软和Google一样，为国内厂商提炼出一面指引整个企业向前推进的旗帜。苹果也是如此。

这可能是由于谨慎，也可能是还未下定决心。但无论出于何种考量，旗帜的出现都将是企业的AI战略推进到下一个阶段的标志之一。

微软：一切为了开放代理网络

一个展现出神奇效果，但还不够成熟的起步阶段——这是微软在Build 2025大会上对当下AI技术发展阶段的判断。微软CEO Satya Nadella选择用1991年的Win32、1996年的Web栈以及2008年的智能手机来类比当下AI所处的发展阶段。

以上这些节点，并不是一个C端用户大爆发的节点，而是B端用户面向未来布局的开始。

因此，微软将重心放在吸引更偏向B端的企业和开发者，并为其准备了一个拥有丰富工具和设备的操作间。

我们可以将各种让人眼花撩乱的工具和能力划分为以下几类：

第一类，提供开发环境的基础能力，包括Windows AI Foundry和Azure AI Foundry等。前者是微软为本地AI开发提供的开发环境，通过Foundry Local简化了在设备上直接运行AI模型、工具和智能体的过程。后者则是微软提供的云端开发平台，这次的一大更新是引进了xAI的Grok 3与Grok 3 mini。

同时，微软通过推出Azure AI Foundry Agent Service，让专业开发者能够编排多个专用Agent来处理复杂任务。微软AI Agent副总裁Ray Smith认为，试图将一个复杂的、要求高可靠性的流程完全整合到单一Agent中，往往会面临诸多挑战，将任务系统性地分解给多个Agent，则能显著增强可靠性。

第二类，提升Agent的开发效率。在微软的介绍中，已经有1500万开发者在使用GitHub Copilot功能，提升代码开发效率，这个规模已经占到GitHub总用户数的十分之一。在最新的更新中，GitHub Copilot将能够支持完成用户分配的BUG修复、代码维护等任务，并能在VS Code中使用。

微软还推出了Microsoft 365 Copilot Tuning，支持开发者使用针对公司数据、工作流程和风格微调的模型来构建更专属的Agent。开发者可以通过低代码的形式进行模型的微调，这个工作之前往往需要一整个数据科学团队耗费数周时间才能完成。

第三类，提供Agent的载体。微软在面向C端的Agent载体上并没有着墨太多，反而是重点介绍了对协作产品Teams的升级。Nadella认为，新的Teams真正将聊天、搜索、笔记、生成和Agent整合到一个直观的框架中。这也是一个完整的AI的用户界面，支持多人协作，并承载了Agent的流通。

第四类，提供网络连接能力。一方面微软开始全面支持MCP（Model Context Protocol）协议，这让它想建立的Agent网络具备了开放属性和复杂的任务执行能力。在现场演示中，应用开发者使用VS Code中的GitHub Copilot功能和Windows的MCP协议，依靠3句话就实现了特定风格网页的开发。

第一句话的指令下，GitHub Copilot连接WSL （Windows Subsystem for Linux）的MCP服务器，完成了最新版本的Fedora安装；第二句指令下，GitHub Copilot创建了一个网站项目；第三句指令下，GitHub Copilot利用MCP协议，从用户的Figma客户端中提取了相应的设计细节，并据此对网页进行了调整。

在MCP协议基础上，微软这次还提出了NLWeb概念。微软CTO Kevin Scott认为，MCP协议是AI时代的HTTP，而NLWeb则是AI时代的html，能够让任何拥有网站或API的人轻松地将其变成一个Agent。「每个NLWeb端点默认都是一个MCP服务器，这意味着那些人们通过NLWeb提供的东西将可以被任何支持MCP的Agent访问。」

微软已经围绕开放代理网络完成了对自身业务的基础梳理。在这次梳理之后，微软的产品体系将服务于AI时代的HTTP与html，借此来延续互联网时代的荣光。

Google：用Gemini改造和连接一切

不同于微软在Build 2025大会上呈现的服务企业和开发者的AI产品，Google在I/O大会上展示了让更多C端用户眼前一亮的创新。大模型能力的升级、搜索的AI化尝试、Android XR的实用化展示，都加深了Google想要让C端用户更有效使用AI的判断。

在模型层面，Google的模型能力进展快速，且具备了更丰富的能力。首先，Gemini 2.5 Pro的推出，扭转了市场对Google大模型业务的看法，使其成为大模型王冠的有力竞争者。其次，本次发布的视频模型Veo 3和生图模型Imagen 4，在展示效果上都获得了比较正面的评价。

模型基础上，Google发展出了不同的基础Agent能力。其中，Project Astra主打低延迟的多模态能力，可以通过摄像头和麦克风观察、理解周围的环境，且具备长期记忆能力。Project Mariner则强调多任务处理能力，一次能处理12项任务，能够代理用户浏览和使用网站，完成购买动作。

在I/O大会的现场演示中，这些基础Agent能力已经被应用在了AI搜索、Chrome浏览器、Gemini App、智能眼镜等C端产品的AI化改造中。

核心的搜索业务上，Google终于开始用AI加码。5月20日开始，Google会向所有美国用户推出AI 模式。用户可以向Gemini提出几百字的问题，也能在后续体验到多模态问答功能和Deep Research能力。Google也会在Chrome浏览器加入AI助手，帮助用户总结提炼页面信息。

目前，Gemini App的月活跃用户数超过4亿。Gemini Live将支持摄像头和屏幕共享，让AI帮助用户了解和记忆周围的环境。并且，Gemini的Agent模式还将能够帮助用户找房、预约、订票。现场演示中，Gemini Live可以指导用户学习如何修理自己的自行车，并帮助其打电话订购所需零件。

软件端之外，基础Agent也被应用在了硬件端。Android XR被Google视为Gemini时代走向大众的首个Android平台。在现场的演示中，我们看到了Gemini Live能力的硬件化。Google还计划未来几个月之内，把Gemini带到手表、汽车仪表盘，甚至电视上。

同样的，Google也升级了AI化的编程工具。一方面，名为Jules的编程Agent，可以像GitHub Copilot一样实现异步开发，可以自动重构代码、编写测试。另一方面，升级之后的Gemini Code Assist支持代码审核、长文件解析、多人协作，集成了个性化建议和团队代码规范工具。

从基础模型到软件，再到硬件和编程工具，Gemini无疑是凝聚这一切的核心。Google的策略很简单，就是要通过不断将Gemini的模型能力产品化，融入到现有的和未来场景中，来搭建起一个面向AI时代的系统雏形。

国内巨头还未找到真正突破口

尽管具体方向不同，但微软和Google共同验证了「AI走向应用」的大趋势。

只不过，微软是在创造条件，让人们能够更轻松地探索AI应用；Google则是要通过打造系统，让自己成为基础的AI应用。这是两个公司所具备的不同资源和禀赋决定的——微软以提供企业服务为主，Google面向的是C端市场。

如果以这两家公司为参照物来观察国内的大厂，会发现阿里、腾讯、字节三家虽然还没有拎出特别清晰的主线，但在做AI应用的大趋势下也是各有侧重。

阿里在AI时代的优势体现在大模型和云服务上，to B向开发者提供支持、构建开放Agent生态的路径比较顺畅。电商业务作为阿里在互联网时代的C端优势，很难顺畅转换为AI时代的to C应用支点。因此，夸克的重要性得到了提升。面向未来，阿里可能需要把Agent的发展势能注入夸克。

腾讯更接近Google，拥有相对稳固的C端产品体系和流量入口，会优先考虑如何完成面向C端的存量产品改造和面向未来的C端产品创新，就像最近对QQ浏览器进行的改造。但相比Google，腾讯的模型能力更弱，目前只能依靠DeepSeek和元宝双模型驱动。腾讯虽然有增强自身大模型能力研发的动作，但还看不到腾讯版Gemini2.5出现的迹象。

字节也有C端流量，但短视频也同样难以直接转换为AI时代的C端入口。这也是为什么字节会重视豆包大模型的多模态能力，并在三家中最为积极地去探索AI硬件。To B业务上，字节相对欠缺生态基础，需要找到更有效的开放方式。并且，与阿里一样，字节也更需要一个开放的Agent生态。

到目前为止，这些侧重也没有催生出像微软和Google一样的战略重心，看似布局全面的三家，都还没找到自己的真正突破口。

原文链接：点击前往 >

文章作者：窄播

版权申明：文章来源于窄播。该文观点仅代表作者本人，扬帆出海平台仅提供信息存储空间服务，不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任，如若转载请联系原文作者。更多资讯关注扬帆出海官网：https://www.yfchuhai.com/