
{{!completeInfo?'请完善个人信息':''}}
微软的Build 2025大会和Google的I/O开发者大会都在本周举办,且核心议题都是AI。微软侧重于展示如何搭建Agent,吸引开发者构建开放Agent网络,这是一个AI智能体在多层面协同运作的体系。而Google致力于展示围绕Gemini搭建的AI操作系统雏形,强调将Gemini能力融入C端产品。
摘要
微软和Google的AI战略规划都已具备整体性,不再是散点尝试,而是开始将散落的点串联成体系,使命是让研究成果转化为现实应用。这与国内大厂目前的情况形成对比,国内大厂虽在积极布局,但尚未能像微软和Google一样提炼出指引整个企业向前推进的明确旗帜。
微软在Build 2025大会上将重心放在吸引B端企业和开发者,为其提供丰富的工具和设备。包括提供开发环境的基础能力(如Windows AI Foundry和Azure AI Foundry等)、提升Agent开发效率(如GitHub Copilot功能的升级和Microsoft 365 Copilot Tuning的推出)、提供Agent的载体(重点介绍对协作产品Teams的升级)以及提供网络连接能力(全面支持MCP协议并提出NLWeb概念)。微软围绕开放代理网络完成了自身业务的基础梳理,旨在延续互联网时代的荣光。
Google在I/O大会上展示了大模型能力的升级和C端产品的AI化改造。模型层面,Gemini 2.5 Pro等模型推出,具备更丰富能力。基于模型发展出不同基础Agent能力,如Project Astra和Project Mariner,并将其应用在AI搜索、Chrome浏览器、Gemini App、智能眼镜等C端产品以及Android XR等硬件上。同时,还升级了AI化的编程工具,如Jules编程Agent和Gemini Code Assist。Google的策略是通过将Gemini的模型能力产品化,融入现有和未来场景,搭建面向AI时代的系统雏形。
阿里、腾讯、字节等国内巨头虽在AI应用大趋势下各有侧重,但尚未找到真正突破口。阿里在大模型和云服务上有优势,但电商业务难以转换为AI时代C端应用支点,夸克的重要性提升;腾讯类似Google,有C端产品体系,但模型能力较弱,需增强研发;字节有C端流量,但短视频难直接转换为C端入口,重视多模态能力和AI硬件探索,To B业务欠缺生态基础,需开放Agent生态。
微软的Build 2025大会和Google的I/O开发者大会都选择了在本周举办,并且两场活动谈论的核心都是AI。
不同的是,微软的重心是向行业展示如何更好搭建Agent。微软在Build 2025大会上向用户呈现了一套更加成熟的Agent基础设施,想要吸引更多开发者加入到构建开放Agent网络(Open Agentic Web)的进程中——这是一个 AI 智能体能够在个人、组织、团队乃至整个端到端业务流程中协同运作的体系。
Google则致力于展示一个围绕Gemini搭建的AI操作系统雏形。谷歌首席执行官Sundar Pichai在演讲中使用了「Gemini时代(Gemini Era)」来描述未来。一方面,Google展示了更强的模型研发能力;另一方面,Google在将Gemini的能力融入到各个C端产品中。
微软和Google虽然重心不同,但其面向AI的战略规划都具备了一定的整体性,不再是进行散点的尝试,而是开始找到一条线,将散落的点串联起来,成为一个体系。这个体系的使命就如Pichai所言——让研究成果真正发挥作用,将其尽快转化为现实应用。
这是目前我们在国内大厂中尚未观察到的一种变化。我们能够观察到阿里、腾讯、字节都在模型基础层、业务AI化和产品创新方面进行着积极布局,但很难像总结本次微软和Google一样,为国内厂商提炼出一面指引整个企业向前推进的旗帜。苹果也是如此。
这可能是由于谨慎,也可能是还未下定决心。但无论出于何种考量,旗帜的出现都将是企业的AI战略推进到下一个阶段的标志之一。
微软:一切为了开放代理网络
一个展现出神奇效果,但还不够成熟的起步阶段——这是微软在Build 2025大会上对当下AI技术发展阶段的判断。微软CEO Satya Nadella选择用1991年的Win32、1996年的Web栈以及2008年的智能手机来类比当下AI所处的发展阶段。
以上这些节点,并不是一个C端用户大爆发的节点,而是B端用户面向未来布局的开始。
因此,微软将重心放在吸引更偏向B端的企业和开发者,并为其准备了一个拥有丰富工具和设备的操作间。
我们可以将各种让人眼花撩乱的工具和能力划分为以下几类:
第一类,提供开发环境的基础能力,包括Windows AI Foundry和Azure AI Foundry等。前者是微软为本地AI开发提供的开发环境,通过Foundry Local简化了在设备上直接运行AI模型、工具和智能体的过程。后者则是微软提供的云端开发平台,这次的一大更新是引进了xAI的Grok 3与Grok 3 mini。
同时,微软通过推出Azure AI Foundry Agent Service,让专业开发者能够编排多个专用Agent来处理复杂任务。微软AI Agent副总裁Ray Smith认为,试图将一个复杂的、要求高可靠性的流程完全整合到单一Agent中,往往会面临诸多挑战,将任务系统性地分解给多个Agent,则能显著增强可靠性。
第二类,提升Agent的开发效率。在微软的介绍中,已经有1500万开发者在使用GitHub Copilot功能,提升代码开发效率,这个规模已经占到GitHub总用户数的十分之一。在最新的更新中,GitHub Copilot将能够支持完成用户分配的BUG修复、代码维护等任务,并能在VS Code中使用。
微软还推出了Microsoft 365 Copilot Tuning,支持开发者使用针对公司数据、工作流程和风格微调的模型来构建更专属的Agent。开发者可以通过低代码的形式进行模型的微调,这个工作之前往往需要一整个数据科学团队耗费数周时间才能完成。
第三类,提供Agent的载体。微软在面向C端的Agent载体上并没有着墨太多,反而是重点介绍了对协作产品Teams的升级。Nadella认为,新的Teams真正将聊天、搜索、笔记、生成和Agent整合到一个直观的框架中。这也是一个完整的AI的用户界面,支持多人协作,并承载了Agent的流通。
第四类,提供网络连接能力。一方面微软开始全面支持MCP(Model Context Protocol)协议,这让它想建立的Agent网络具备了开放属性和复杂的任务执行能力。在现场演示中,应用开发者使用VS Code中的GitHub Copilot功能和Windows的MCP协议,依靠3句话就实现了特定风格网页的开发。
第一句话的指令下,GitHub Copilot连接WSL (Windows Subsystem for Linux)的MCP服务器,完成了最新版本的Fedora安装;第二句指令下,GitHub Copilot创建了一个网站项目;第三句指令下,GitHub Copilot利用MCP协议,从用户的Figma客户端中提取了相应的设计细节,并据此对网页进行了调整。
在MCP协议基础上,微软这次还提出了NLWeb概念。微软CTO Kevin Scott认为,MCP协议是AI时代的HTTP,而NLWeb则是AI时代的html,能够让任何拥有网站或API的人轻松地将其变成一个Agent。「每个NLWeb端点默认都是一个MCP服务器,这意味着那些人们通过NLWeb提供的东西将可以被任何支持MCP的Agent访问。」
微软已经围绕开放代理网络完成了对自身业务的基础梳理。在这次梳理之后,微软的产品体系将服务于AI时代的HTTP与html,借此来延续互联网时代的荣光。
Google:用Gemini改造和连接一切
不同于微软在Build 2025大会上呈现的服务企业和开发者的AI产品,Google在I/O大会上展示了让更多C端用户眼前一亮的创新。大模型能力的升级、搜索的AI化尝试、Android XR的实用化展示,都加深了Google想要让C端用户更有效使用AI的判断。
在模型层面,Google的模型能力进展快速,且具备了更丰富的能力。首先,Gemini 2.5 Pro的推出,扭转了市场对Google大模型业务的看法,使其成为大模型王冠的有力竞争者。其次,本次发布的视频模型Veo 3和生图模型Imagen 4,在展示效果上都获得了比较正面的评价。
模型基础上,Google发展出了不同的基础Agent能力。其中,Project Astra主打低延迟的多模态能力,可以通过摄像头和麦克风观察、理解周围的环境,且具备长期记忆能力。Project Mariner则强调多任务处理能力,一次能处理12项任务,能够代理用户浏览和使用网站,完成购买动作。
在I/O大会的现场演示中,这些基础Agent能力已经被应用在了AI搜索、Chrome浏览器、Gemini App、智能眼镜等C端产品的AI化改造中。
核心的搜索业务上,Google终于开始用AI加码。5月20日开始,Google会向所有美国用户推出AI 模式。用户可以向Gemini提出几百字的问题,也能在后续体验到多模态问答功能和Deep Research能力。Google也会在Chrome浏览器加入AI助手,帮助用户总结提炼页面信息。
目前,Gemini App的月活跃用户数超过4亿。Gemini Live将支持摄像头和屏幕共享,让AI帮助用户了解和记忆周围的环境。并且,Gemini的Agent模式还将能够帮助用户找房、预约、订票。现场演示中,Gemini Live可以指导用户学习如何修理自己的自行车,并帮助其打电话订购所需零件。
软件端之外,基础Agent也被应用在了硬件端。Android XR被Google视为Gemini时代走向大众的首个Android平台。在现场的演示中,我们看到了Gemini Live能力的硬件化。Google还计划未来几个月之内,把Gemini带到手表、汽车仪表盘,甚至电视上。
同样的,Google也升级了AI化的编程工具。一方面,名为Jules的编程Agent,可以像GitHub Copilot一样实现异步开发,可以自动重构代码、编写测试。另一方面,升级之后的Gemini Code Assist支持代码审核、长文件解析、多人协作,集成了个性化建议和团队代码规范工具。
从基础模型到软件,再到硬件和编程工具,Gemini无疑是凝聚这一切的核心。Google的策略很简单,就是要通过不断将Gemini的模型能力产品化,融入到现有的和未来场景中,来搭建起一个面向AI时代的系统雏形。
国内巨头还未找到真正突破口
尽管具体方向不同,但微软和Google共同验证了「AI走向应用」的大趋势。
只不过,微软是在创造条件,让人们能够更轻松地探索AI应用;Google则是要通过打造系统,让自己成为基础的AI应用。这是两个公司所具备的不同资源和禀赋决定的——微软以提供企业服务为主,Google面向的是C端市场。
如果以这两家公司为参照物来观察国内的大厂,会发现阿里、腾讯、字节三家虽然还没有拎出特别清晰的主线,但在做AI应用的大趋势下也是各有侧重。
阿里在AI时代的优势体现在大模型和云服务上,to B向开发者提供支持、构建开放Agent生态的路径比较顺畅。电商业务作为阿里在互联网时代的C端优势,很难顺畅转换为AI时代的to C应用支点。因此,夸克的重要性得到了提升。面向未来,阿里可能需要把Agent的发展势能注入夸克。
腾讯更接近Google,拥有相对稳固的C端产品体系和流量入口,会优先考虑如何完成面向C端的存量产品改造和面向未来的C端产品创新,就像最近对QQ浏览器进行的改造。但相比Google,腾讯的模型能力更弱,目前只能依靠DeepSeek和元宝双模型驱动。腾讯虽然有增强自身大模型能力研发的动作,但还看不到腾讯版Gemini2.5出现的迹象。
字节也有C端流量,但短视频也同样难以直接转换为AI时代的C端入口。这也是为什么字节会重视豆包大模型的多模态能力,并在三家中最为积极地去探索AI硬件。To B业务上,字节相对欠缺生态基础,需要找到更有效的开放方式。并且,与阿里一样,字节也更需要一个开放的Agent生态。
到目前为止,这些侧重也没有催生出像微软和Google一样的战略重心,看似布局全面的三家,都还没找到自己的真正突破口。
原文链接:点击前往 >
文章作者:窄播
版权申明:文章来源于窄播。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励