
{{!completeInfo?'请完善个人信息':''}}
Ilya Sutskever创立的Safe SuperIntelligence(SSI)正在筹集超过10亿美元的资金,最新估值可能超过300亿美元。此前在2024年9月,SSI的估值为50亿美元。此轮融资由Greenoaks Capital Partners牵头,计划投资5亿美元。
近期,腾讯、百度、阿里、字节跳动等大厂纷纷接入DeepSeek大模型。
Sam Altman在早上9点50分提出关于OpenAI下一个开源项目的问题,探讨是开发类似o3-mini级别的小型模型(需在GPU上运行)更有用,还是开发更适合手机移动端运行的模型更有用。
微信接入DeepSeek的方式较为仓促,产品体验粗糙,缺乏历史记录、上下文联动、文件上传功能等,更像是一个独立的入口,而非深度融入微信核心功能。这种接入方式更像是“纸糊上去的”,而非真正的深度整合。
2025年2月16日晚,百度宣布其搜索功能全面接入DeepSeek大模型。百度文心大模型的深度搜索功能已集成到百度搜索中,同时文心智能体平台的开发者也可调用DeepSeek模型并创建调优智能体。
2025年2月15日,微信搜索上线“AI搜索”功能,接入DeepSeek-R1提供的“深度思考”服务。2月16日,腾讯确认微信搜一搜已灰度测试接入DeepSeek,部分用户可在微信对话框顶部搜索入口看到“AI搜索”字样,并免费使用DeepSeek-R1满血版模型。
微软发布了OmniParser的最新版本V2.0,这是一个视觉Agent解析框架,能够将DeepSeek-R1、GPT-4o、Qwen-2.5VL等大模型转化为可在计算机上使用的AI Agent。与V1相比,V2在检测较小的可交互UI元素时准确率更高,推理速度更快,延迟降低了60%,在ScreenSpot Pro基准测试中,V2+GPT-4o的准确率达到了39.6%,相比原始GPT-4o的0.8%有显著提升。
昆仑万维于2月14日正式推出Matrix-Zero世界模型,成为中国首家同时推出3D场景生成和可交互视频生成模型的企业。该模型包含两款子模型:3D场景生成大模型和可交互视频生成大模型。
包括处理模糊任务、从海量信息中提取关键信息、复杂文档推理与决策、多流程AIAgent、视觉推理、代码审查和性能评估。这些场景展示了o系列模型在处理复杂任务和推理方面的强大能力。
尽管苹果与阿里巴巴建立了合作关系,但仍然继续与百度合作,为中国iPhone用户开发人工智能功能。这表明苹果在中国市场采取了多方合作的策略,以降低风险并应对市场竞争。
VideoJAM是由Meta和特拉维夫大学研究人员提出的一个新框架,旨在解决AI视频生成中运动连贯性不足的问题。传统视频模型因训练目标偏向外观保真度,导致运动连贯性差。VideoJAM通过修改目标函数,引入显式的运动先验,使模型同时预测外观和运动,从而提升运动理解能力。
字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构解决了MoE(混合专家)推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。这一架构在保持模型效果的同时,显著提升了推理效率。
DeepSeek-R1在Vectara HHEM人工智能幻觉测试中显示出14.3%的幻觉率,远高于行业平均水平和其前身DeepSeek-V3(3.9%)。幻觉问题在某些情况下较为严重,尤其是在语言创作领域,如摘要任务中,幻觉表现为生成与原始证据不一致的内容。
OpenAI首席执行官Sam Altman宣布即将发布GPT-4.5(猎户座模型,Orion)和GPT-5。GPT-4.5是最后一个非思维链模型。
法国总统马克龙宣布,未来几年法国AI领域将获得1090亿欧元的私人投资,用于推动AI发展,并与OpenAI、软银等创建的“星际之门”项目展开竞争。