
{{!completeInfo?'请完善个人信息':''}}
苹果正在开发至少七款头戴式设备,涵盖Vision系列和智能眼镜系列,从2025年晚些时候开始推出,2026年没有新品推出,2027年开始将有多款新产品问世。
Hunyuan-A13B是腾讯开源的一个基于细粒度专家混合(MoE)架构的大型语言模型,拥有800亿参数,其中130亿参数处于激活状态。它在保持高性能的同时,实现了优秀的资源利用效率,适合在资源受限的环境中使用。
香港科技大学、Manycore联合开源了一种名为SpatialLM的空间大模型,专门用于处理3D点云数据,并生成结构化的三维场景理解输出,如墙壁、门窗、物体边界框及其语义类别等。
OpenAI最近开始租用谷歌的AI芯片来支持ChatGPT及其他产品,而此前OpenAI是英伟达GPU的最大买家之一,这一举措似乎意味着OpenAI在逐渐远离英伟达。
中国游戏与互娱出海已从规模扩张转向技术引领。随着AI重构内容生产与运营逻辑,华南产业集群正通过“技术+运营”双轮驱动模式,贡献全国出海收入的半壁江山——这背后,阿里云全球数字基座成为关键。
小米在6月26日晚的发布会上推出了首款AI智能眼镜,其产品设计与Meta Ray-Ban Classic高度相似,定价策略也较为接近。尽管Meta已经在智能眼镜领域验证了商业模式的可行性,但小米要想复制成功并非易事,面临着技术壁垒、生态建设、用户习惯培养等多重挑战。
谷歌DeepMind发布了Gemini Robotics On-Device模型,该模型可在机器人本地直接运行,无需云端连接,能同时完成视觉识别、语言理解与动作执行,实时响应人类指令。
视频日记,美国人的“心灵疗愈师”。
随着大型语言模型(LLM)如ChatGPT的广泛应用,人们对其在教育领域的使用产生了诸多关注和担忧。本研究旨在探究使用LLM进行写作任务时的认知成本,以及这种使用方式对学生学习技能的潜在影响。
年初DeepSeek-R1的发布,使大模型创业公司面临是否继续投入巨资自研推理模型的抉择。零之万物、百川智能退出大模型预训练,“六小虎”格局被打破,形成“基础大模型五强”。
随着推理链条的加长,模型的视觉感知能力却明显下滑,逐渐依赖语言先验进行“脑补”,生成内容越来越容易脱离图像本身,甚至出现凭空捏造的幻觉现象。
AI眼镜赛道火热,中国厂商积极布局,但国内尚未出现销量能媲美Ray - Ban Meta的产品来进一步催化市场。
1956年AI概念被提出,早期因计算能力和数据规模限制商业化进展缓慢,21世纪随着深度学习技术突破和大数据时代到来,AI进入商业化应用快车道。但AI商业化道路面临技术、商业以及社会伦理的多重博弈,企业在商业化落地前仍面临诸多挑战。
随着大规模多模态模型的兴起,利用AI技术生成叙事性视频成为研究热点。但现有方法如MINT Video和TTT-Video在生成长视频时,存在维持视觉连贯性和叙事一致性等挑战,单个视频片段生成虽质量提升,多片段组合时又出现过渡生硬、内容重复等问题,影响观看体验且限制了AI在动画制作领域的应用范围。
德国初创公司Neura Robotics正在寻求筹资最多达10亿欧元,以准备推出人形机器人。