Google持续拓展Gemini能力,朝向“世界模型”(World Model)方向前进,这是开发出更新、更实用的通用AI助理之关键,也就是说,这将成为一款能够理解用户所处场景,根据个人要求、通过任何设备,替人们采取行动的智慧AI助理。
经过上周Google I/O 2025开发者大会,可观察到Google以惊人速度汇聚强大AI能力,涵盖多种底层模型架构和应用产品。Google挥舞着Gemini大旗,推出一系列创新技术,迅速集成至各项产品中。
除吸睛功能外,Google更擘画远大的愿景:使“世界模型”成为AI时代的专属操作系统。这不是指传统的磁盘启动系统,而是可供所有应用程序都能利用AI。“世界模型”驱动的通用AI助理,能够理解人们身处的世界,代替人们进行推理、采取行动。
Google DeepMind首席执行官哈萨比斯(Demis Hassabis)在首日主题演讲清楚阐述Google宏伟愿景,继续加倍努力投入开发AGI(Artificial General Intelligence,通用人工智能)。他称Gemini虽然已经是最好的多模态模型,Google努力将其延伸成“世界模型”,能像大脑一样,理解并模拟世界的各个面貌来制定计划,并构思全新体验。
Google DeepMind在Genie 2等模型上的研究成果,揭示“世界模型”发展方向。其实从2024年底以来,哈萨比斯在多场公开活动持续阐述“世界模型”及其构建通用AI助理的愿景,也是Google迈向AGI之路的关键。
这样的愿景在Google I/O 2025有了具体呈现,例如发布名为“Flow”的形象创作新工具,背后由Veo 3模型驱动而成;Project Astra能够探索未来通用AI助理的能力,让它理解人们周边的世界,现在Project Astra已与Gemini Live集成。
Google I/O 2025揭晓的开发者工具则是搭建“世界模型”的基石,包括具备Deep Think功能的Gemini 2.5 Pro、高效的Gemini 2.5 Flash等模型。Google也让Gemini Diffusion亮相,意味着Google愿意突破传统,取得更高效率、更低延迟。
值得关注的是,微软在企业软件领域拥有稳固地位,但若Google能够提供真正的通用AI助理并由“世界模型”驱动,有机会一举超车微软。
AI竞赛也是一场与时间的赛跑,执行速度攸关成败。过去几年Google常因行动缓慢、落后竞争对手饱受批评。但以Gemini为核心大力推动AI下,Google在多个战线稳健投入,已经获得比竞争对手更快的增长。
(首图来源:Google Blog)
本网通过AI自动登载内容,本文转载自MSN,【提供者:十轮网科技资讯 | 作者:佚名】,仅代表原作者个人观点。本站旨在传播优质文章,无商业用途。如不想在本站展示可联系删除。