Google谋划宏伟愿景:Gemini打造“世界模型”和通用AI助理

Google持续拓展Gemini能力,朝向“世界模型”(WorldModel)方向前进,这是开发出更新、更实用的通用AI助理之关键,也就是说,这将成为一款能够理解用户所处场景,根据个人要求、通过任何...

Google谋划宏伟愿景:Gemini打造“世界模型”和通用AI助理-图1

Google持续拓展Gemini能力,朝向“世界模型”(World Model)方向前进,这是开发出更新、更实用的通用AI助理之关键,也就是说,这将成为一款能够理解用户所处场景,根据个人要求、通过任何设备,替人们采取行动的智慧AI助理。

经过上周Google I/O 2025开发者大会,可观察到Google以惊人速度汇聚强大AI能力,涵盖多种底层模型架构和应用产品。Google挥舞着Gemini大旗,推出一系列创新技术,迅速集成至各项产品中。

除吸睛功能外,Google更擘画远大的愿景:使“世界模型”成为AI时代的专属操作系统。这不是指传统的磁盘启动系统,而是可供所有应用程序都能利用AI。“世界模型”驱动的通用AI助理,能够理解人们身处的世界,代替人们进行推理、采取行动。

Google DeepMind首席执行官哈萨比斯(Demis Hassabis)在首日主题演讲清楚阐述Google宏伟愿景,继续加倍努力投入开发AGI(Artificial General Intelligence,通用人工智能)。他称Gemini虽然已经是最好的多模态模型,Google努力将其延伸成“世界模型”,能像大脑一样,理解并模拟世界的各个面貌来制定计划,并构思全新体验。

Google DeepMind在Genie 2等模型上的研究成果,揭示“世界模型”发展方向。其实从2024年底以来,哈萨比斯在多场公开活动持续阐述“世界模型”及其构建通用AI助理的愿景,也是Google迈向AGI之路的关键。

这样的愿景在Google I/O 2025有了具体呈现,例如发布名为“Flow”的形象创作新工具,背后由Veo 3模型驱动而成;Project Astra能够探索未来通用AI助理的能力,让它理解人们周边的世界,现在Project Astra已与Gemini Live集成。

Google I/O 2025揭晓的开发者工具则是搭建“世界模型”的基石,包括具备Deep Think功能的Gemini 2.5 Pro、高效的Gemini 2.5 Flash等模型。Google也让Gemini Diffusion亮相,意味着Google愿意突破传统,取得更高效率、更低延迟。

值得关注的是,微软在企业软件领域拥有稳固地位,但若Google能够提供真正的通用AI助理并由“世界模型”驱动,有机会一举超车微软。

AI竞赛也是一场与时间的赛跑,执行速度攸关成败。过去几年Google常因行动缓慢、落后竞争对手饱受批评。但以Gemini为核心大力推动AI下,Google在多个战线稳健投入,已经获得比竞争对手更快的增长。

(首图来源:Google Blog)

本网通过AI自动登载内容,本文转载自MSN,【提供者:十轮网科技资讯 | 作者:佚名】,仅代表原作者个人观点。本站旨在传播优质文章,无商业用途。如不想在本站展示可联系删除。

阅读前请先查看【免责声明】本文来自网络或用户投稿,本站仅供信息存储,若本文侵犯了原著者的合法权益,可联系我们进行处理。 转载请注明出处:https://www.qingcaohe.com/news/18578.html

上一篇 2025年05月28日 14:38
下一篇 2025年05月28日 14:49

相关推荐

联系我们

在线咨询: QQ交谈

邮箱:1217266901@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信