Google谋划宏伟愿景：Gemini打造“世界模型”和通用AI助理-青草河

Google持续拓展Gemini能力，朝向“世界模型”（World Model）方向前进，这是开发出更新、更实用的通用AI助理之关键，也就是说，这将成为一款能够理解用户所处场景，根据个人要求、通过任何设备，替人们采取行动的智慧AI助理。

经过上周Google I/O 2025开发者大会，可观察到Google以惊人速度汇聚强大AI能力，涵盖多种底层模型架构和应用产品。Google挥舞着Gemini大旗，推出一系列创新技术，迅速集成至各项产品中。

除吸睛功能外，Google更擘画远大的愿景：使“世界模型”成为AI时代的专属操作系统。这不是指传统的磁盘启动系统，而是可供所有应用程序都能利用AI。“世界模型”驱动的通用AI助理，能够理解人们身处的世界，代替人们进行推理、采取行动。

Google DeepMind首席执行官哈萨比斯（Demis Hassabis）在首日主题演讲清楚阐述Google宏伟愿景，继续加倍努力投入开发AGI（Artificial General Intelligence，通用人工智能）。他称Gemini虽然已经是最好的多模态模型，Google努力将其延伸成“世界模型”，能像大脑一样，理解并模拟世界的各个面貌来制定计划，并构思全新体验。

Google DeepMind在Genie 2等模型上的研究成果，揭示“世界模型”发展方向。其实从2024年底以来，哈萨比斯在多场公开活动持续阐述“世界模型”及其构建通用AI助理的愿景，也是Google迈向AGI之路的关键。

这样的愿景在Google I/O 2025有了具体呈现，例如发布名为“Flow”的形象创作新工具，背后由Veo 3模型驱动而成；Project Astra能够探索未来通用AI助理的能力，让它理解人们周边的世界，现在Project Astra已与Gemini Live集成。

Google I/O 2025揭晓的开发者工具则是搭建“世界模型”的基石，包括具备Deep Think功能的Gemini 2.5 Pro、高效的Gemini 2.5 Flash等模型。Google也让Gemini Diffusion亮相，意味着Google愿意突破传统，取得更高效率、更低延迟。

值得关注的是，微软在企业软件领域拥有稳固地位，但若Google能够提供真正的通用AI助理并由“世界模型”驱动，有机会一举超车微软。

AI竞赛也是一场与时间的赛跑，执行速度攸关成败。过去几年Google常因行动缓慢、落后竞争对手饱受批评。但以Gemini为核心大力推动AI下，Google在多个战线稳健投入，已经获得比竞争对手更快的增长。

（首图来源：Google Blog）

本网通过AI自动登载内容，本文转载自MSN，【提供者：十轮网科技资讯 | 作者：佚名】，仅代表原作者个人观点。本站旨在传播优质文章，无商业用途。如不想在本站展示可联系删除。

阅读前请先查看【免责声明】本文来自网络或用户投稿，本站仅供信息存储,若本文侵犯了原著者的合法权益，可联系我们进行处理。转载请注明出处：https://www.qingcaohe.com/news/18578.html

Google谋划宏伟愿景：Gemini打造“世界模型”和通用AI助理

相关推荐

工信部：截至 6 月末我国 5G 移动电话用户达 11.18 亿户

探索通义大模型在 PC 端侧落地：阿里云官宣与惠普签署合作备忘录

蔚来乐道 L90 明日起全面开启试驾，覆盖 140 城 400 多家门店

AMD 推首款 BF16 精度 SD3.0Medium 模型，对 XNDA2 NPU 优化

127 款国产网络游戏获批版号，《暗黑破坏神 IV》等进口游戏获批

智元回应和宇树中标 1.24 亿元人形机器人大单，称没有交付压力

联系我们