23
2025
05

九游体育app官网该模子使用与大谈话模子雷同的因果掩码进行磨砺-九游「中国」jiuyou·官方网站-登录入口

发布日期:2025-05-23 12:48    点击次数:109

Genie 2象征着东说念主工智能在虚构全国生成界限的又一次冲破九游体育app官网。

12月5日凌晨,就在OpenAI文牍将于未来12天不息进行12场发布会直播时,Google DeepMind同期在官网发布了大型基础全国模子Genie 2,可通过单张图片和翰墨描述生成种类各种的可玩3D全国。算作本岁首推出的 Genie 模子的升级版,Genie 2象征着东说念主工智能在虚构全国生成界限的又一次冲破。

DeepMind败露,Genie 2具备从不同视角(如第一东说念主称视角与等距视角)生成连贯全国的才调,这些生成的全国可执续时刻长达一分钟,但多数情况下防守在10到20秒之间。

博客中放出了无数由模子生成的视频示例,来展示Genie 2在行动截至、长视界操心、长视频生成、NPC、物理等方面的扫尾与上风。举例,输入“丛林中的可人东说念主形机器东说念主”,模子便可构建一个包含机器东说念主变装和可探索环境的动态场景。用户不错通过键盘或鼠标操作变装活着界中进行朝上、游水等互动。

据悉,过程视频磨砺,该模子好像精确模拟物体的交互、动画扫尾、照明、物理征象、反射扫尾以及“NPC”(非玩家变装)的步履。很多生成的场景画质接近 3A级别的电子游戏,甚而在物体视角一致性和场景操心方面阐述优异。

本领方面,谷歌提到,Genie 2 是一个自总结潜在扩散模子,在大型视频数据集上进行磨砺。过程自动编码器后,视频中的潜在帧被传递到大型Transformer能源学模子。该模子使用与大谈话模子雷同的因果掩码进行磨砺。在推理时, Genie 2能以自总结模式进行采样,逐帧得回单个动作和夙昔的潜在帧。

谷歌对全国模子策动的参加正在执续扩大。本年 10 月,DeepMind 聘任了OpenAI前视频生成名堂厚爱东说念主Tim Brooks,同期两年前从Meta挖来了以敞开式现实闻明的Tim Rocktäschel。与之一样的模子还有“AI教母”李飞飞创立的 World Labs 和以色列初创公司 Decart 的居品。

天然大多数基础全国模子不错模拟游戏和 3D 环境,但还存在伪影、一致性和幻觉联系的问题。Google DeepMind还在博客临了放了一些意旨兴味意旨兴味的“花絮”,Genie 2生成出一些奇怪视频,比如莫得选拔行动的情况下一个“幽灵”出咫尺花圃,在雪场的东说念主物变装从滑板上跳下来,比拟滑雪更爱跑酷,以及一个魔法球爆炸。

就3D游戏生成这一界限策动,谷歌还暗意,游戏在东说念主工智能策动界限阐述着迫切作用。游戏的蛊惑力、专有的挑战组合和可预计的进展使其成为安全测试和鼓舞 AI 才调的理念念环境。自 Google DeepMind 建造以来九游体育app官网,游戏就一直相配迫切,是策动的重点。然而,磨砺更通用的具身智能体的传统瓶颈在于珍惜满盈丰富和各种化的磨砺环境。



相关资讯
热点资讯


Powered by 九游「中国」jiuyou·官方网站-登录入口 @2013-2022 RSS地图 HTML地图