新智慧报告主编:Aeneas KingHZ 【新智慧导论】谷歌是否受中国全球化模式束缚?就在刚刚,精灵3突然进入公测,一句话生成互动宇宙,直接在网页上安装世界模型。网友大呼:“这次我们真的进入了黑客帝国!”中国开源力量再次压倒硅谷!昨天,蚂蚁灵博宣布推出LingBot-World模型。一旦发布,这将是 SOTA。当外国互联网用户感到惊讶时,谷歌似乎感到了威胁。当天早些时候,谷歌正式宣布“精灵3现已进入公开测试版!”这确实令人震惊。如您所知,Google 在去年 8 月预览了 Genie 3,此后就没有采取任何进一步行动。在中国人工智能力量的支持下,谷歌版的《黑客帝国》精品就在这里。只需一句话,任何人都可以实时创建互动世界。更令人惊讶的是,精灵3还拥有因此与Google Nano Banana Pro合作,首次在网页上安装全局模型。嗯,X充满了网友所做的疯狂真实测试。人们纷纷感叹:“精灵3太爆炸了,这就是未来!”四个月后,精灵 3 终于面世。去年8月,谷歌宣布了Genie 3的消息,这是一个能够生成各种交互环境的通用世界模型。即使在早期阶段,客座测试人员也正在创造各种令人惊叹的体验。今天,Project Genie 正式向美国的 GoogleAIUltra 订阅者(18 岁以上)开放测试。在这里,你不是“看到”世界,而是创造它、进入它并探索它。世界模型的本质是让人工智能理解和预测世界如何运作。迄今为止,人工智能在国际象棋和围棋等封闭规则游戏中表现良好,但转向真正的通用人工智能将需要解决这些挑战。现实世界中没有脚本。这正是 Genie 3 的使命。 Genie 3 系统密钥在线提交的文字不再是静态的3D场景,而是随着用户移动而实时生成的世界。当你向前走的时候,你会看到一条路。当你改变习惯时,世界就会相应地适应。从训练机器人、制作动画和写小说到探索现实生活中的地点和历史场景,精灵 3 想要“模拟这一切”。 Project Genie 是您使用此功能的第一个途径。 Genie 3+Nano Banana Pro+Gemini 全面整合。简而言之,这是一个由 Genie 3、Nano Banana Pro 和 Gemini 提供支持的 Web 应用程序。整个体验围绕着三件事:描绘世界、探索世界、创造世界。首先,您必须使用文本和视觉提示来设计您的世界和角色。 Nano Banana Pro 生成可调整的图像预览,这些预览是世界的草图。 )。此功能允许您在进入游戏之前预览世界的最终外观并修改图像。您可以定义角色的观点,如第一人称或第三人称。 Genie 3 的世界模型会在您移动时实时生成环境。这就是对世界的探索。最后,您可以组合图库中的现有世界或探索全新的世界(世界混音)。例如,如果你喜欢这个草原世界,但想和另一个角色一起探索它,你可以直接用自然语言修改草图。另外,你可以通过改变角色和环境来创造任意数量的新世界。众所周知,在过去,虚拟世界仍然以玩家的第一人称视角为主。如果你能克服直接一代、多机位、多机位场景,随时随地都可以做到。你也可以成为一名导演。网友真实测试:网络《修仙》a16z合伙人Justin Moore提前获得了Project Genie的访问权,并测试了数十个关键词。他表示,这与他测试过的其他全球模型完全不同。你可以得到通过文字和照片来描绘场景,并设计出能够深入其中并自由探索的角色。在物理、记忆和控制方面,Project Genie 真正达到了新的境界:“像你说话一样说话”。一个词、一个世界、玄幻小说的小世界就这样诞生了。贾斯汀·摩尔尝试了两个简单但典型的例子。这些迹象表明人工智能对物理学的理解开始流行。在第一个场景中,他试图让他的角色驾驶汽车,这实际上会导致碰撞,因为游戏不允许角色穿透固体物体。在第二个场景中,系统不允许角色通过关闭的门。模型的记忆并不完美,但随着场景的进展,当你离开和返回时,模型会记住之前的情况。在第一个片段中,贾斯汀·摩尔继续成为一名惊慌失措的邓肯甜甜圈员工。在第二个剪辑中,它是一只狗(添加了沙子和水物理!)。最好的部分是控件。就像在电脑游戏中一样,您可以使用 WASD 在场景中移动,并使用四向方向键调整摄像机角度。 Project Genie不仅跟随你这个“世界的主人”,还可以让你从新的角度看到同一个场景,让你身临其境。经历过这一点后,投资者很快预测 2026 年将是 models.globals 的关键一年。除了过去以游戏为代表的虚拟世界之外,还出现了两种不同的世界模型:Google Project Genie和李飞飞的3D世界模型。精灵具有非常好的(但不是完美的)记忆力和一致性,以及巨大的探索空间。它实时创建世界,您最多可以探索 1 分钟。 Marble 生成了一个不同的 3D 世界,您可以在其中停留任意时间(您可以随时回来,世界将始终相同)。保持一致)。两条路径都可以永久生成持久世界,并且都很好并且适合不同的用例。您可以根据您的需要进行选择。沃顿商学院教授 Ethan Mollick 事先体验了 Genie3 的世界建模。首先,我们由一位头戴鸭子的水獭航空公司飞行员进行了一次“精神之旅”,漫步在罗斯科风格的机场。他还尝试让水獭穿着西装在哥特式尖塔林立的城市上空飞行。此外,他还还原了《哈姆雷特》的世界,但角度比较困难。教授还使用 Genie 3 生成了一个“递归世界”。战士“头上有一个屏幕”,实时显示另一个“末日”。这是《毁灭战士》,但墙壁完全由屏幕组成,《毁灭战士》也在屏幕上运行。里面还有一个“末日”陆战队员,它的头是另一个运行“末日”的屏幕。这些视频中的运动和物理效果看起来惊人地一致。不过,他认为“从建模和物理角度来看,这是一个巨大的进步,但仍然存在问题。”难怪网友评价其为“凡尔赛宫”。谷歌 DeepMind 研究人员使用 Genie 3 模拟一只会飞的猫。请注意,如果你驾驶直升机绕圈飞行,地图也会随之变化,效果会很惊人。显示轨道的初始图像允许精灵继续沿着轨道行驶,而无需进一步交互。更神奇的是,和游戏一样,精灵为你创造了一个可以无限转世的世界。你万万没想到,即使你掉入深渊,精灵也会直接将你转生到新的地方!谷歌首席执行官皮查伊尝试过并表示感觉很棒。游戏结束你越来越近了吗?毫无疑问,Genie 3 可以用来玩游戏。网友GrandDiTwo创造了第一款人工智能视频游戏并问道:“游戏行业的末日是否即将到来?”这个Genie 3是“GPT-2”级别的版本,它并不完美,但它具有无限的可能性。正如GPT最终导致了软件中的大气编程现场,网友们开始想象“氛围设计”未来可能会出现在电子游戏中。等待《GTA 6》12年的玩家们看到下面这张照片时一定会感到惊讶。 GTA 6 正式版还没出来,但 AI 版来了!玩家们完全着迷了。无需等待 Rockstar 交付成品。 AI让你早点进入这个世界,精灵3很棒。有人仅使用《塞尔达传说:荒野之息》中的素材创建了这个伪 3D 游戏世界。开阔的草原、层次分明的地形、变幻莫测的景观以及光影营造出具有强烈塞尔达传说气息的引人注目的画面。这些都是Genie 3自动生成的,具体生成过程如下。任天堂的律师在线创建了他自己的刺客信条版本,并穿越回古罗马,体验凯撒的刺杀。是不是很刺激呢? Fortnite 屏幕,精灵是 g直接生成。这是真正的《最后生还者》游戏还是《精灵 3》的实时游戏?不,我根本无法区分。 Genie 3 将带您进入 Nightcrawler 的世界和这家夜间餐厅。只需一个提示,精灵 3 就会生成一个地铁冲浪者的可玩世界。游戏行业的未来将是疯狂的!最后,令人兴奋的是,我们可以在 2026 年看到 Genie 4。网友们纷纷发表了类似哈萨比斯的评论。 “快点给我们上菜吧,我们已经等不及了!”参考文献: https://x.com/GoogleDeepMind/status/2016919756440240479 https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/https://x.com/venturetwins/status/2016919922727850333
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)已上传由网易号用户发布,网易号是一个仅提供信息存储服务的社交媒体平台。