制作者 |虎秀科技群作者|发布者:于洋 |标题图片由苗正庆提供 |视觉中国11月19日报道,Google Home旗舰Gemini 3 Pro上市。官员们表示,它的编码和推理能力有所提高,变得不那么“讨人喜欢”了。不难看出,谷歌瞄准的是其竞争对手ChatGPT。该模型被称为谷歌迄今为止“最智能”和“最准确”的模型,首次向所有用户推出,并将在推出的第一天提供体验。谷歌DeepMind高级总监兼产品负责人Tulsi Doshi表示,随着谷歌搜索引擎的不断发展,这一新模式将帮助谷歌实现“人人可访问、人人可用”的信息目标。 “我认为朝这个方向迈出的一大步是摆脱简单地用文本响应并能够移动的模式。”简单地说,Gemini 3 Pro 具有“原生多模态”功能,可以处理文本、图像和文本。同时播放音频。传统的文本之间单一交互的状态得到了改善,改进的编码能力也能产生更好的视觉效果。谷歌官方演示展示了AI RNA处理,整体表现流畅。据谷歌官方介绍,Gemini 3 Pro还可以翻译菜谱照片并将其转换为菜谱。此外,它还可以根据一系列视频会议创建交互式抽认卡。 Gemini 应用程序允许用户通过集成 Canvas 创建更完整的程序。更新的 AI 模型支持“生成界面”,可以创建带有可见图像的类似杂志的视觉格式和动态布局,可以根据用户指令创建个性化用户界面。该工具目前仍在测试中。在搜索功能方面,Gemini 3 Pro可以根据用户搜索显示图像、表格、网格和模拟等视觉元素。谷歌表示技术允许不仅可以将问题分解为搜索部分,还可以更好地理解用户的搜索意图:“查找您可能错过的新内容”。谷歌在回应 OpenAI 时毫不掩饰地暗示,Gemini 3 Pro 并不像 ChatGPT 那样充满空洞的陈词滥调。多西表示,Gemini 3 Pro 的响应方式有“重大”变化,谷歌将其描述为“智能、简洁和直接,抛弃陈词滥调和陈词滥调,传递真实信息,告诉你的不仅仅是你想听的,而是你需要听的。”除了这些改进之外,Gemini 3 Pro还具有更强大的推理能力和智能代理选修功能,让您完成更复杂的任务并“自信地执行您的长期计划”。谷歌表示,该模型增强了 Gemini 中可用的实验性 Gemini Agent 功能,该功能允许用户在应用程序内执行检查和组织电子邮件、搜索和预订旅行等任务。在其他方面换言之,谷歌此次推出的不仅仅是单一的产品模型,而是一个涵盖AIGC、AI应用、AI搜索、AI代理等全领域战略的“智能魔方”。在官方的Benchmark Formula 21基准测试中,Gemini 3 Pro的OCR和代理编码性能相对较弱,但在几乎所有其他指标上都要好得多,具有相当大的优势。不仅如此,谷歌还分别强调了三个指标:Final Human Test、Terminal Workbench 2.0 和 SimpleQA Verified,并指出了 Claude Sonnet4.5 和 GPT-5.1。谷歌表示,Gemini 3 Pro在标准化知识生成、人工智能工具的使用甚至“人工智能”等几个关键指标上都具有整体优势。我想。 Antigravity:“代理优先的未来” 随着Gemini 3 Pro的推出,谷歌还推出了基于Gemini 3 Pro和其他第三方机型的开发工具Antigravity。谷歌称反重力y 支持多个代理,使它们可以直接访问编辑器、设备和浏览器,并且专为“代理优先的未来”而设计。反重力有两个重要组成部分。一是如何报告这项工作。具体来说,当你完成一项任务时,它会生成谷歌所说的“工件”:待办事项列表、计划、屏幕截图、浏览器记录以及其他旨在验证你已完成的操作和即将执行的操作的内容。不仅如此,Antigravity taIt还会报告你的操作和外部工具的使用情况,但谷歌表示,“工件”比模型操作和工具调用的完整列表更容易让用户验证。另一个重大改进是两个主要使用视图的可用性。默认编辑器视图提供了类似于 Cursor 和 GitHub Copilot 等竞争对手的熟悉的集成开发环境 (IDE) 体验,并在侧边栏中显示代理。新的经理视图旨在同时控制多个座席,让每个座席能够更高效地工作无调地。谷歌将其比作“任务控制中心”,“在多个工作空间中并行生成、协调和监控多个代理”。谷歌正在推出更多方式向其人工智能代理提供反馈,允许用户留下评论以供参考,同时执行某些任务而不中断他们的工作。谷歌表示,反重力代理“从以前的工作中学习”并保留执行特定任务所需的特定代码片段和步骤。在官方演示中,Antigravity 通过浏览器创建、测试并运行了一个基本的飞行跟踪应用程序。该测试的结果将被记录。 Antigravity 目前处于公共预览版,支持 Windows、macOS 和 Linux 系统。谷歌最新的攻击并不只是推出一个更大的型号那么简单。我们代理开发平台的开放性揭示了我们打造从模型到应用到开发者的完整生态闭环的雄心。多模态交互将人工智能从信息转变为人工智能d 从“对话者”到“行动者”,他们可以看到、听到、行动和计划。随着人工智能开始理解和操控多媒体世界,3D、全景、沉浸式、互动式的竞赛将在不远的将来成为现实。此内容经作者许可发布。这些观点仅代表作者观点,不代表虎秀立场。如果您对本文有任何异议或投诉,请联系tougao@huxiu.com。本文来自虎秀,原文链接:https://www.huxiu.com/article/4808031.html?f=wyxwapp
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。