Google 发表了最新一代模型 Gemini 2.0,宣布走入 AI 代理人时代!并更新了三项 AI 助理原型(prototype): Project Mariner、 Project Astra、Jules。首席执行官 Sundar Pichai 表示「如果 Gemini 1.0 是关于组织和理解信息,那 Gemini 2.0 就是让信息变得更有用。」
AI 自动浏览网站的 Project Mariner
Project Mariner 可理解和推理用户浏览器屏幕中显示的信息,包括像素、文本、代码、图像和表格等内容,再通过 Chrome 扩充功能代替用户完成任务。
Google 展示的一项使用情境是「搜索公司联系电子邮件地址」,AI 扩充程序会先从 Google 试算表中提取并记住公司名称列表,接着自动搜索这些公司的官网、浏览网站、寻找联系信息的区块、提取出电子邮件地址,最终将结果整理成列表返回给用户。
其特色在于能自动完成多个步骤,免去用户手动操作重复性动作,且全程都会展示推理和浏览网页的过程,确保高透明度。
Mariner 还可以在电商网站 Etsy 搜索框中输入「色彩鲜艳的颜料」后,查看搜索结果,再根据用户的需求,如价格、外观等,筛选出符合条件的颜料商品,自动将商品加入购物车,最终询问用户是否确认购买。
为了保障安全性,Project Mariner 只能在浏览器活跃的标签中输入、滚动页面或点击,且会要求用户在某些敏感动作(例如购物)之前进行最后确认。目前此功能提供给测试人员。
日常生活的 AI 助理 Project Astra
在今年稍早的 I/O 大会上 Google 已公开了 AI 助理计划「Project Astra」,能在日常生活中处理多模态信息、理解用户的背景,并在对话中自然地做出回应。
Google 当时展示 AI 通过画面就能回忆起并找到曾经看到过的眼镜、理解代码、为画面下注解等,标榜以更自动化且自然的方式和用户交互。现在有 Gemini 2.0 的支持后,Astra 有了近一步的更新:
Google 展示了几位测试者使用 Astra 的心得视频,可看到 Astra 的使用情境横跨协助用户制定马拉松训练计划、翻译外语、解释不熟悉的概念等。
开发者的 AI 助理:Jules
Jules 是专为开发人员提供协助的 AI 助理,可直接集成到 GitHub 工作流程中,在开发人员的指导和监督下,解决问题、制定计划并运行,这是 Google 为所有领域打造 AI 代理人的一环。
游戏 AI 助理
Google 于上周发表了世界模型 Genie 2,可通过单一图像创建无数种可玩的 3D 场景,现在 Google 藉 Gemini 2.0 打造了代理人,可以帮助用户探索游戏的虚拟世界,只须根据屏幕上的动作即可推理游戏,并在即时对话中提供下一步动作的建议。
Google 目前已和 Supercell 等游戏开发商合作,并在《部落冲突》、《卡通农场》等游戏试验 AI 代理人的能力,且能加以利用 Google 搜索为用户提额外的游戏知识。
版权声明
本文为本站原创内容,转载需注明文章来源(https://www.eiefun.com),另:文中部分素材可能会引用自其他平台,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除