Project Mariner – 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物
2025-01-10 16:39:18 小编:六六导航站
Project Mariner是什么
Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展程序实现浏览器自动化,理解和执行网页任务。Project Mariner能理解和推理浏览器屏幕上的信息,包括像素和网页元素,基于 Chrome 扩展程序使用这些信息完成任务。Project Mariner 能控制 Chrome 浏览器、移动屏幕上的光标、点击按钮和填写表格,像人类一样使用和浏览网站。Project Mariner在 WebVoyager 基准测试中达到 83.5% 的高分成绩。目前,Project Mariner 只能在浏览器的活动选项卡中执行键入、滚动和点击操作,在执行某些敏感操作(如购买物品)之前,会要求用户进行最终确认。

Project Mariner的主要功能
多模态理解:理解浏览器屏幕上的所有内容,包括像素、文本、代码、图像和表单等数据。浏览器交互:实时导航和操作复杂的网站,自动执行浏览器中的任务,保持用户的控制权。自动化任务:自动与浏览器进行交互操作,将数据整理、填充到网页其他区域,同时将数据按照用户的要求整理好。复杂指令处理:理解、执行复杂的用户指令,分解为可执行的步骤。关系理解:理解不同网页元素之间的关系及其功能。视觉反馈:在执行任务时提供视觉反馈和更新,让用户了解进度。安全性:在执行敏感操作(如购物和付款)之前,会要求用户进行最终确认,确保安全性。如何使用Project Mariner
Project Mariner目前处于早期测试阶段,仅对少数测试者开放,访问Project Mariner的官方网站,加入等候名单。
Project Mariner的应用场景
数据整理与复制:将网页上的数据复制到电子表格中进行整理,例如从存储大量数据的网页提取信息,整理到Excel等表格软件中。在线购物:根据用户给出的购物清单,自动在电子商务网站上搜索商品添加到购物车。旅行规划:帮助用户查找航班和酒店信息,自动化旅行规划过程中的网页浏览和信息比较。日常购物:为用户在零售网站上购物,如搜索、购买家庭用品。食谱查找:在食谱网站上根据用户需求自动搜索和选择食谱。- 猜你喜欢
-
词魂提示指令
-
ChatGPT Shortcut提示指令
-
Learning Prompt提示指令
-
-
PromptVine提示指令
-
-
-
MJ Prompt Tool提示指令
-
绘AI提示指令
- 相关AI应用
-
AIPRM提示指令
-
Snack Prompt提示指令
-
PublicPrompts提示指令
-
Generrated提示指令
-
LangGPT提示指令
-
AI Short提示指令
-
-
ClickPrompt提示指令
-
PromptHero提示指令
- 推荐AI教程资讯
- Perplexideez – 开源本地AI搜索助手,智能搜索信息来源追溯
- Micro LLAMA – 教学版 LLAMA 3模型实现,用于学习大模型的核心原理
- GenCast – 谷歌DeepMind推出的AI气象预测模型
- FullStack Bench – 字节豆包联合M-A-P社区开源的全新代码评估基准
- Motion Prompting – 谷歌联合密歇根和布朗大学推出的运动轨迹控制视频生成模型
- Fish Speech 1.5 – Fish Audio 推出的语音合成模型,支持13种语言
- ClearerVoice-Studio – 阿里通义实验室开源的语音处理框架
- PaliGemma 2 – 谷歌DeepMind推出的全新视觉语言模型
- Optimus-1 – 哈工大联合鹏城实验室推出的智能体框架
- Fox-1 – TensorOpera 开源的小语言模型系列