8000 GitHub - aheizi/scout: Scout 是一个基于 Roo Code VS Code 扩展 设计的实验性 Agent 实现。它专注于通过模拟人类行为进行精准的网络信息收集、研究与交互,旨在将 Roo Code 转变为一个强大的 Web 研究助手。
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content
/ scout Public
forked from yan5xu/scout

Scout 是一个基于 Roo Code VS Code 扩展 设计的实验性 Agent 实现。它专注于通过模拟人类行为进行精准的网络信息收集、研究与交互,旨在将 Roo Code 转变为一个强大的 Web 研究助手。

Notifications You must be signed in to change notification settings

aheizi/scout

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Scout Agent - A Web Research Agent for Roo Code

Twitter Follow

Scout 是一个基于 Roo Code VS Code 扩展 设计的实验性 Agent 实现。它专注于通过模拟人类行为进行精准的网络信息收集、研究与交互,旨在将 Roo Code 转变为一个强大的 Web 研究助手。

项目目标

本项目旨在展示如何通过精心设计的 Prompt 和 MCP (Model Context Protocol) 配置,为 Roo Code 框架赋予强大的网络信息收集和深度交互能力。Scout 的核心价值在于其定义的 Web 研究工作流利用用户登录访问私域信息 的能力,使得基于 LLM 的 Agent 能够突破公开信息的限制。

核心特点

  • 专注 Web 研究: Scout 的设计目标是成为一个专业的网络信息收集与分析助手。
  • 纯 Prompt 工程: Agent 的核心逻辑、工作流程和多平台策略完全通过 Prompt (.roorules-scout, .roo/system-prompt-scout) 定义,展示了在 Roo Code 框架内进行 Agent 定制的潜力。
  • 深度 Web 交互: 利用集成的 MCP 工具,特别是增强版的 playwright-mcp-bypass(内置反检测机制),实现复杂的网页操作。
  • 访问私域信息: 核心创新点在于引导用户在浏览器中登录个人账号,使 Scout 能够抓取和分析需要登录才能访问的内容(如社交媒体、专业论坛的非公开帖子),显著增强信息获取能力。
  • 高性价比: 在 deepseek-v3 等模型上运行时,完成一次深度搜索任务的成本效益高(约 0.1元人民币)。
  • 结构化与可溯源: 遵循定义好的研究流程,并强调对所有关键信息标注来源 URL,确保结果的可靠性。
  • 人机协作: 在自动化流程遇到障碍(如登录、验证码)时,能通过 Roo Code 的机制请求用户介入。

工作原理

Scout 通过在 Roo Code 框架内执行一系列预定义的规则和流程来工作。

核心工作流程图:

graph TD
    A["任务定义与规划 (Scout Prompt)"] --> B{"选择信息渠道 (Scout Logic)"}
    B --> C["初步搜索 (google-search MCP)"]
    C --> D{"需要深入交互/访问特定平台? (Scout Logic)"}
    D -- 否 --> G["分析与整合 (Scout Logic)"]
    D -- 是 --> E{"静态页面? (Scout Logic)"}
    E -- 是 --> F1["获取内容 (fetcher MCP)"]
    E -- 否 --> F2{"需要登录/复杂交互? (Scout Logic)"}
    F1 --> G
    F2 -- 否 --> H["交互与提取 (playwright-mcp-bypass MCP)"]
    F2 -- 是 --> I["请求用户登录 (playwright + ask_followup_question Tool)"]
    I --> J["用户在浏览器中登录"]
    J --> H
    H --> G
    G --> K["成果呈现 (Scout Response)"]

    style F1 fill:#f9f,stroke:#333,stroke-width:2px
    style H fill:#ccf,stroke:#333,stroke-width:2px
    style I fill:#f9f,stroke:#333,stroke-width:2px
    style C fill:#f9f,stroke:#333,stroke-width:2px
Loading

流程说明:

  1. 任务输入: 用户在 VS Code 的 Roo Code 扩展中,切换到 scout 模式,并输入研究任务。
  2. 规划与搜索: Scout 根据其 Prompt 规则,规划搜索策略,并指示 Roo Code 使用 google-search MCP 进行初步探索。
  3. 工具选择与执行: 根据目标网站的类型(静态、动态、需登录),Scout 指示 Roo Code 调用 fetcherplaywright-mcp-bypass MCP。
  4. 交互与登录: 对于需要登录的网站,Scout 会请求用户在 playwright-mcp-bypass 控制的浏览器中完成登录,随后继续执行信息提取。
  5. 分析与呈现: Scout 整合收集到的信息,并通过 Roo Code 界面向用户报告研究结果,包含来源链接。

详细的工作流程、工具选择逻辑和平台规则定义在 .roorules-scout 文件中。

技术栈/依赖

  • 运行环境: Roo Code (VS Code Extension)
  • 推荐 LLM: deepseek-v3 (或其他性能相近的模型,在 Roo Code 扩展设置中配置)
  • MCP 工具 (需单独运行):

如何开始

使用 Scout Agent 非常简单:

  1. 确保基础环境:
    • 已安装 VS Code
    • 已安装 Roo Code 扩展配置好 AI Provider (如 deepseek-v3)。
    • 确保 npx 可用,并已分别启动以下 MCP 服务:
      • npx google-search-mcp
      • npx -y fetcher-mcp
      • npx playwright-mcp-bypass (参考 其仓库 说明运行)
  2. 获取本项目:
    git clone https://github.com/yan5xu/scout.git
  3. 打开项目: 使用 VS Code 打开刚刚克隆的 scout 文件夹。
  4. 切换模式: 在 Roo Code 扩展的聊天界面中,你应该能看到 scout 模式。切换到此模式。
  5. 开始使用: 现在你可以向 Scout Agent 分配网络研究和信息收集任务了。

(请确保 .roo/mcp.json 文件中的配置与你实际运行 MCP 服务的方式一致。)

项目文件说明

这些文件是 Scout Agent 的核心配置,用于指导 Roo Code 扩展的行为:

  • .roorules-scout: 定义了 Scout Agent 的核心工作流程、规则、工具选择逻辑和多平台搜索策略。
  • .roo/system-prompt-scout: 包含了 Scout 模式的系统级 Prompt,定义了其角色、能力和 MCP 工具使用指南。
  • .roomodes: 定义了 scout 自定义模式,供 Roo Code 扩展加载。
  • .roo/mcp.json: 为 Roo Code 扩展配置了 Scout 所需的 MCP 服务器。

联系作者

About

Scout 是一个基于 Roo Code VS Code 扩展 设计的实验性 Agent 实现。它专注于通过模拟人类行为进行精准的网络信息收集、研究与交互,旨在将 Roo Code 转变为一个强大的 Web 研究助手。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published
0