如何将网页抓取添加到 Google Antigravity:无抓取 MCP 集成指南
Senior Web Scraping Engineer
主要结论:
- 一个配置块就是整个集成。 Google Antigravity 支持 模型上下文协议。只需将一个
scrapeless块放入~/.gemini/antigravity/mcp_config.json,代理即可获得一个强固的云浏览器,覆盖195个国家的住宅代理,一个 Google SERP 爬虫,一个 Google Trends 爬虫,以及 HTML/Markdown/截图页面助手——所有这些都可以通过 @-提及或自然语言提示在 Antigravity 聊天面板内访问。 - 代理停止被封锁。 Antigravity 提供强大的编码工具,但不包含开箱即用的强固爬虫表面。对于具有重要反机器人保护(Cloudflare Turnstile、Akamai Bot Manager、IP 声誉列表)、仅限 JavaScript 的单页面应用或地理限制列表,云浏览器负责将请求转化为可用响应。通过 Scrapeless Scraping Browser 的路由在每个会话中替换为云端 JavaScript 渲染、住宅代理出口和反检测指纹识别。
- 15+ MCP 工具,一个命名空间。 浏览器原语(
browser_create、browser_goto、browser_get_html、browser_get_text、browser_click、browser_type、browser_press_key、browser_scroll、browser_screenshot、browser_snapshot、browser_close)、一次性页面助手(scrape_html、scrape_markdown、scrape_screenshot)和 Google 数据工具(google_search、google_trends)。代理的规划器在每次调用时选择所需的工具。 - Stdio 是默认设置;HTTP 流式传输是云托管路径。 Stdio 模式以 Antigravity 的子进程运行
npx scrapeless-mcp-server,这是开发者工作站的正确默认设置。HTTP 流式传输模式将代理指向https://api.scrapeless.com/mcp,这是在托管的开发容器、远程工作区或任何npx无法可靠启动的地方的正确默认设置。 - 设计上与模型无关。 Antigravity 通过 Gemini 3 Pro 和 Gemini 3 Flash 路由提示,同时 Claude Sonnet 4.6、Claude Opus 4.6 和 GPT-OSS 作为替代后端通过同一代理循环提供。Scrapeless MCP 集成在所有这些模型中运行相同——协议是契约,而不是模型。
- 与其他 Antigravity MCP 堆栈共存。
scrapeless块与 Context-7、序列思维、BigQuery、AlloyDB 或任何其他已接入的 MCP 服务器并排放置。Antigravity 的规划器通过 @-提及或描述匹配路由工具;工具表面不会发生冲突。 - 免费启动。 新的 Scrapeless 账户包括免费的爬虫浏览器运行时——可在 app.scrapeless.com 注册。完整定价请参见 scrapeless.com/en/pricing。
简介:代理的价值取决于它对实时网络的访问
Google Antigravity 于 2025 年 11 月发布,作为 Google 的代理优先 IDE——围绕 Gemini 3 Pro 和 Gemini 3 Flash 构建的 Visual Studio Code 分支,提供 Claude Sonnet 4.6、Claude Opus 4.6 和 GPT-OSS 作为替代后端。提案很简单:开发者充当建筑师,代理执行构建工作。对于代码生成、重构、文档查询和数据库自省等功能,Antigravity 的内置工具涵盖文件编辑、终端命令、包括的 Workspace MCP 服务器以及代理自己的规划循环。
一旦工作需要当前的公共网页数据,画面就会变得艰难。代理的默认网页获取返回与任何匿名 HTTP 请求相同的 JavaScript 外壳,在商业网站上,渲染的 DOM 位于反机器人工具的挑战、住宅代理限制的 SERP 和仅限 JavaScript 的 SPA 后面,任何无头请求在没有帮助时无法到达。像“打开这个竞争对手的定价页面并提取计划网格”的提示会在目标网站位于 Cloudflare Turnstile 后变得不确定。
这篇文章通过单个配置块将 Scrapeless MCP Server 集成到 Antigravity 中。集成后,代理拥有 15+ MCP 工具,映射到一个强固的云浏览器、一个 Google 搜索爬虫、一个 Google Trends 爬虫和一次性页面助手。代理在每次调用时选择工具;云浏览器处理 JavaScript 渲染、住宅代理出口和反检测指纹;IDE 继续负责代码生成、文件树和终端。有关通过其他 MCP 客户端共享相同 Scrapeless 界面的更多信息——Claude Desktop、Cursor、OpenAI Codex CLI、Gemini CLI、Claude Code、VS Code + GitHub Copilot Chat——请参阅 伴随的 MCP 服务器操作指南。
您可以用它做什么
- 在 IDE 内进行实时 API 和库研究。 通过
scrape_markdown请求代理获取库的当前文档页面,并根据渲染文本进行推理,而不是根据 API 的训练截止记忆进行推理。 - 竞争对手定价快照在工作区中。 将竞争对手的 URL 拖放到代理聊天中;获取结构化的定价行,代理可以将其粘贴到比较文件中,以及使用这些数据的代码。
- 将公共数据集引入正在构建的项目。 让代理浏览目录列表,提取类型记录,并将其直接写入 JSON 记录、SQL 种子或与模型层相邻的 TypeScript 类型。
- 区域感知的 SERP 和趋势信号。 在代理循环中使用
google_search和google_trends来为特征标志、A/B 文案或内容模板提供特定区域的证据。 - 用于 RAG 和项目文档的 Markdown 语料库。
scrape_markdown返回作为干净 Markdown 的发布者页面,代理可以将其分块、嵌入或存储为项目本地上下文。 - 基于屏幕截图的用户体验评审。
scrape_screenshot和browser_screenshot捕获已渲染页面的视觉差异、布局参考或设计输入,代理可以将其附加到对话中。 - 多步骤代理可以按需重新运行的 IDE。 一个
google_search→ 点击顶部结果 → 提取类型记录 → 写入摘要文件计划在单个 Antigravity 代理回合内从头到尾运行,并在提示重新发布时干净地重播。
在 Scrapeless,我们仅访问公开可用的数据,同时严格遵守适用的法律、法规和网站隐私政策。本帖中的内容仅用于演示目的。
为什么选择 Scrapeless MCP 服务器
Scrapeless MCP 服务器是 Scrapeless 网页抓取浏览器 — 可定制的反检测云浏览器,专为 AI 代理设计 — 以及 Scrapeless 数据工具(谷歌搜索、谷歌趋势、页面级抓取助手)前面的协议级接口。针对 Google Antigravity,它提供了:
- 云端 JavaScript 渲染。 云浏览器是完整的 Chromium,在提取之前对页面进行了水合,因此单页应用、无限滚动 feeds 和懒加载面板都是
browser_goto+browser_get_html的一流目标。 - 覆盖195多个国家的住宅代理。 地理限制的查询返回本地用户会看到的列表。代理区域是在 Scrapeless 账户上设置的;每个查询区域选择通过
scrapeless-scraping-browserCLI 公开,适用于需要的工作流。 - 每个会话的反检测指纹。 UA、时区、语言、屏幕分辨率、WebGL 和画布在每次会话中随机化,因此长时间的滚动会话在渲染上与有机流量相同。
- 会话持久性。
browser_create任务 ID 在同一代理回合内的后续browser_*调用中重复使用;cookies、滚动位置和浏览历史都保留在一个云浏览器会话中。 - 一个 MCP 命名空间。 代理所需的每个操作都是一个工具调用 — 可以从 Antigravity 的 MCP 服务器 面板中发现,通过协议进行模式验证,并通过
@scrapeless路由。 - 新账户的免费运行时间。 在 app.scrapeless.com 的免费计划中获取 API 密钥。完整的 MCP 工具表面记录在 github.com/scrapeless-ai/scrapeless-mcp-server,平台文档位于 docs.scrapeless.com。
先决条件
- 安装 Google Antigravity。 在 macOS、Windows 和 Linux 上可用,提供免费层和付费 Pro 与 Ultra 计划 — 从 antigravity.google 下载并使用 Google 账户登录。
- 一个 Scrapeless 账户和 API 密钥 — 在 app.scrapeless.com 注册,并从 设置 → API 密钥管理 中复制密钥。
- 工作站上安装 Node.js 18 或更新版本(Antigravity 使用
npx启动 stdio MCP 服务器)。 - 基本的 JSON 编辑熟悉度 — Antigravity MCP 配置是一个扁平的
mcpServers对象。
安装
设置分为五个子步骤。在第 5 步后停下来以确认线路;帖子其余部分将解释如何通过聊天驱动工具。
1. 获取 Scrapeless API 密钥
在 app.scrapeless.com 上注册,打开仪表板,从 设置 → API 密钥管理 创建一个密钥。复制该值 — 它将在第 3 步的 MCP 配置中使用。
2. 打开 Antigravity 的 MCP 配置
两条等效路径:
UI 路径 — 在 Antigravity 中打开代理会话,点击代理面板顶部的 … 更多选项菜单,选择 MCP 服务器,点击 管理 MCP 服务器,然后 查看原始配置。Antigravity 会在编辑器窗口中打开 mcp_config.json。
直接文件编辑 — 在用户范围路径中打开 mcp_config.json:
- macOS:
~/.gemini/antigravity/mcp_config.json - Linux:
~/.gemini/antigravity/mcp_config.json - Windows:
%USERPROFILE%\.gemini\antigravity\mcp_config.json
Antigravity的MCP配置当前是全球性的——相同的mcpServers对象适用于每个工作区。每个工作区的MCP条目是Antigravity开发者论坛上跟踪的功能请求;在这之前,下面的scrapeless块只需提交一次并适用于所有地方。
3. 添加Scrapeless MCP服务器(stdio模式)
将scrapeless块粘贴在mcpServers下,并替换第1步中的API密钥:
json
{
"mcpServers": {
"scrapeless": {
"command": "npx",
"args": ["-y", "scrapeless-mcp-server"],
"env": {
"SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
}
}
}
}
保存文件。在Antigravity中,返回到管理MCP服务器并点击刷新控制——scrapeless条目应该会出现其工具列表(browser_*、google_search、google_trends、scrape_html、scrape_markdown、scrape_screenshot)。首次运行时,npx -y scrapeless-mcp-server会下载该包;后续的重启将重用缓存版本。
如果Antigravity已经管理其他MCP服务器,请将scrapeless条目附加到现有的mcpServers对象中——不要覆盖文件。顺序无关紧要;规划者通过描述而不是位置发现工具。
4. 或者使用HTTP可流模式(远程或容器绑定的代理)
对于在托管开发容器中、远程工作区、CI沙盒或任何地方npx无法可靠保持长时间存活的子进程,使用HTTP可流端点替换stdio块:
json
{
"mcpServers": {
"scrapeless": {
"type": "streamable-http",
"url": "https://api.scrapeless.com/mcp",
"headers": {
"x-api-token": "YOUR_SCRAPELESS_KEY"
}
}
}
}
这两种模式下都可以使用相同的YOUR_SCRAPELESS_KEY。当主机受到沙盒规则限制时,HTTP可流模式是正确的默认选项;在其他地方,stdio是正确的默认选项。
5. 验证连接
在一个全新的Antigravity代理会话中,输入:
“@scrapeless open https://example.com and tell me the page title.”
代理应该调用browser_create,然后是browser_goto,接着是browser_get_text(或browser_get_html),并回复**“示例域”**。如果返回结果正常,则MCP服务器已连接,API密钥有效,并且云浏览器可以访问。
如果没有,常见的首次运行故障及其修复如下:
| 症状 | 可能原因 | 修复 |
|---|---|---|
MCP面板中未列出scrapeless |
配置未加载 | 点击管理MCP服务器中的刷新控制;如果仍未出现,请重新检查JSON路径及文件解析情况 |
服务器返回Authentication failed / 401 |
API密钥错误或已过期 | 请从仪表板重新复制,粘贴到env.SCRAPELESS_KEY中,重启Antigravity |
npx在第一次调用时挂起 |
npm网络慢或注册表超时 | 在终端中运行一次npx -y scrapeless-mcp-server以预缓存该包,然后重启Antigravity |
MCP启动过程中出现initialize response / connection closed错误 |
JSON-RPC握手期间stdout输出了非JSON内容 | 使用当前的scrapeless-mcp-server版本(日志输出到stderr,JSON-RPC输出到stdout),并确认没有shell包装器注入启动标志 |
工具调用返回Access Denied HTML |
代理池在分配时返回了一个标记的IP | 请代理调用browser_close然后再次调用browser_create;后续分配成功 |
实际使用方法:提示您的Antigravity代理
安装后,代理负责发现→提取循环。MCP服务器提供Antigravity一个类型工具列表;代理根据提示逐步读取工具描述并构建调用。没有需要编写的tools.json,也没有需要从IDE侧发出的手动MCP调用。
有两种方法可以将请求范围限制到Scrapeless:
- @提到服务器。
@scrapeless …告诉Antigravity的规划者在这一轮偏向Scrapeless工具。当多个MCP服务器提供重叠的功能时(例如,多个服务器提供fetch-风格工具时)很有用。 - 隐式地命名工具。 像*“在Google上搜索……”、“渲染页面……”或“将该URL作为markdown抓取”*这样的短语在服务器连接后将路由到
google_search、browser_*和scrape_markdown,无需@提及。
你可以粘贴的提示
| 你输入 | 代理的操作 |
|---|---|
“@scrapeless search Google for vector database benchmarks 2026 and return the top 10 results as JSON.” |
google_search → 输入结果列表。 |
“@scrapeless render the React docs page at https://react.dev/learn/synchronizing-with-effects and give me the markdown.” |
scrape_markdown → 发布者页面作为markdown。 |
“@scrapeless open https://pricing.example.com, scroll the plan table, and return name, price, and feature list as JSON.” |
browser_create → browser_goto → browser_scroll → browser_get_html → 输入提取。 |
"从Google Trends中提取美国的开发工具流行搜索主题。" |
google_trends. |
"@scrapeless 对https://example.com/landing进行全页截图,并将其保存到landing.tsx旁边。" |
scrape_screenshot → 将文件写入工作区。 |
"打开https://www.google.com/search?q=mortgage+rates并返回SERP卡片。" |
默认帐户区域驱动代理出口;通过切换API密钥块固定不同区域(见FAQ)。 |
| "对上一个Google搜索中的每个结果,将页面渲染为markdown并总结为两句话。" | 链接google_search → scrape_markdown × N → LLM总结。 |
"快照https://example.com的主页并报告可访问性树。" |
browser_snapshot. |
示例:Antigravity中的定价页提取
您输入:
"@scrapeless 打开
https://example-saas.com/pricing,将计划网格滚动到底部,并将每个计划的名称、价格和功能要点返回为JSON。将结果保存到打开的工作区中的pricing.json。"
代理的计划(用普通英语描述):
- 调用
browser_create生成一个云浏览器会话。 - 使用定价URL调用
browser_goto。 - 针对计划卡片地标调用
browser_wait_for,以便提取将针对已加载的DOM而不是SPA外壳运行。 - 调用
browser_scroll以露出任何折叠的层,然后browser_get_html。 - 将计划卡片解析为JSON数组;将任何缺失字段视为
null,而不是使提取失败。 - 使用
browser_create返回的sessionId调用browser_close。 - 使用Antigravity的内置文件工具将数组写入
pricing.json。
您得到的结果(示意形状):
json
[
{
"name": "Starter",
"price": "$0 / month",
"features": ["1 seat", "1,000 events/mo", "Community support"]
},
{
"name": "Pro",
"price": "$29 / month",
"features": ["10 seats", "100K events/mo", "Email support", "Custom domains"]
},
{
"name": "Business",
"price": "Contact sales",
"features": ["Unlimited seats", "Custom event volume", "SLA", "SSO/SAML"]
}
]
// 该模式反映代理在被要求提取定价网格时发出的内容。
// 字段值为示例样本。
Antigravity将pricing.json放入工作区树中,并在对话中显示每一步的追踪,以便每个MCP工具调用都可以审计。
形状提示:控制返回内容
| 表达方式 | 效果 |
|---|---|
| "…返回JSON" / "…作为markdown" | 输出格式。 |
| "…字段:仅限名称、价格" | 限制提取。 |
"…并将其保存到工作区中的<path>" |
在抓取后触发Antigravity的内置文件工具。 |
| "…在提取之前点击进入每个卡片" | 触发逐行browser_click + 重新提取。 |
| "…如果HTML提取失败则使用页面截图" | 回退到scrape_screenshot和多模态提取。 |
| "…如果第一次响应为空,则重试一次" | 触发browser_close + browser_create,在新会话中重试。 |
在免费计划中获取您的API密钥:app.scrapeless.com
Scrapeless MCP工具列表
Antigravity在scrapeless服务器连接时发现的完整工具列表:
| 工具 | 目的 |
|---|---|
browser_create |
生成一个云浏览器会话,返回sessionId。 |
browser_goto |
在活动会话中导航到一个URL。 |
browser_wait_for |
阻塞直到选择器渲染。 |
browser_wait |
暂停一段时间(毫秒)。 |
browser_get_html |
返回渲染的DOM作为文本负载。 |
browser_get_text |
返回可见的页面文本。 |
browser_snapshot |
返回当前页面的可访问性树。 |
browser_click |
点击选择器。 |
browser_type |
在输入框中输入。 |
browser_press_key |
驱动键盘事件(Tab、Enter、End、PageDown等)。 |
browser_scroll |
滚动活动文档。 |
browser_scroll_to |
滚动到绝对(x, y)坐标。 |
browser_screenshot |
捕获活动页面的屏幕截图。 |
browser_go_back / browser_go_forward |
导航历史。 |
browser_close |
释放云浏览器会话(需要sessionId — 参数严格使用驼峰命名法)。 |
scrape_html |
一次性获取URL,返回渲染的HTML(不需要会话)。 |
scrape_markdown |
一次性获取URL,返回干净的markdown。 |
scrape_screenshot |
一次性截图URL。 |
google_search |
SERP抓取器,返回输入结果行。 |
google_trends |
提供某个主题在某个区域的趋势数据。 |
browser_*工具通过browser_create返回的sessionId共享状态。scrape_*和Google工具是无状态的,直接通过Scrapeless API路由,而无需生成会话。工具参数在表面上使用驼峰命名法(sessionId、proxyCountry)。
每个下面的模块都是 Antigravity 内部的一个基于提示的工作流。智能体在每个回合选择工具;MCP 服务器负责渲染、代理和 SERP 工作。
1. 功能工作的实时 SERP 和趋势信号
功能标志的副本通常取决于用户当前搜索的内容。请求智能体调用目标区域的话题的 google_trends,然后对主要术语调用 google_search,接着将结果写入运行应用程序所需的固定文件。整个循环在一个 Antigravity 回合内运行,每当提示重新发布时会刷新。
2. 比较文件中的竞争对手定价跟踪器
将竞争对手定价 URL 列表放入聊天中,并要求智能体提取每个页面的计划名称、价格和要点特征,按计划去重,并将合并的表格写入工作区的 competitors.md。后续运行与先前快照对比,只有更新发生变化的行。
3. 公共目录潜在客户列表到项目中
对于潜在客户生成原型,智能体浏览一个公共目录(软件供应商、本地企业或持牌专业人员的列表),每个详细页面调用 browser_goto,提取联系信息,并将记录写入模型层旁的 seed.sql 或 leads.json。居民代理出口和 JS 渲染在云浏览器层发生。
4. 从出版商页面提取的 RAG 语料库
对于在 Antigravity 内构建的嵌入管道,智能体浏览种子 URL 列表,每个页面调用 scrape_markdown,将 markdown 拆分为块,并将每个块 + URL 对写入 corpus.jsonl。由于 markdown 已经干净,块边界落在标题和段落上,而不是标签中间。
5. 可视回归资产
对于 UI 重构,要求智能体对 routes.ts 中的每个页面进行全页 scrape_screenshot 的预发布和生产版本屏幕截图,然后对比这两个配对。屏幕截图作为文件返回到工作区;差异记录在对话中。
上线前需要了解的内容
- 标准输出纪律很重要。 stdio MCP 传输使用 stdout 进行 JSON-RPC。写入非 JSON 文本到 stdout 的服务器会破坏握手。当前的
scrapeless-mcp-server构建将日志写入 stderr;如果使用自定义分支,请审计日志目标。 - 每次调用的区域控制不在 MCP 表面上。 云浏览器通过 Scrapeless 账户配置的区域进行路由。需要按查询区域固定(美国结果与德国与日本)的工作流调用
scrapeless-scraping-browserCLI,带上--proxy-country,或为不同的默认区域保留多个 API 密钥。 - 每个工作区的 MCP 配置在 Antigravity 中尚不支持。
~/.gemini/antigravity/mcp_config.json中的mcpServers配置是全局性的。项目范围的 MCP 条目是 Antigravity 开发者论坛上被跟踪的功能请求;在此之前,同一个scrapeless块在每个工作区中都适用。 - 并发。 每个主机保持 ≤ 3 个并发会话以确保稳定运行。对于需要更高分发的批处理任务,从工作池驱动 CLI,而不是从单个智能体并行发出 MCP 调用。
- MCP 响应形态。 工具的响应以
content[0].text(纯文本)返回。返回文本的无状态数据工具(google_search、google_trends、scrape_html、scrape_markdown)在主体之前会在有效载荷前加上Response:\n\n;Antigravity 的计划程序会自动处理前缀,但解析原始响应的自定义脚本需要去掉它。scrape_screenshot直接返回图像二进制。browser_*工具返回其文本有效载荷时没有前缀。
结论:扩展您的 Antigravity 智能体在公共网络上的覆盖范围
将 Scrapeless MCP 服务器接入 Antigravity 仅需在 ~/.gemini/antigravity/mcp_config.json 中添加一个 JSON 块并刷新 MCP 面板。之后,智能体将拥有强化的云浏览器、居民代理出口、Google SERP 抓取程序、趋势抓取程序,以及一次性 HTML/Markdown/屏幕截图辅助工具 — 所有这些都可以通过 @-提及或自然语言提示访问。IDE 继续负责代码生成、文件树和终端;云浏览器使智能体在真实的、渲染过的页面上保持运行。
通过其他 MCP 客户端在相同的 Scrapeless 表面上 — Claude Desktop、Cursor、OpenAI Codex CLI、Gemini CLI、Claude Code、VS Code + GitHub Copilot Chat — 请参见 Google Maps 的 MCP 服务器使用指南。对于更喜欢原始 CDP 路径而非 MCP 的代理表面,请参见 Hermes 集成帖子。Antigravity 提供免费层,同时也有付费的 Pro 和 Ultra 计划;Scrapeless 在新账户上包含免费的 Scraping Browser 运行时,升级路径见 scrapeless.com/en/pricing。在每个代理表面上模式保持一致:为主机固定正确的传输,在提取之前快照或渲染,在多步转动中保持会话持久,并将缺失字段视为可为空。
准备构建您的 AI 驱动数据管道了吗?
加入我们的社区,获取免费计划,并与在 Scrapeless 上构建 Antigravity 驱动的数据管道的开发者联系:Discord · Telegram。
在 app.scrapeless.com 注册以获取免费的 Scraping Browser 运行时,并调整上述模式以适应您的 Antigravity 代理所需的工作区、区域和页面。
常见问题
Q1: 哪个 Antigravity 版本支持 MCP?
MCP 支持在 2025 年 11 月发布的公共预览版本中推出。任何当前在 macOS、Windows 或 Linux 上的 Antigravity 构建都在代理面板的 … 菜单中显示 MCP Servers 条目,并从 ~/.gemini/antigravity/ 中读取 mcp_config.json。
Q2: 使用 Antigravity + Scrapeless 抓取是否合法?
抓取公开可见的数据在大多数法域中被广泛允许,但规则因国家和网站服务条款而异。请审查目标网站的服务条款,遵守适用的 robots.txt,在没有合法依据的情况下不收集个人数据,并咨询法律顾问以应对商业规模的管道。
Q3: 我需要住宅代理吗?
是的,对于任何具有重要反机器人保护的网站 — 大多数零售商、市场、搜索引擎结果页面和大型 SaaS 落地页。Scrapeless MCP 服务器默认通过住宅池路由每个 browser_* 和 scrape_* 调用;该调用不需要单独的代理配置。
Q4: 我可以从 MCP 表面每个请求选择一个住宅代理区域吗?
不能通过 MCP browser_create 工具 — 云浏览器会话使用在 Scrapeless 账户上配置的代理区域。对于每个查询区域选择(美国与德国与日本),通过 scrapeless-scraping-browser CLI 使用 --proxy-country,或者为不同的默认区域维护多个 API 密钥。
Q5: stdio 模式与 HTTP 可流模式 — 哪个适合 Antigravity?
Stdio 是开发人员工作站的默认模式:Antigravity 生成 npx scrapeless-mcp-server 作为子进程,并通过其 stdin/stdout 进行 JSON-RPC 通信。当 Antigravity 在托管环境(Codespaces、远程开发容器、CI 运行器)中运行时,HTTP 可流模式是正确的默认模式,因为主机无法保持长期存活的子进程。这两种模式使用相同的 API 密钥。
Q6: 我在哪里添加配置 — 每个工作区还是全局?
Antigravity 的 MCP 配置当前是全局的;同一个 mcpServers 对象 ~/.gemini/antigravity/mcp_config.json 适用于每个工作区。每工作区 MCP 配置是 Antigravity 开发者论坛上跟踪的功能请求。
Q7: 我如何将 API 密钥置于 JSON 文件之外?
在 JSON 中使用占位符,并通过操作系统环境变量注入值。在启动 Antigravity 的 shell 中设置 SCRAPELESS_KEY(在 macOS/Linux 上使用 export SCRAPELESS_KEY=... 或在 Windows PowerShell 上使用 [Environment]::SetEnvironmentVariable("SCRAPELESS_KEY", "...", "User")),然后在配置的 env 块中引用 ${SCRAPELESS_KEY}。重新启动 Antigravity 以便新变量传播。
Q8: 第一个 browser_create 调用返回 os error 10054 或 503. 现在该怎么办?
这两个都是在 Scrapeless 住宅代理池上的临时会话启动错误。单次重试通常会成功 — 让代理调用 browser_close(如果会话被创建)并再次调用 browser_create,或者将调用包装在 2-3 次尝试的重试循环中。
Q9: Antigravity 如何决定调用哪个 Scrapeless 工具?
每个 MCP 工具都有名称和模式;Antigravity 的规划器读取描述并将其与提示进行匹配。@-提及服务器(@scrapeless …)会使规划器倾向于该回合的 Scrapeless 表面,这在多个 MCP 服务器暴露重叠功能时(例如,另一台服务器也提供 fetch 风格的工具)是最清晰的请求范围指定方式。
Q10: 我可以在没有 Antigravity 的情况下运行这个吗?
是的。Scrapeless MCP 服务器是一个标准的 MCP 服务器,可以从 Claude Desktop、Claude Code、Cursor、OpenAI Codex CLI、Gemini CLI、VS Code + GitHub Copilot Chat 或任何基于 MCP TypeScript SDK 构建的自定义客户端进行调用。同样的 mcpServers JSON 片段适用于每个客户端。对于非 MCP 界面,云浏览器也可以通过 scrapeless-scraping-browser CLI 以及位于 wss://browser.scrapeless.com/browser 的 WSS 端点进行访问。
Q11:每个主机可以并发多少个 MCP 工作进程?
每个主机的并发渲染次数的文档上限是三次。对于更高的并发,运行多个 MCP 客户端(或访问可流式传输 HTTP 端点的工作进程)或者,对于纯吞吐量的批处理作业,直接通过并行工作池驱动 CLI。
在Scrapeless,我们仅访问公开可用的数据,并严格遵循适用的法律、法规和网站隐私政策。本博客中的内容仅供演示之用,不涉及任何非法或侵权活动。我们对使用本博客或第三方链接中的信息不做任何保证,并免除所有责任。在进行任何抓取活动之前,请咨询您的法律顾问,并审查目标网站的服务条款或获取必要的许可。



