Como Integrar o Servidor MCP Scrapeless no ZeroClaw: Um Guia Passo a Passo

Sophia Martinez

Specialist in Anti-Bot Strategies

18-May-2026

Principais Conclusões:

Um bloco TOML conecta o navegador em nuvem a um agente local Rust. ZeroClaw é um runtime de agente de IA em um único binário que se comunica com fornecedores de LLM, ouve em mais de 30 canais e age através de ferramentas. Adicionar o Scrapeless MCP Server é um bloco [mcp] de quatro linhas em ~/.zeroclaw/config.toml — sem necessidade de instalação de SDK, sem daemon para gerenciar, sem alteração de código do lado do agente.
Vinte ferramentas MCP, duas superfícies. O Scrapeless MCP Server expõe google_search, google_trends, o conjunto completo de primitivas browser_* do navegador em nuvem e scrape_html / scrape_markdown / scrape_screenshot. O transporte Stdio roda localmente via npx -y scrapeless-mcp-server; o HTTP transmitível aponta para https://api.scrapeless.com/mcp.
Habilidades MCP e de Agente são complementares, não alternativas. O servidor MCP fornece ao ZeroClaw as ferramentas; as habilidades Scrapeless OpenClaw — webunlocker-skill e llm-chat-scraper-skill — fornecem a forma de usar as APIs Scrapeless subjacentes. ZeroClaw migrou do OpenClaw e lê o mesmo formato SKILL.md, assim as habilidades podem ser colocadas em ~/.zeroclaw/workspace/skills/ e se tornam chamáveis através de zeroclaw skills list.
Navegador em nuvem anti-detecção, proxies residenciais em mais de 195 países. O Scrapeless lida com renderização de JavaScript, saída de proxy residencial, randomização de impressão digital (UA, fuso horário, WebGL, canvas) e persistência de sessão em nível de plataforma, assim o agente ZeroClaw se concentra na tarefa em vez da evasão.
Descobrir → extrair funciona em qualquer site. Use google_search para localizar a página, scrape_markdown para extrair texto limpo de um SPA renderizado em JS, as ferramentas browser_* para fluxos paginados ou interativos, e google_trends para contexto de séries temporais. O agente as compõe; nada no protocolo é específico para o alvo.
Grátis para começar. Novas contas Scrapeless incluem tempo de execução MCP gratuito — inscreva-se em app.scrapeless.com.

Introdução: de um agente local Rust para acesso à web ao vivo

ZeroClaw é um runtime de agente Rust que roda inteiramente na máquina do operador. Um binário, uma configuração TOML, as chaves do operador, o espaço de trabalho do operador. Ele se comunica com cerca de 20 fornecedores de LLM, alcança o mundo através do Discord, Telegram, Matrix, e-mail, voz, webhooks e uma CLI, e age através de shell, navegador, HTTP, hardware e ferramentas do servidor MCP. O repositório de 31 mil estrelas apresenta um modelo de segurança construído em torno da autonomia supervisionada, sandboxes em nível de sistema operacional (Landlock, Bubblewrap, Seatbelt, Docker) e recibos de ferramentas criptográficas em cada ação.

O limite fundamental de qualquer runtime de agente local é o mesmo que todo LLM enfrenta: o conhecimento do modelo está congelado no corte de treinamento. Para pesquisa, monitoramento, geração de leads, inteligência competitiva e RAG contra dados de publicadores ao vivo, esse limite aparece no momento em que o agente precisa ler uma página que não existia quando o modelo foi treinado. O navegador embutido do ZeroClaw e as ferramentas HTTP cobrem páginas benignas e consultas de documentação; páginas comerciais atrás do Cloudflare, Akamai, reCAPTCHA ou filtragem de reputação de IP são uma superfície diferente para a qual aquelas ferramentas não foram projetadas.

Este post passa pela integração do Scrapeless no ZeroClaw através de ambas as superfícies de integração que o runtime suporta: o Scrapeless MCP Server (a forma canônica de expor novas ferramentas para o agente) e as habilidades Scrapeless OpenClaw (arquivos de conhecimento canônicos que o agente carrega para operar essas ferramentas de forma eficaz). Os dois se complementam — o servidor MCP é o que o agente chama; as habilidades são o que dizem a ele quando e como chamar as APIs Scrapeless subjacentes. Para a mesma primitiva Scrapeless exposta através de outros clientes, o tutorial do servidor MCP passa pelo Claude Desktop / Cursor / Codex CLI, e o post de integração do Hermes cobre o caminho CDP direto para agentes que já falam o Protocolo de Ferramentas de Desenvolvimento do Chrome.

O que é ZeroClaw?

ZeroClaw é um único binário Rust que inicia um runtime de agente na própria máquina do operador. Os mantenedores descrevem como "você possui o agente, você possui os dados, você possui a máquina na qual ele roda." O runtime é estruturado em torno de quatro componentes principais:

Canais (mais de 30 adaptadores). Mensagens de entrada do Discord, Telegram, Matrix, e-mail, voz, webhooks, CLI e a ponte ACP IDE — todas roteadas para o mesmo loop de agente.
Fornecedores (cerca de 20 backends de LLM). Anthropic, OpenAI, Ollama, qualquer endpoint compatível com OpenAI. Cadeias de fallback e roteamento mantêm o agente funcionando quando um fornecedor falha.
Ferramentas (shell, navegador, HTTP, hardware, MCP). A superfície de ação. Servidores MCP se registram como ferramentas de primeira classe ao lado das embutidas.
Política de segurança e motor SOP. A autonomia padrão é supervisionada: operações de risco médio exigem aprovação, enquanto as de alto risco são bloqueadas. Os Procedimentos Operacionais Padrão são acionados por eventos MQTT, webhook, cron ou periféricos com portões de aprovação e execuções retomáveis.

A configuração reside em um único lugar: ~/.zeroclaw/config.toml. O espaço de trabalho — habilidades, memória, registros, estado do MCP — está sob ~/.zeroclaw/workspace/. Operadores migrando do OpenClaw podem importar o espaço de trabalho diretamente; o formato das habilidades é o mesmo.

Por que adicionar acesso à web ao seu agente ZeroClaw

Os LLMs que alimentam o ZeroClaw compartilham a mesma limitação: corte de treinamento. Em um ambiente em rápida mudança, ocorrem três modos de falha observáveis — respostas desatualizadas, fatos alucinhados e chamadas de ferramentas contra URLs que foram alteradas ou resultaram em erro 404.

O ZeroClaw vem com ferramentas integradas de http e navegador, que cobrem uma ampla superfície. Elas não são otimizadas para a web comercial: SPAs renderizadas em JS, intersticiais anti-bot, desafios CAPTCHA e conteúdos restritos geograficamente estão entre o agente e os dados que o operador realmente deseja. A conexão do Scrapeless transforma esses modos de falha em chamadas de ferramentas normais:

Pesquisa em tempo real através de google_search (Google, com parâmetros gl + hl localizados) e google_trends (dados de interesse em séries temporais).
Validação de múltiplas fontes através de scrape_markdown contra várias URLs de resultados em uma única rodada do agente.
Coleta de dados ao vivo de sites pesados em JS — páginas de preços, listas de mercado, páginas de revisão, diretórios públicos — através das primitivas do browser_* do navegador em nuvem.
Consultas geográficas alocando sessões em um país específico, para que o agente veja o que um usuário local veria.

Como estender o ZeroClaw com Scrapeless: duas superfícies

O Scrapeless suporta o ZeroClaw através de duas superfícies, usadas em conjunto:

Servidor MCP do Scrapeless — o servidor oficial que expõe 20 ferramentas de navegador em nuvem, SERP e scraping sobre o Modelo de Protocolo de Contexto.
Habilidades do Scrapeless OpenClaw — arquivos de conhecimento formatados como SKILL.md que ensinam o agente a utilizar a API Universal de Scraping do Scrapeless e o LLM Chat Scraper de forma eficaz. O ZeroClaw importa habilidades do OpenClaw diretamente.

O servidor MCP é o que o agente invoca. As habilidades são o que o agente lê para decidir quando e como invocar. Elas não são alternativas — instaladas juntas, o agente possui tanto as ferramentas quanto o manual.

Servidor MCP do Scrapeless

O servidor MCP vem com 20 ferramentas de forma nativa. O conjunto principal:

Ferramenta	O que faz
`google_search`	Recuperação de SERP com parâmetros de localização `gl` / `hl`.
`google_trends`	Dados de busca em alta e interesse em séries temporais.
`scrape_markdown`	Renderiza uma URL através do navegador em nuvem, retorna Markdown.
`scrape_html`	O mesmo, retornando HTML completamente renderizado.
`scrape_screenshot`	Captura uma captura de tela de alta qualidade de qualquer página.
`browser_create`	Aloca (ou reutiliza) uma sessão de navegador em nuvem.
`browser_goto`	Navega a sessão até uma URL.
`browser_click` / `browser_type` / `browser_press_key`	Aciona elementos interativos da página.
`browser_scroll` / `browser_scroll_to`	Aciona conteúdo carregado preguiçosamente.
`browser_get_html` / `browser_get_text`	Extrai da página atual do navegador em nuvem.
`browser_screenshot` / `browser_snapshot`	Captura o estado para revisão ou processamento subsequente.
`browser_wait_for` / `browser_wait`	Aguarda seletores ou durações fixas.
`browser_close`	Libera a sessão.

Dois transportes são suportados. Stdio (npx -y scrapeless-mcp-server) é o padrão certo para uma estação de trabalho executando o ZeroClaw localmente; HTTP transmitível (https://api.scrapeless.com/mcp) é o padrão certo quando o agente está em um host remoto e o operador deseja que o servidor MCP seja hospedado pelo Scrapeless em vez de ser gerado por invocação.

Habilidades do Scrapeless OpenClaw

As habilidades são arquivos SKILL.md com um pequeno tempo de execução Python que envolve uma API específica do Scrapeless. Ambas estão disponíveis no repositório oficial do Scrapeless no GitHub:

Habilidade	O que ensina ao agente
`webunlocker-skill`	Aciona a API Universal de Scraping do Scrapeless — busca HTML / Texto Simples / Markdown / capturas de tela / conteúdo estruturado com solução automática de CAPTCHA (reCAPTCHA, Cloudflare Turnstile, desafio Cloudflare), renderização JS, saída de proxy residencial com `--country`, tentativas, e suporte a POST + cabeçalho personalizado.
`llm-chat-scraper-skill`	Coleta respostas de chat estruturadas do ChatGPT, Gemini, Perplexity e Grok — útil para monitoramento de AI-search e fluxos de trabalho de medição GEO.

O ZeroClaw herda o formato de habilidade do OpenClaw. As habilidades são clonadas para ~/.zeroclaw/workspace/skills/, são listadas por zeroclaw skills list, e ficam disponíveis para o agente na próxima sessão zeroclaw agent.

O Que Você Pode Fazer Com Isso

Agente de monitoramento diário. Programe um SOP do ZeroClaw que rode toda manhã: google_search para palavras-chave rastreadas, scrape_markdown os três melhores resultados, resuma, entregue via o adaptador de canal do Discord.
Rastreamento de visibilidade em busca de IA. Com a habilidade LLM Chat Scraper, colete as respostas que ChatGPT, Gemini, Perplexity e Grok geram para prompts relevantes à marca em uma cadência; rastreie presença e sentimento ao longo do tempo.
Geração de leads a partir de diretórios públicos. Navegue pelo navegador em nuvem através de um diretório público paginado, elimine duplicatas por domínio, entregue os registros para a memória do agente.
Preenchimento de formulários autenticados com humano na loop. Leve um formulário de integração de fornecedor ou de candidatura a emprego para a tela de revisão final, tire uma captura de tela de página inteira, pare antes de enviar para que um humano possa aprovar.
Precisão de preços de concorrentes vinculada a geolocalização. Alocar a sessão em um país específico, renderizar a página de preços localizados, diferenciar contra a captura de tela anterior, notificar um canal quando um limite for atingido.
RAG contra dados de publicadores ao vivo. Renderize páginas de publicadores para texto limpo através do scrape_markdown, insira na memória SQLite + embeddings do ZeroClaw, recupere para turnos futuros.
Ignorar o Cloudflare para alvos de pesquisa benignos. A habilidade Web Unlocker lida automaticamente com páginas Turnstile e Challenge; o agente vê apenas um payload Markdown limpo.

Na Scrapeless, acessamos apenas dados disponíveis publicamente, enquanto cumprimos rigorosamente com as leis, regulamentos e políticas de privacidade de websites aplicáveis. O conteúdo deste post é apenas para fins de demonstração.

Por Que Scrapeless

Scrapeless é um navegador em nuvem anti-detecção, mais uma API de Raspagem Universal, mais uma API SERP, mais um LLM Chat Scraper, tudo por trás de uma chave de API. Para o ZeroClaw especificamente, ele traz:

Um servidor MCP nativo — sem instalação de SDK, sem código de adaptador. O bloco MCP em ~/.zeroclaw/config.toml é toda a integração.
Renderização JavaScript no lado da nuvem para SPAs, feeds de rolagem infinita e painéis carregados sob demanda que são alvos de primeira linha para as ferramentas browser_* e scrape_markdown.
Proxies residenciais em mais de 195 países para que consultas vinculadas à geolocalização retornem as listagens que um usuário local veria.
Impressão digital anti-detecção em cada sessão — UA, fuso horário, idioma, resolução de tela, WebGL, canvas aleatorizado por sessão.
Solução automática de CAPTCHA para reCAPTCHA, Cloudflare Turnstile e Cloudflare Challenge através da superfície Web Unlocker.
Uma única superfície de gerenciamento — uma chave de API, um painel, créditos gratuitos de runtime no plano de nova conta.

Obtenha a chave da API no plano gratuito em app.scrapeless.com. A superfície completa da ferramenta MCP está documentada em github.com/scrapeless-ai/scrapeless-mcp-server; a superfície da API em docs.scrapeless.com.

Pré-requisitos

Um host semelhante ao UNIX. Linux, macOS ou WSL2 no Windows. O ZeroClaw publica versões para Windows, mas o script de instalação e os scripts de habilidades assumem um shell POSIX — o caminho mais suave é Linux / macOS / WSL2.
Node.js 18 ou mais recente para o transporte MCP stdio (npx -y scrapeless-mcp-server).
Python 3.10 ou mais recente para as habilidades OpenClaw (elas são enviadas como scripts Python em scripts/).
Toolchain Rust se instalando a partir do código-fonte; o caminho do binário pré-compilado não precisa de nada adicional.
Uma conta Scrapeless e chave de API — inscreva-se em app.scrapeless.com e copie a chave de Configurações → Gerenciamento de Chave de API.
Uma chave de provedor LLM — Anthropic, OpenAI, Ollama ou qualquer endpoint compatível com OpenAI. O assistente de integração do ZeroClaw a conecta.
git para clonar os repositórios de habilidades.
jq é opcional — útil ao canalizar a saída do CLI, não é necessário para o caminho MCP.

Instalar o ZeroClaw

A configuração completa é composta por dois subpassos.

1. Execute o instalador

bash Copy

curl -fsSL https://raw.githubusercontent.com/zeroclaw-labs/zeroclaw/master/install.sh | bash

O instalador pergunta se deseja buscar um binário pré-compilado (~segundos) ou compilar a partir do código-fonte (mais lento, personalizável). Ambos terminam da mesma forma — zeroclaw onboard inicia automaticamente. Para pular o assistente no final, passe --skip-onboard e execute zeroclaw onboard mais tarde.

Verifique se o binário está no caminho:

bash Copy

zeroclaw --version

A saída deve ser semelhante a zeroclaw 0.7.5 ou mais recente.

2. Complete o assistente de integração

bash Copy

zeroclaw onboard

O assistente guia pela seleção de provedor, conexão de canal, modo de autonomia e personalização. Para esta integração, duas configurações são importantes:

Provedor — escolha qualquer provedor LLM que já esteja configurado (OpenAI, Anthropic, Ollama, uma porta de entrada compatível com OpenAI). Cole a chave da API quando solicitado.
Autonomia — supervisionado é o padrão seguro; o agente solicitará antes de invocar ferramentas de risco médio. As ferramentas do MCP contam como risco médio por padrão. Para uma caixa de desenvolvimento onde as solicitações são um atrito, o assistente também expõe o modo yolo, que o operador deve ativar apenas em uma máquina confiável.

Confirme que o tempo de execução está ativo iniciando um chat:

bash Copy

zeroclaw agent

Um "Oi!" deve retornar uma conclusão normal. Se isso acontecer, o tempo de execução está saudável e o próximo passo é conectar ao servidor MCP.

Conectar ZeroClaw ao Servidor Scrapeless MCP

1. Testar o servidor MCP fora do ZeroClaw

Antes de adicionar o bloco MCP ao config.toml, confirme se o servidor inicia de forma independente. O ZeroClaw carrega os servidores MCP de forma preguiçosa na inicialização do agente, então uma configuração quebrada aparece apenas na primeira vez que o agente roda — melhor pegar isso agora:

bash Copy

SCRAPELESS_KEY="<SEU_CHAVE_SCRAPELESS>" npx -y scrapeless-mcp-server

Na primeira execução, npx baixa scrapeless-mcp-server do registro e o servidor inicia através do stdio. O processo permanece anexado; pressione Ctrl-C para liberá-lo. Se uma faixa de inicialização foi impressa e está esperando por solicitações MCP, as credenciais e o pacote funcionam.

Obtenha sua chave API no plano gratuito: app.scrapeless.com

2. Adicionar o bloco MCP ao `~/.zeroclaw/config.toml`

O ZeroClaw lê a configuração do servidor MCP de um bloco [mcp] na configuração global. Adicione (ou mescle) o seguinte:

toml Copy

# ~/.zeroclaw/config.toml

[mcp]
enabled = true
deferred_loading = true
servers = [
  { name = "scrapeless", command = "npx", transport = "stdio", args = ["-y", "scrapeless-mcp-server"], env = { SCRAPELESS_KEY = "<SEU_CHAVE_SCRAPELESS>" }, headers = {} }
]

Notas:

enabled = true ativa o subsistema MCP. Versões recentes do ZeroClaw têm isso desativado por padrão.
deferred_loading = true mantém a inicialização do daemon rápida; o ZeroClaw inicia npx apenas quando o agente realmente inicia uma sessão.
env.SCRAPELESS_KEY é a superfície de autenticação — a mesma chave usada no teste de fumaça na etapa 1.
Para o transporte HTTP hospedado em vez de stdio, troque a entrada por:
toml Copy
```
{ name = "scrapeless", transport = "http", url = "https://api.scrapeless.com/mcp", headers = { "x-api-token" = "<SEU_CHAVE_SCRAPELESS>" } }
```
A pilha do cliente MCP do ZeroClaw suporta três valores de transporte — stdio, http e sse — com validação exigindo command / args para stdio e url / headers para transportes remotos (por conta do problema #1380 do ZeroClaw). O transporte HTTP é o padrão correto quando o ZeroClaw é executado em um host remoto (um VPS ou um contêiner) e o operador não deseja que npx esteja executando lá.

3. Verifique a conexão de dentro do ZeroClaw

Reinicie a sessão do agente para que ele pegue a nova configuração e carregue o servidor MCP de forma preguiçosa:

bash Copy

zeroclaw agent

Em um chat novo, pergunte:

Copy

Quais ferramentas do Scrapeless MCP você tem acesso?

O agente deve enumerar as 20 ferramentas listadas anteriormente — google_search, google_trends, o conjunto browser_*, scrape_html, scrape_markdown, scrape_screenshot. Se a resposta disser que não há ferramentas, a causa mais comum é enabled = false em [mcp]; a segunda causa mais comum é um erro de digitação em SCRAPELESS_KEY.

Instalar as Habilidades Scrapeless OpenClaw

O servidor MCP são as ferramentas. As habilidades são o manual de operações. Ambas as habilidades do Scrapeless funcionam com o ZeroClaw porque o tempo de execução suporta o formato de habilidade OpenClaw diretamente.

1. Permitir scripts de habilidade em `~/.zeroclaw/config.toml`

Ambas as habilidades do Scrapeless enviam diretórios scripts/ que o agente executa. Defina allow_scripts = true na seção [skills]:

toml Copy

# ~/.zeroclaw/config.toml

[skills]
allow_scripts = true

allow_scripts está desativado por padrão por segurança. Ativá-lo concede permissão ao ZeroClaw para executar scripts agrupados com habilidades sob a política de autonomia já em vigor; invocações de scripts de risco médio ainda solicitarão aprovação no modo supervisionado.

2. Clonar os repositórios de habilidades

bash Copy

mkdir -p ~/.zeroclaw/workspace/skills
git clone https://github.com/scrapeless-ai/webunlocker-skill ~/.zeroclaw/workspace/skills/webunlocker-skill
git clone https://github.com/scrapeless-ai/llm-chat-scraper-skill ~/.zeroclaw/workspace/skills/llm-chat-scraper-skill

3. Instalar as dependências do Python e o token da API

A habilidade Web Unlocker envia um requirements.txt:

bash Copy

cd ~/.zeroclaw/workspace/skills/webunlocker-skill
pip install -r requirements.txt
cp .env.example .env
# Depois edite .env e defina X_API_TOKEN=<SEU_CHAVE_SCRAPELESS>

Repita para a habilidade LLM Chat Scraper, se estiver dentro do escopo do agente.

4. Verifique se as habilidades estão visíveis para o ZeroClaw

bash Copy

zeroclaw skills list

A saída deve incluir webunlocker-skill e llm-chat-scraper-skill. Se estiverem ausentes, a causa mais comum é que o clone foi colocado sob ~/.zeroclaw/skills/ em vez de ~/.zeroclaw/workspace/skills/ — este último é o caminho que o runtime monitora.

ZeroClaw + Scrapeless em Ação

Um exemplo prático realista: um resumo diário de inteligência competitiva sobre um tópico que o operador acompanha. O agente localiza fontes novas, extrai o conteúdo e produz um resumo estruturado, entregue ao canal ao qual o agente está vinculado.

No zeroclaw agent, cole:

Copy

Construa para mim um resumo de inteligência competitiva sobre "frameworks de agentes de IA" dos últimos 7 dias.

1. Use a ferramenta MCP `google_search` do Scrapeless para encontrar as 5 postagens de notícias / blogs mais relevantes publicadas esta semana. Use gl=us, hl=en.
2. Para cada URL de resultado, use `scrape_markdown` para extrair o corpo do artigo. Descarte navegação e anúncios.
3. Use `google_trends` para buscar a curva de interesse de 7 dias para a consulta "frameworks de agentes de IA" para que eu tenha o sinal de demanda junto com o sinal de oferta.
4. Produza um relatório de Markdown estruturado com:
   - Os 3 principais temas entre os 5 artigos, cada um com um resumo de uma frase e a URL da fonte.
   - A direção da tendência de 7 dias (alta / estável / baixa) e o dia de pico.
   - Um destaque de "o que mudou esta semana" — qualquer novidade em relação ao resumo da semana passada.

Se uma página alvo bloquear o navegador em nuvem, volte para `browser_create` + `browser_goto` + `browser_get_text` apenas para essa URL. Não substitua conteúdo sintético; se uma fonte não puder ser recuperada, liste-a sob "fontes não recuperadas".

O plano do agente, em linguagem simples:

Chame google_search(q="frameworks de agentes de IA", gl="us", hl="en") e escolha os cinco resultados mais frescos que pareçam fontes primárias (ignore páginas de agregadores).
Itere as URLs através de scrape_markdown e mantenha o texto limpo no armazenamento de trabalho.
Chame google_trends(q="frameworks de agentes de IA", date="now 7-d") para a curva de interesse.
Resuma em um breve relatório em Markdown.
Para qualquer URL que retorne um intersticial anti-bot através de scrape_markdown, tente novamente através da cadeia browser_create → browser_goto → browser_get_text, que ativa uma sessão de navegador em nuvem e aguarda a hidratação antes de extrair.

Antes de cada chamada de ferramenta, o modo de autonomia supervised do ZeroClaw solicita aprovação — Y para aprovação única, A para lembrar a permissão para chamadas de ferramentas futuras na mesma sessão.

Para enviar o prompt sem entrar no chat interativo:

bash Copy

zeroclaw agent --message "Construa para mim um resumo de inteligência competitiva sobre frameworks de agentes de IA dos últimos 7 dias..."

Para transformar isso em uma execução agendada em vez de um prompt ad-hoc, registre uma SOP em uma programação cron e vincule-a ao adaptador de canal pelo qual o agente deve entregar o resumo (Discord, Telegram, e-mail). As ferramentas MCP e a habilidade permanecem as mesmas; apenas o gatilho muda.

O Que Você Recebe de Volta

O resumo retorna como um payload de Markdown ao longo das linhas do seguinte — capturado de uma execução real do prompt acima contra cinco resultados SERP ao vivo para "frameworks de agentes de IA 2026":

markdown Copy

# Frameworks de Agentes de IA — Resumo Semanal (semana de 12-Mai-2026)

## Temas (últimos 7 dias)
1. **LangGraph é o padrão de produção consensual.** Todas as três comparações profundas publicadas esta semana (Towards AI, GuruSup, Alice Labs) classificam LangGraph como #1 para cargas de trabalho de produção. As razões citadas convergem: execução gráfica determinística, pontos de verificação nativos de humanos no loop, e observabilidade de primeira classe através do LangSmith.
   Fonte: https://pub.towardsai.net/top-ai-agent-frameworks-in-2026-a-production-ready-comparison-7ba5e39ad56d
2. **MCP está emergindo como o padrão de integração de ferramentas entre frameworks.** O Modelo de Contexto de Antropicos — agora governado pela Linux Foundation com OpenAI, Google, Microsoft, AWS e Salesforce na lista de apoiadores — é referenciado como o padrão de agente para ferramenta em duas das três comparações.
   Fonte: https://gurusup.com/blog/best-multi-agent-frameworks-2026
3. **A divisão AutoGen / AG2 é o principal desenvolvimento de 2025–2026.** A Microsoft reescreveu o AutoGen como v0.4+ com uma nova API; a comunidade continuou a linhagem v0.2 como AG2 (ag2.ai). Tanto a Alice Labs quanto a GuruSup sinalizam isso como um momento de "escolher deliberadamente" para equipes avaliando frameworks de debate multi-agente.
   Fonte: https://alicelabs.ai/en/insights/best-ai-agent-frameworks-2026

## Sinal de demanda
- Tendência de 7 dias: indisponível (google_trends retornou um erro transitório upstream nesta execução — tente novamente na próxima programação)

## O que mudou esta semana
- A Alice Labs adicionou o SDK do Claude Agent como um novo participante em #2, deslocando o CrewAI para #3 — a primeira classificação que vimos elevar o SDK oficial da Anthropic acima dos generalistas de multi-agente.
- O status do fork AutoGen / AG2 foi referenciado em 2 dos 3 artigos, subindo de 0 na semana passada.

## Fontes não recuperadas
- (nenhuma — o SPA da alicelabs.ai exigiu o caminho de fallback browser_*; recuperado)

A estrutura segue o prompt; os valores são o que a ferramenta verificada realmente retornou no dia em que o resumo foi executado. Algumas observações honestas baseadas na execução ao vivo:

scrape_markdown limpa a maioria das páginas de editores bem. Towards AI e GuruSup retornaram corpos em Markdown limpos na primeira tentativa. SPAs (aplicações de página única) fortemente renderizadas em JS (alicelabs.ai é uma SPA do Webflow / Vite nesta execução) retornaram a estrutura HTML renderizada em vez disso — o agente se recuperou através da cadeia browser_create → browser_goto → browser_get_text, que retornou uma captura de página totalmente estruturada, incluindo a lista classificada, principais conclusões, FAQ e a timestamp da atualização de maio de 2026.
google_trends é interesse, não volume — e às vezes é transitório. Na execução de verificação, a chamada upstream de Tendências retornou um erro load failed; o prompt lida com isso relatando a lacuna em vez de substituir dados sintéticos. A postura de retry correta é a próxima execução agendada, não uma nova tentativa imediata dentro da mesma rodada do agente.
A frescura por fonte varia. Alguns editores atualizam timestamps quando atualizam artigos; se a "frescura" for absolutamente importante, verifique a data de publicação no corpo do artigo, não o snippet do SERP. (A página da Alice Labs nesta execução mostra tanto uma data de publicação em abril de 2026 quanto uma data de atualização em maio de 2026 no corpo.)
Interstitials anti-bot e shells de SPA são normais, não exceções. Reserve o fallback browser_* em qualquer prompt que toque sites comerciais em larga escala; a execução de verificação atingiu um em três URLs e a recuperação foi sem eventos.

Conclusão: um agente que lê a web ao vivo

A integração ZeroClaw + Scrapeless se reduz a quatro passos que o operador executa uma vez: instalar ZeroClaw, registrar o servidor MCP Scrapeless em ~/.zeroclaw/config.toml, colocar as habilidades OpenClaw em ~/.zeroclaw/workspace/skills/ e verificar com zeroclaw skills list e um prompt de listagem de ferramentas em zeroclaw agent. Depois disso, cada turno do agente que toca a web — pesquisa, monitoramento, geração de leads, ingestão RAG, rastreamento de visibilidade de busca AI — passa pelo navegador em nuvem, os proxies residenciais e a API SERP atrás de uma chave de API.

Para o mesmo primitivo Scrapeless em outros clientes, o tutorial do servidor MCP cobre Claude Desktop / Cursor / Codex CLI, o post de integração Hermes cobre CDP direto, e o post de integração LangChain cobre agentes Python. O padrão entre todos eles é o mesmo: fixe uma região residencial, mantenha a sessão quente ao longo de fluxos de múltiplos passos, trate interstitials anti-bot como um caso de retry em vez de uma exceção e deixe o agente compor google_search → scrape_markdown → browser_* em qualquer coisa que o prompt realmente peça.

Pronto para Construir Seu Pipeline de Dados Potencializado por AI?

Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores construindo pipelines de agentes locais com base no Scrapeless: Discord · Telegram.

Inscreva-se em app.scrapeless.com para obter runtime MCP gratuito e adaptar os padrões acima a quais fluxos de trabalho o agente ZeroClaw já executa.

FAQ

Q1. O servidor MCP Scrapeless funciona no Windows ou apenas no Linux / macOS?
O servidor MCP é um pacote Node.js — ele roda em qualquer lugar que o Node 18+ roda, incluindo Windows. O instalador do ZeroClaw assume um shell POSIX, então o caminho mais suave no Windows é o WSL2. A variante de transporte HTTP (apontando o ZeroClaw para https://api.scrapeless.com/mcp) remove completamente a dependência local de npx e é a mais fácil de se ajustar para implantações ZeroClaw hospedadas.

Q2. Stdio ou HTTP transmitível — qual transporte é o padrão correto?
Para uma estação de trabalho executando o ZeroClaw localmente, stdio. O ciclo de vida é simples: o ZeroClaw gera npx -y scrapeless-mcp-server na inicialização do agente, o encerra ao parar o agente. Para ZeroClaw em um VPS ou em um contêiner, HTTP. O endpoint hospedado pelo Scrapeless remove a necessidade de empacotar npx e Node na imagem de runtime.

Q3. É legal extrair dados da web pública?
Geralmente sim, quando os dados são visíveis publicamente e o fluxo de trabalho respeita os termos de serviço de cada site e as jurisdições aplicáveis. A postura legal varia por país, por site e por caso de uso (pesquisa, revenda comercial, dados de treinamento). Revise os ToS do site alvo antes de escalar um fluxo de trabalho contra ele e consulte um advogado para casos de uso de alto volume ou regulamentados.

Q4. O servidor MCP e as habilidades OpenClaw se sobrepõem?
Eles são complementares. O servidor MCP fornece ao agente ferramentas — superfícies concretas e chamáveis (google_search, scrape_markdown, browser_*). As habilidades dão ao agente conhecimento — como a API Universal de Scraping Scrapeless se comporta, quando voltar à renderização em JS, qual tipo de resposta solicitar, como encadear a resolução de CAPTCHA com a seleção de país. Instalados juntos, o agente possui ambos.

Q5. O que acontece quando uma página-alvo retorna um interstício anti-bot?
Para scrape_markdown contra a maioria das páginas, o navegador em nuvem resolve o desafio de forma transparente. Para páginas que ainda retornam um interstício, a solução padrão é browser_create → browser_goto → browser_wait_for (um seletor conhecido pós-desafio) → browser_get_text. Orce para esse retorno em qualquer prompt que toca em sites comerciais; o exemplo de prompt acima mostra a forma.

Q6. Como o modo de autonomia do ZeroClaw interage com as chamadas de ferramentas MCP?
No modo supervised (o padrão), o agente solicita antes de invocar cada ferramenta MCP pela primeira vez. O operador pode conceder aprovação de uma só vez (Y) ou aprovação de lembrar-esta-ferramenta (A). No modo yolo, o agente invoca ferramentas sem solicitar; esse modo é apropriado apenas em uma caixa de desenvolvimento confiável.

Q7. O agente pode compor chamadas Scrapeless em fluxos de múltiplos passos em uma única ação?
Sim — esse é o ponto de design. Um único turno do agente normalmente encadeia google_search (localizar), scrape_markdown (extrair da URL canônica) e browser_* (retornar para páginas interativas ou protegidas contra bots). O ZeroClaw transmite as chamadas de ferramentas intermediárias no mesmo contexto da conversa.

Q8. Onde vive a chave da API Scrapeless?
Para o caminho MCP, em env.SCRAPELESS_KEY dentro de ~/.zeroclaw/config.toml (ou no cabeçalho HTTP x-api-token transmitível). Para o caminho de habilidade, no arquivo .env dentro de cada diretório de habilidade como X_API_TOKEN. Os dois caminhos são independentes; rotacionar a chave significa atualizar ambos os locais.

Q9. Um SOP do ZeroClaw pode disparar o mesmo prompt em uma programação?
Sim. Registre um SOP com um gatilho cron que execute o mesmo prompt que o operador colaria em zeroclaw agent --message "...". Vincule o SOP a um adaptador de canal (Discord, Telegram, e-mail) e o resumo é enviado automaticamente. SOPs no modo supervised ainda restringem chamadas de ferramentas de médio risco por aprovação; para execuções programadas não supervisionadas, o SOP precisa ser configurado sob um modo de autonomia mais permissivo ou com permissões de ferramentas pré-concedidas.

Q10. E sobre os outros produtos do Scrapeless — Scraping Browser, Universal Scraping API, SERP API?
O servidor MCP agrupa o navegador em nuvem, SERP e primitivos de scraping mais comuns em uma única superfície MCP. Para fluxos de trabalho que precisam do conjunto completo de primitivos do Scraping Browser diretamente (CDP, digitais personalizadas, persistência de sessão em granularidade session_ttl), conecte o endpoint do Scraping Browser CDP à ferramenta browser embutida do ZeroClaw. As duas abordagens se compõem; elas não entram em conflito.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

n8n + LLM Scraper: Capture Respostas de IA em um Fluxo de Trabalho Sem Código

Crie um fluxo de trabalho n8n que capture respostas de LLM em um cronograma com um nó de Solicitação HTTP para o Scrapeless LLM Chat Scraper, sem código e sem navegador.

Alex Johnson

18-Jun-2026

workflow n8n capturando respostas de LLM via um nó de Solicitação HTTP

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Aprenda a integrar o Crawl4AI com o Scrapeless Cloud Browser para uma raspagem web eficiente e em grande escala. Desbloqueie proxies automáticos, impressões digitais personalizadas, reutilização de sessões e depuração em tempo real.

Sophia Martinez

20-Oct-2025

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Servidor MCP sem resíduos está oficialmente no ar! Construa seu Conector AI-Web definitivo.

Descubra como o Servidor Scrapeless MCP fornece aos LLMs capacidades de navegação e raspagem na web em tempo real. Aprenda a construir agentes de IA que pesquisam, extraem e interagem com conteúdo web dinâmico de forma integrada.

Michael Lee

17-Jul-2025

Catálogo

Como Integrar o Servidor MCP Scrapeless no ZeroClaw: Um Guia Passo a Passo

Principais Conclusões:

Introdução: de um agente local Rust para acesso à web ao vivo

O que é ZeroClaw?

Por que adicionar acesso à web ao seu agente ZeroClaw

Como estender o ZeroClaw com Scrapeless: duas superfícies

Servidor MCP do Scrapeless

Habilidades do Scrapeless OpenClaw

O Que Você Pode Fazer Com Isso

Por Que Scrapeless

Pré-requisitos

Instalar o ZeroClaw

1. Execute o instalador

2. Complete o assistente de integração

Conectar ZeroClaw ao Servidor Scrapeless MCP

1. Testar o servidor MCP fora do ZeroClaw

2. Adicionar o bloco MCP ao ~/.zeroclaw/config.toml

3. Verifique a conexão de dentro do ZeroClaw

Instalar as Habilidades Scrapeless OpenClaw

1. Permitir scripts de habilidade em ~/.zeroclaw/config.toml

2. Clonar os repositórios de habilidades

3. Instalar as dependências do Python e o token da API

4. Verifique se as habilidades estão visíveis para o ZeroClaw

ZeroClaw + Scrapeless em Ação

O Que Você Recebe de Volta

Conclusão: um agente que lê a web ao vivo

Pronto para Construir Seu Pipeline de Dados Potencializado por AI?

FAQ

Artigos mais populares

n8n + LLM Scraper: Capture Respostas de IA em um Fluxo de Trabalho Sem Código

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Servidor MCP sem resíduos está oficialmente no ar! Construa seu Conector AI-Web definitivo.

2. Adicionar o bloco MCP ao `~/.zeroclaw/config.toml`

1. Permitir scripts de habilidade em `~/.zeroclaw/config.toml`