Como Integrar o Servidor MCP Scrapeless no ZeroClaw: Um Guia Passo a Passo
Specialist in Anti-Bot Strategies
Principais Conclusões:
- Um bloco TOML conecta o navegador em nuvem a um agente local Rust. ZeroClaw é um runtime de agente de IA em um único binário que se comunica com fornecedores de LLM, ouve em mais de 30 canais e age através de ferramentas. Adicionar o Scrapeless MCP Server é um bloco
[mcp]de quatro linhas em~/.zeroclaw/config.toml— sem necessidade de instalação de SDK, sem daemon para gerenciar, sem alteração de código do lado do agente. - Vinte ferramentas MCP, duas superfícies. O Scrapeless MCP Server expõe
google_search,google_trends, o conjunto completo de primitivasbrowser_*do navegador em nuvem escrape_html/scrape_markdown/scrape_screenshot. O transporte Stdio roda localmente vianpx -y scrapeless-mcp-server; o HTTP transmitível aponta parahttps://api.scrapeless.com/mcp. - Habilidades MCP e de Agente são complementares, não alternativas. O servidor MCP fornece ao ZeroClaw as ferramentas; as habilidades Scrapeless OpenClaw —
webunlocker-skillellm-chat-scraper-skill— fornecem a forma de usar as APIs Scrapeless subjacentes. ZeroClaw migrou do OpenClaw e lê o mesmo formatoSKILL.md, assim as habilidades podem ser colocadas em~/.zeroclaw/workspace/skills/e se tornam chamáveis através dezeroclaw skills list. - Navegador em nuvem anti-detecção, proxies residenciais em mais de 195 países. O Scrapeless lida com renderização de JavaScript, saída de proxy residencial, randomização de impressão digital (UA, fuso horário, WebGL, canvas) e persistência de sessão em nível de plataforma, assim o agente ZeroClaw se concentra na tarefa em vez da evasão.
- Descobrir → extrair funciona em qualquer site. Use
google_searchpara localizar a página,scrape_markdownpara extrair texto limpo de um SPA renderizado em JS, as ferramentasbrowser_*para fluxos paginados ou interativos, egoogle_trendspara contexto de séries temporais. O agente as compõe; nada no protocolo é específico para o alvo. - Grátis para começar. Novas contas Scrapeless incluem tempo de execução MCP gratuito — inscreva-se em app.scrapeless.com.
Introdução: de um agente local Rust para acesso à web ao vivo
ZeroClaw é um runtime de agente Rust que roda inteiramente na máquina do operador. Um binário, uma configuração TOML, as chaves do operador, o espaço de trabalho do operador. Ele se comunica com cerca de 20 fornecedores de LLM, alcança o mundo através do Discord, Telegram, Matrix, e-mail, voz, webhooks e uma CLI, e age através de shell, navegador, HTTP, hardware e ferramentas do servidor MCP. O repositório de 31 mil estrelas apresenta um modelo de segurança construído em torno da autonomia supervisionada, sandboxes em nível de sistema operacional (Landlock, Bubblewrap, Seatbelt, Docker) e recibos de ferramentas criptográficas em cada ação.
O limite fundamental de qualquer runtime de agente local é o mesmo que todo LLM enfrenta: o conhecimento do modelo está congelado no corte de treinamento. Para pesquisa, monitoramento, geração de leads, inteligência competitiva e RAG contra dados de publicadores ao vivo, esse limite aparece no momento em que o agente precisa ler uma página que não existia quando o modelo foi treinado. O navegador embutido do ZeroClaw e as ferramentas HTTP cobrem páginas benignas e consultas de documentação; páginas comerciais atrás do Cloudflare, Akamai, reCAPTCHA ou filtragem de reputação de IP são uma superfície diferente para a qual aquelas ferramentas não foram projetadas.
Este post passa pela integração do Scrapeless no ZeroClaw através de ambas as superfícies de integração que o runtime suporta: o Scrapeless MCP Server (a forma canônica de expor novas ferramentas para o agente) e as habilidades Scrapeless OpenClaw (arquivos de conhecimento canônicos que o agente carrega para operar essas ferramentas de forma eficaz). Os dois se complementam — o servidor MCP é o que o agente chama; as habilidades são o que dizem a ele quando e como chamar as APIs Scrapeless subjacentes. Para a mesma primitiva Scrapeless exposta através de outros clientes, o tutorial do servidor MCP passa pelo Claude Desktop / Cursor / Codex CLI, e o post de integração do Hermes cobre o caminho CDP direto para agentes que já falam o Protocolo de Ferramentas de Desenvolvimento do Chrome.
O que é ZeroClaw?
ZeroClaw é um único binário Rust que inicia um runtime de agente na própria máquina do operador. Os mantenedores descrevem como "você possui o agente, você possui os dados, você possui a máquina na qual ele roda." O runtime é estruturado em torno de quatro componentes principais:
- Canais (mais de 30 adaptadores). Mensagens de entrada do Discord, Telegram, Matrix, e-mail, voz, webhooks, CLI e a ponte ACP IDE — todas roteadas para o mesmo loop de agente.
- Fornecedores (cerca de 20 backends de LLM). Anthropic, OpenAI, Ollama, qualquer endpoint compatível com OpenAI. Cadeias de fallback e roteamento mantêm o agente funcionando quando um fornecedor falha.
- Ferramentas (shell, navegador, HTTP, hardware, MCP). A superfície de ação. Servidores MCP se registram como ferramentas de primeira classe ao lado das embutidas.
- Política de segurança e motor SOP. A autonomia padrão é
supervisionada: operações de risco médio exigem aprovação, enquanto as de alto risco são bloqueadas. Os Procedimentos Operacionais Padrão são acionados por eventos MQTT, webhook, cron ou periféricos com portões de aprovação e execuções retomáveis.
A configuração reside em um único lugar: ~/.zeroclaw/config.toml. O espaço de trabalho — habilidades, memória, registros, estado do MCP — está sob ~/.zeroclaw/workspace/. Operadores migrando do OpenClaw podem importar o espaço de trabalho diretamente; o formato das habilidades é o mesmo.
Por que adicionar acesso à web ao seu agente ZeroClaw
Os LLMs que alimentam o ZeroClaw compartilham a mesma limitação: corte de treinamento. Em um ambiente em rápida mudança, ocorrem três modos de falha observáveis — respostas desatualizadas, fatos alucinhados e chamadas de ferramentas contra URLs que foram alteradas ou resultaram em erro 404.
O ZeroClaw vem com ferramentas integradas de http e navegador, que cobrem uma ampla superfície. Elas não são otimizadas para a web comercial: SPAs renderizadas em JS, intersticiais anti-bot, desafios CAPTCHA e conteúdos restritos geograficamente estão entre o agente e os dados que o operador realmente deseja. A conexão do Scrapeless transforma esses modos de falha em chamadas de ferramentas normais:
- Pesquisa em tempo real através de
google_search(Google, com parâmetrosgl+hllocalizados) egoogle_trends(dados de interesse em séries temporais). - Validação de múltiplas fontes através de
scrape_markdowncontra várias URLs de resultados em uma única rodada do agente. - Coleta de dados ao vivo de sites pesados em JS — páginas de preços, listas de mercado, páginas de revisão, diretórios públicos — através das primitivas do
browser_*do navegador em nuvem. - Consultas geográficas alocando sessões em um país específico, para que o agente veja o que um usuário local veria.
Como estender o ZeroClaw com Scrapeless: duas superfícies
O Scrapeless suporta o ZeroClaw através de duas superfícies, usadas em conjunto:
- Servidor MCP do Scrapeless — o servidor oficial que expõe 20 ferramentas de navegador em nuvem, SERP e scraping sobre o Modelo de Protocolo de Contexto.
- Habilidades do Scrapeless OpenClaw — arquivos de conhecimento formatados como
SKILL.mdque ensinam o agente a utilizar a API Universal de Scraping do Scrapeless e o LLM Chat Scraper de forma eficaz. O ZeroClaw importa habilidades do OpenClaw diretamente.
O servidor MCP é o que o agente invoca. As habilidades são o que o agente lê para decidir quando e como invocar. Elas não são alternativas — instaladas juntas, o agente possui tanto as ferramentas quanto o manual.
Servidor MCP do Scrapeless
O servidor MCP vem com 20 ferramentas de forma nativa. O conjunto principal:
| Ferramenta | O que faz |
|---|---|
google_search |
Recuperação de SERP com parâmetros de localização gl / hl. |
google_trends |
Dados de busca em alta e interesse em séries temporais. |
scrape_markdown |
Renderiza uma URL através do navegador em nuvem, retorna Markdown. |
scrape_html |
O mesmo, retornando HTML completamente renderizado. |
scrape_screenshot |
Captura uma captura de tela de alta qualidade de qualquer página. |
browser_create |
Aloca (ou reutiliza) uma sessão de navegador em nuvem. |
browser_goto |
Navega a sessão até uma URL. |
browser_click / browser_type / browser_press_key |
Aciona elementos interativos da página. |
browser_scroll / browser_scroll_to |
Aciona conteúdo carregado preguiçosamente. |
browser_get_html / browser_get_text |
Extrai da página atual do navegador em nuvem. |
browser_screenshot / browser_snapshot |
Captura o estado para revisão ou processamento subsequente. |
browser_wait_for / browser_wait |
Aguarda seletores ou durações fixas. |
browser_close |
Libera a sessão. |
Dois transportes são suportados. Stdio (npx -y scrapeless-mcp-server) é o padrão certo para uma estação de trabalho executando o ZeroClaw localmente; HTTP transmitível (https://api.scrapeless.com/mcp) é o padrão certo quando o agente está em um host remoto e o operador deseja que o servidor MCP seja hospedado pelo Scrapeless em vez de ser gerado por invocação.
Habilidades do Scrapeless OpenClaw
As habilidades são arquivos SKILL.md com um pequeno tempo de execução Python que envolve uma API específica do Scrapeless. Ambas estão disponíveis no repositório oficial do Scrapeless no GitHub:
| Habilidade | O que ensina ao agente |
|---|---|
webunlocker-skill |
Aciona a API Universal de Scraping do Scrapeless — busca HTML / Texto Simples / Markdown / capturas de tela / conteúdo estruturado com solução automática de CAPTCHA (reCAPTCHA, Cloudflare Turnstile, desafio Cloudflare), renderização JS, saída de proxy residencial com --country, tentativas, e suporte a POST + cabeçalho personalizado. |
llm-chat-scraper-skill |
Coleta respostas de chat estruturadas do ChatGPT, Gemini, Perplexity e Grok — útil para monitoramento de AI-search e fluxos de trabalho de medição GEO. |
O ZeroClaw herda o formato de habilidade do OpenClaw. As habilidades são clonadas para ~/.zeroclaw/workspace/skills/, são listadas por zeroclaw skills list, e ficam disponíveis para o agente na próxima sessão zeroclaw agent.
O Que Você Pode Fazer Com Isso
- Agente de monitoramento diário. Programe um SOP do ZeroClaw que rode toda manhã:
google_searchpara palavras-chave rastreadas,scrape_markdownos três melhores resultados, resuma, entregue via o adaptador de canal do Discord. - Rastreamento de visibilidade em busca de IA. Com a habilidade LLM Chat Scraper, colete as respostas que ChatGPT, Gemini, Perplexity e Grok geram para prompts relevantes à marca em uma cadência; rastreie presença e sentimento ao longo do tempo.
- Geração de leads a partir de diretórios públicos. Navegue pelo navegador em nuvem através de um diretório público paginado, elimine duplicatas por domínio, entregue os registros para a memória do agente.
- Preenchimento de formulários autenticados com humano na loop. Leve um formulário de integração de fornecedor ou de candidatura a emprego para a tela de revisão final, tire uma captura de tela de página inteira, pare antes de enviar para que um humano possa aprovar.
- Precisão de preços de concorrentes vinculada a geolocalização. Alocar a sessão em um país específico, renderizar a página de preços localizados, diferenciar contra a captura de tela anterior, notificar um canal quando um limite for atingido.
- RAG contra dados de publicadores ao vivo. Renderize páginas de publicadores para texto limpo através do
scrape_markdown, insira na memória SQLite + embeddings do ZeroClaw, recupere para turnos futuros. - Ignorar o Cloudflare para alvos de pesquisa benignos. A habilidade Web Unlocker lida automaticamente com páginas Turnstile e Challenge; o agente vê apenas um payload Markdown limpo.
Na Scrapeless, acessamos apenas dados disponíveis publicamente, enquanto cumprimos rigorosamente com as leis, regulamentos e políticas de privacidade de websites aplicáveis. O conteúdo deste post é apenas para fins de demonstração.
Por Que Scrapeless
Scrapeless é um navegador em nuvem anti-detecção, mais uma API de Raspagem Universal, mais uma API SERP, mais um LLM Chat Scraper, tudo por trás de uma chave de API. Para o ZeroClaw especificamente, ele traz:
- Um servidor MCP nativo — sem instalação de SDK, sem código de adaptador. O bloco MCP em
~/.zeroclaw/config.tomlé toda a integração. - Renderização JavaScript no lado da nuvem para SPAs, feeds de rolagem infinita e painéis carregados sob demanda que são alvos de primeira linha para as ferramentas
browser_*escrape_markdown. - Proxies residenciais em mais de 195 países para que consultas vinculadas à geolocalização retornem as listagens que um usuário local veria.
- Impressão digital anti-detecção em cada sessão — UA, fuso horário, idioma, resolução de tela, WebGL, canvas aleatorizado por sessão.
- Solução automática de CAPTCHA para reCAPTCHA, Cloudflare Turnstile e Cloudflare Challenge através da superfície Web Unlocker.
- Uma única superfície de gerenciamento — uma chave de API, um painel, créditos gratuitos de runtime no plano de nova conta.
Obtenha a chave da API no plano gratuito em app.scrapeless.com. A superfície completa da ferramenta MCP está documentada em github.com/scrapeless-ai/scrapeless-mcp-server; a superfície da API em docs.scrapeless.com.
Pré-requisitos
- Um host semelhante ao UNIX. Linux, macOS ou WSL2 no Windows. O ZeroClaw publica versões para Windows, mas o script de instalação e os scripts de habilidades assumem um shell POSIX — o caminho mais suave é Linux / macOS / WSL2.
- Node.js 18 ou mais recente para o transporte MCP stdio (
npx -y scrapeless-mcp-server). - Python 3.10 ou mais recente para as habilidades OpenClaw (elas são enviadas como scripts Python em
scripts/). - Toolchain Rust se instalando a partir do código-fonte; o caminho do binário pré-compilado não precisa de nada adicional.
- Uma conta Scrapeless e chave de API — inscreva-se em app.scrapeless.com e copie a chave de Configurações → Gerenciamento de Chave de API.
- Uma chave de provedor LLM — Anthropic, OpenAI, Ollama ou qualquer endpoint compatível com OpenAI. O assistente de integração do ZeroClaw a conecta.
gitpara clonar os repositórios de habilidades.jqé opcional — útil ao canalizar a saída do CLI, não é necessário para o caminho MCP.
Instalar o ZeroClaw
A configuração completa é composta por dois subpassos.
1. Execute o instalador
bash
curl -fsSL https://raw.githubusercontent.com/zeroclaw-labs/zeroclaw/master/install.sh | bash
O instalador pergunta se deseja buscar um binário pré-compilado (~segundos) ou compilar a partir do código-fonte (mais lento, personalizável). Ambos terminam da mesma forma — zeroclaw onboard inicia automaticamente. Para pular o assistente no final, passe --skip-onboard e execute zeroclaw onboard mais tarde.
Verifique se o binário está no caminho:
bash
zeroclaw --version
A saída deve ser semelhante a zeroclaw 0.7.5 ou mais recente.
2. Complete o assistente de integração
bash
zeroclaw onboard
O assistente guia pela seleção de provedor, conexão de canal, modo de autonomia e personalização. Para esta integração, duas configurações são importantes:
- Provedor — escolha qualquer provedor LLM que já esteja configurado (OpenAI, Anthropic, Ollama, uma porta de entrada compatível com OpenAI). Cole a chave da API quando solicitado.
- Autonomia —
supervisionadoé o padrão seguro; o agente solicitará antes de invocar ferramentas de risco médio. As ferramentas do MCP contam como risco médio por padrão. Para uma caixa de desenvolvimento onde as solicitações são um atrito, o assistente também expõe o modoyolo, que o operador deve ativar apenas em uma máquina confiável.
Confirme que o tempo de execução está ativo iniciando um chat:
bash
zeroclaw agent
Um "Oi!" deve retornar uma conclusão normal. Se isso acontecer, o tempo de execução está saudável e o próximo passo é conectar ao servidor MCP.
Conectar ZeroClaw ao Servidor Scrapeless MCP
1. Testar o servidor MCP fora do ZeroClaw
Antes de adicionar o bloco MCP ao config.toml, confirme se o servidor inicia de forma independente. O ZeroClaw carrega os servidores MCP de forma preguiçosa na inicialização do agente, então uma configuração quebrada aparece apenas na primeira vez que o agente roda — melhor pegar isso agora:
bash
SCRAPELESS_KEY="<SEU_CHAVE_SCRAPELESS>" npx -y scrapeless-mcp-server
Na primeira execução, npx baixa scrapeless-mcp-server do registro e o servidor inicia através do stdio. O processo permanece anexado; pressione Ctrl-C para liberá-lo. Se uma faixa de inicialização foi impressa e está esperando por solicitações MCP, as credenciais e o pacote funcionam.
Obtenha sua chave API no plano gratuito: app.scrapeless.com
2. Adicionar o bloco MCP ao ~/.zeroclaw/config.toml
O ZeroClaw lê a configuração do servidor MCP de um bloco [mcp] na configuração global. Adicione (ou mescle) o seguinte:
toml
# ~/.zeroclaw/config.toml
[mcp]
enabled = true
deferred_loading = true
servers = [
{ name = "scrapeless", command = "npx", transport = "stdio", args = ["-y", "scrapeless-mcp-server"], env = { SCRAPELESS_KEY = "<SEU_CHAVE_SCRAPELESS>" }, headers = {} }
]
Notas:
-
enabled = trueativa o subsistema MCP. Versões recentes do ZeroClaw têm isso desativado por padrão. -
deferred_loading = truemantém a inicialização do daemon rápida; o ZeroClaw inicianpxapenas quando o agente realmente inicia uma sessão. -
env.SCRAPELESS_KEYé a superfície de autenticação — a mesma chave usada no teste de fumaça na etapa 1. -
Para o transporte HTTP hospedado em vez de stdio, troque a entrada por:
toml{ name = "scrapeless", transport = "http", url = "https://api.scrapeless.com/mcp", headers = { "x-api-token" = "<SEU_CHAVE_SCRAPELESS>" } }A pilha do cliente MCP do ZeroClaw suporta três valores de transporte —
stdio,httpesse— com validação exigindocommand/argspara stdio eurl/headerspara transportes remotos (por conta do problema #1380 do ZeroClaw). O transporte HTTP é o padrão correto quando o ZeroClaw é executado em um host remoto (um VPS ou um contêiner) e o operador não deseja quenpxesteja executando lá.
3. Verifique a conexão de dentro do ZeroClaw
Reinicie a sessão do agente para que ele pegue a nova configuração e carregue o servidor MCP de forma preguiçosa:
bash
zeroclaw agent
Em um chat novo, pergunte:
Quais ferramentas do Scrapeless MCP você tem acesso?
O agente deve enumerar as 20 ferramentas listadas anteriormente — google_search, google_trends, o conjunto browser_*, scrape_html, scrape_markdown, scrape_screenshot. Se a resposta disser que não há ferramentas, a causa mais comum é enabled = false em [mcp]; a segunda causa mais comum é um erro de digitação em SCRAPELESS_KEY.
Instalar as Habilidades Scrapeless OpenClaw
O servidor MCP são as ferramentas. As habilidades são o manual de operações. Ambas as habilidades do Scrapeless funcionam com o ZeroClaw porque o tempo de execução suporta o formato de habilidade OpenClaw diretamente.
1. Permitir scripts de habilidade em ~/.zeroclaw/config.toml
Ambas as habilidades do Scrapeless enviam diretórios scripts/ que o agente executa. Defina allow_scripts = true na seção [skills]:
toml
# ~/.zeroclaw/config.toml
[skills]
allow_scripts = true
allow_scripts está desativado por padrão por segurança. Ativá-lo concede permissão ao ZeroClaw para executar scripts agrupados com habilidades sob a política de autonomia já em vigor; invocações de scripts de risco médio ainda solicitarão aprovação no modo supervisionado.
2. Clonar os repositórios de habilidades
bash
mkdir -p ~/.zeroclaw/workspace/skills
git clone https://github.com/scrapeless-ai/webunlocker-skill ~/.zeroclaw/workspace/skills/webunlocker-skill
git clone https://github.com/scrapeless-ai/llm-chat-scraper-skill ~/.zeroclaw/workspace/skills/llm-chat-scraper-skill
3. Instalar as dependências do Python e o token da API
A habilidade Web Unlocker envia um requirements.txt:
bash
cd ~/.zeroclaw/workspace/skills/webunlocker-skill
pip install -r requirements.txt
cp .env.example .env
# Depois edite .env e defina X_API_TOKEN=<SEU_CHAVE_SCRAPELESS>
Repita para a habilidade LLM Chat Scraper, se estiver dentro do escopo do agente.
4. Verifique se as habilidades estão visíveis para o ZeroClaw
bash
zeroclaw skills list
A saída deve incluir webunlocker-skill e llm-chat-scraper-skill. Se estiverem ausentes, a causa mais comum é que o clone foi colocado sob ~/.zeroclaw/skills/ em vez de ~/.zeroclaw/workspace/skills/ — este último é o caminho que o runtime monitora.
ZeroClaw + Scrapeless em Ação
Um exemplo prático realista: um resumo diário de inteligência competitiva sobre um tópico que o operador acompanha. O agente localiza fontes novas, extrai o conteúdo e produz um resumo estruturado, entregue ao canal ao qual o agente está vinculado.
No zeroclaw agent, cole:
Construa para mim um resumo de inteligência competitiva sobre "frameworks de agentes de IA" dos últimos 7 dias.
1. Use a ferramenta MCP `google_search` do Scrapeless para encontrar as 5 postagens de notícias / blogs mais relevantes publicadas esta semana. Use gl=us, hl=en.
2. Para cada URL de resultado, use `scrape_markdown` para extrair o corpo do artigo. Descarte navegação e anúncios.
3. Use `google_trends` para buscar a curva de interesse de 7 dias para a consulta "frameworks de agentes de IA" para que eu tenha o sinal de demanda junto com o sinal de oferta.
4. Produza um relatório de Markdown estruturado com:
- Os 3 principais temas entre os 5 artigos, cada um com um resumo de uma frase e a URL da fonte.
- A direção da tendência de 7 dias (alta / estável / baixa) e o dia de pico.
- Um destaque de "o que mudou esta semana" — qualquer novidade em relação ao resumo da semana passada.
Se uma página alvo bloquear o navegador em nuvem, volte para `browser_create` + `browser_goto` + `browser_get_text` apenas para essa URL. Não substitua conteúdo sintético; se uma fonte não puder ser recuperada, liste-a sob "fontes não recuperadas".
O plano do agente, em linguagem simples:
- Chame
google_search(q="frameworks de agentes de IA", gl="us", hl="en")e escolha os cinco resultados mais frescos que pareçam fontes primárias (ignore páginas de agregadores). - Itere as URLs através de
scrape_markdowne mantenha o texto limpo no armazenamento de trabalho. - Chame
google_trends(q="frameworks de agentes de IA", date="now 7-d")para a curva de interesse. - Resuma em um breve relatório em Markdown.
- Para qualquer URL que retorne um intersticial anti-bot através de
scrape_markdown, tente novamente através da cadeiabrowser_create→browser_goto→browser_get_text, que ativa uma sessão de navegador em nuvem e aguarda a hidratação antes de extrair.
Antes de cada chamada de ferramenta, o modo de autonomia supervised do ZeroClaw solicita aprovação — Y para aprovação única, A para lembrar a permissão para chamadas de ferramentas futuras na mesma sessão.
Para enviar o prompt sem entrar no chat interativo:
bash
zeroclaw agent --message "Construa para mim um resumo de inteligência competitiva sobre frameworks de agentes de IA dos últimos 7 dias..."
Para transformar isso em uma execução agendada em vez de um prompt ad-hoc, registre uma SOP em uma programação cron e vincule-a ao adaptador de canal pelo qual o agente deve entregar o resumo (Discord, Telegram, e-mail). As ferramentas MCP e a habilidade permanecem as mesmas; apenas o gatilho muda.
O Que Você Recebe de Volta
O resumo retorna como um payload de Markdown ao longo das linhas do seguinte — capturado de uma execução real do prompt acima contra cinco resultados SERP ao vivo para "frameworks de agentes de IA 2026":
markdown
# Frameworks de Agentes de IA — Resumo Semanal (semana de 12-Mai-2026)
## Temas (últimos 7 dias)
1. **LangGraph é o padrão de produção consensual.** Todas as três comparações profundas publicadas esta semana (Towards AI, GuruSup, Alice Labs) classificam LangGraph como #1 para cargas de trabalho de produção. As razões citadas convergem: execução gráfica determinística, pontos de verificação nativos de humanos no loop, e observabilidade de primeira classe através do LangSmith.
Fonte: https://pub.towardsai.net/top-ai-agent-frameworks-in-2026-a-production-ready-comparison-7ba5e39ad56d
2. **MCP está emergindo como o padrão de integração de ferramentas entre frameworks.** O Modelo de Contexto de Antropicos — agora governado pela Linux Foundation com OpenAI, Google, Microsoft, AWS e Salesforce na lista de apoiadores — é referenciado como o padrão de agente para ferramenta em duas das três comparações.
Fonte: https://gurusup.com/blog/best-multi-agent-frameworks-2026
3. **A divisão AutoGen / AG2 é o principal desenvolvimento de 2025–2026.** A Microsoft reescreveu o AutoGen como v0.4+ com uma nova API; a comunidade continuou a linhagem v0.2 como AG2 (ag2.ai). Tanto a Alice Labs quanto a GuruSup sinalizam isso como um momento de "escolher deliberadamente" para equipes avaliando frameworks de debate multi-agente.
Fonte: https://alicelabs.ai/en/insights/best-ai-agent-frameworks-2026
## Sinal de demanda
- Tendência de 7 dias: indisponível (google_trends retornou um erro transitório upstream nesta execução — tente novamente na próxima programação)
## O que mudou esta semana
- A Alice Labs adicionou o SDK do Claude Agent como um novo participante em #2, deslocando o CrewAI para #3 — a primeira classificação que vimos elevar o SDK oficial da Anthropic acima dos generalistas de multi-agente.
- O status do fork AutoGen / AG2 foi referenciado em 2 dos 3 artigos, subindo de 0 na semana passada.
## Fontes não recuperadas
- (nenhuma — o SPA da alicelabs.ai exigiu o caminho de fallback browser_*; recuperado)
A estrutura segue o prompt; os valores são o que a ferramenta verificada realmente retornou no dia em que o resumo foi executado. Algumas observações honestas baseadas na execução ao vivo:
scrape_markdownlimpa a maioria das páginas de editores bem. Towards AI e GuruSup retornaram corpos em Markdown limpos na primeira tentativa. SPAs (aplicações de página única) fortemente renderizadas em JS (alicelabs.ai é uma SPA do Webflow / Vite nesta execução) retornaram a estrutura HTML renderizada em vez disso — o agente se recuperou através da cadeiabrowser_create→browser_goto→browser_get_text, que retornou uma captura de página totalmente estruturada, incluindo a lista classificada, principais conclusões, FAQ e a timestamp da atualização de maio de 2026.google_trendsé interesse, não volume — e às vezes é transitório. Na execução de verificação, a chamada upstream de Tendências retornou um erroload failed; o prompt lida com isso relatando a lacuna em vez de substituir dados sintéticos. A postura de retry correta é a próxima execução agendada, não uma nova tentativa imediata dentro da mesma rodada do agente.- A frescura por fonte varia. Alguns editores atualizam timestamps quando atualizam artigos; se a "frescura" for absolutamente importante, verifique a data de publicação no corpo do artigo, não o snippet do SERP. (A página da Alice Labs nesta execução mostra tanto uma data de publicação em abril de 2026 quanto uma data de atualização em maio de 2026 no corpo.)
- Interstitials anti-bot e shells de SPA são normais, não exceções. Reserve o fallback
browser_*em qualquer prompt que toque sites comerciais em larga escala; a execução de verificação atingiu um em três URLs e a recuperação foi sem eventos.
Conclusão: um agente que lê a web ao vivo
A integração ZeroClaw + Scrapeless se reduz a quatro passos que o operador executa uma vez: instalar ZeroClaw, registrar o servidor MCP Scrapeless em ~/.zeroclaw/config.toml, colocar as habilidades OpenClaw em ~/.zeroclaw/workspace/skills/ e verificar com zeroclaw skills list e um prompt de listagem de ferramentas em zeroclaw agent. Depois disso, cada turno do agente que toca a web — pesquisa, monitoramento, geração de leads, ingestão RAG, rastreamento de visibilidade de busca AI — passa pelo navegador em nuvem, os proxies residenciais e a API SERP atrás de uma chave de API.
Para o mesmo primitivo Scrapeless em outros clientes, o tutorial do servidor MCP cobre Claude Desktop / Cursor / Codex CLI, o post de integração Hermes cobre CDP direto, e o post de integração LangChain cobre agentes Python. O padrão entre todos eles é o mesmo: fixe uma região residencial, mantenha a sessão quente ao longo de fluxos de múltiplos passos, trate interstitials anti-bot como um caso de retry em vez de uma exceção e deixe o agente compor google_search → scrape_markdown → browser_* em qualquer coisa que o prompt realmente peça.
Pronto para Construir Seu Pipeline de Dados Potencializado por AI?
Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores construindo pipelines de agentes locais com base no Scrapeless: Discord · Telegram.
Inscreva-se em app.scrapeless.com para obter runtime MCP gratuito e adaptar os padrões acima a quais fluxos de trabalho o agente ZeroClaw já executa.
FAQ
Q1. O servidor MCP Scrapeless funciona no Windows ou apenas no Linux / macOS?
O servidor MCP é um pacote Node.js — ele roda em qualquer lugar que o Node 18+ roda, incluindo Windows. O instalador do ZeroClaw assume um shell POSIX, então o caminho mais suave no Windows é o WSL2. A variante de transporte HTTP (apontando o ZeroClaw para https://api.scrapeless.com/mcp) remove completamente a dependência local de npx e é a mais fácil de se ajustar para implantações ZeroClaw hospedadas.
Q2. Stdio ou HTTP transmitível — qual transporte é o padrão correto?
Para uma estação de trabalho executando o ZeroClaw localmente, stdio. O ciclo de vida é simples: o ZeroClaw gera npx -y scrapeless-mcp-server na inicialização do agente, o encerra ao parar o agente. Para ZeroClaw em um VPS ou em um contêiner, HTTP. O endpoint hospedado pelo Scrapeless remove a necessidade de empacotar npx e Node na imagem de runtime.
Q3. É legal extrair dados da web pública?
Geralmente sim, quando os dados são visíveis publicamente e o fluxo de trabalho respeita os termos de serviço de cada site e as jurisdições aplicáveis. A postura legal varia por país, por site e por caso de uso (pesquisa, revenda comercial, dados de treinamento). Revise os ToS do site alvo antes de escalar um fluxo de trabalho contra ele e consulte um advogado para casos de uso de alto volume ou regulamentados.
Q4. O servidor MCP e as habilidades OpenClaw se sobrepõem?
Eles são complementares. O servidor MCP fornece ao agente ferramentas — superfícies concretas e chamáveis (google_search, scrape_markdown, browser_*). As habilidades dão ao agente conhecimento — como a API Universal de Scraping Scrapeless se comporta, quando voltar à renderização em JS, qual tipo de resposta solicitar, como encadear a resolução de CAPTCHA com a seleção de país. Instalados juntos, o agente possui ambos.
Q5. O que acontece quando uma página-alvo retorna um interstício anti-bot?
Para scrape_markdown contra a maioria das páginas, o navegador em nuvem resolve o desafio de forma transparente. Para páginas que ainda retornam um interstício, a solução padrão é browser_create → browser_goto → browser_wait_for (um seletor conhecido pós-desafio) → browser_get_text. Orce para esse retorno em qualquer prompt que toca em sites comerciais; o exemplo de prompt acima mostra a forma.
Q6. Como o modo de autonomia do ZeroClaw interage com as chamadas de ferramentas MCP?
No modo supervised (o padrão), o agente solicita antes de invocar cada ferramenta MCP pela primeira vez. O operador pode conceder aprovação de uma só vez (Y) ou aprovação de lembrar-esta-ferramenta (A). No modo yolo, o agente invoca ferramentas sem solicitar; esse modo é apropriado apenas em uma caixa de desenvolvimento confiável.
Q7. O agente pode compor chamadas Scrapeless em fluxos de múltiplos passos em uma única ação?
Sim — esse é o ponto de design. Um único turno do agente normalmente encadeia google_search (localizar), scrape_markdown (extrair da URL canônica) e browser_* (retornar para páginas interativas ou protegidas contra bots). O ZeroClaw transmite as chamadas de ferramentas intermediárias no mesmo contexto da conversa.
Q8. Onde vive a chave da API Scrapeless?
Para o caminho MCP, em env.SCRAPELESS_KEY dentro de ~/.zeroclaw/config.toml (ou no cabeçalho HTTP x-api-token transmitível). Para o caminho de habilidade, no arquivo .env dentro de cada diretório de habilidade como X_API_TOKEN. Os dois caminhos são independentes; rotacionar a chave significa atualizar ambos os locais.
Q9. Um SOP do ZeroClaw pode disparar o mesmo prompt em uma programação?
Sim. Registre um SOP com um gatilho cron que execute o mesmo prompt que o operador colaria em zeroclaw agent --message "...". Vincule o SOP a um adaptador de canal (Discord, Telegram, e-mail) e o resumo é enviado automaticamente. SOPs no modo supervised ainda restringem chamadas de ferramentas de médio risco por aprovação; para execuções programadas não supervisionadas, o SOP precisa ser configurado sob um modo de autonomia mais permissivo ou com permissões de ferramentas pré-concedidas.
Q10. E sobre os outros produtos do Scrapeless — Scraping Browser, Universal Scraping API, SERP API?
O servidor MCP agrupa o navegador em nuvem, SERP e primitivos de scraping mais comuns em uma única superfície MCP. Para fluxos de trabalho que precisam do conjunto completo de primitivos do Scraping Browser diretamente (CDP, digitais personalizadas, persistência de sessão em granularidade session_ttl), conecte o endpoint do Scraping Browser CDP à ferramenta browser embutida do ZeroClaw. As duas abordagens se compõem; elas não entram em conflito.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.



