🎯 Um navegador em nuvem personalizável e anti-detecção alimentado por Chromium desenvolvido internamente, projetado para rastreadores web e agentes de IA. 👉Experimente agora
De volta ao blog

Como Usar o Playwright Stealth para Scraping

Emily Chen
Emily Chen

Advanced Data Extraction Specialist

06-Nov-2025

infraestrutura

  • Sempre atualizado com os mais recentes métodos de contorno anti-bot
  • Foque na lógica do seu negócio, não na infraestrutura

Monitoramento ao Vivo & Depuração

  • Recurso de Sessão Ao Vivo para observar seu scraper em tempo real
  • Repetição de Sessão para depurar solicitações falhadas
  • Logs e análises abrangentes

Integrar o Scrapeless ao seu código Playwright existente é incrivelmente simples. Com apenas alguns passos, você pode contornar quaisquer medidas anti-bot e acessar os dados de que precisa.

Passo 1: Inscreva-se e Obtenha Sua Chave API

  1. Visite o Painel do Scrapeless
  2. Inscreva-se para uma conta gratuita
  3. Navegue até a guia Configurações
  4. Copie sua Chave API

Em vez de lançar um navegador local, conecte-se ao navegador em nuvem do Scrapeless usando o protocolo CDP:

Antes (Playwright Padrão):

python Copy
browser = await p.chromium.launch(headless=True)

Depois (Navegador de Scraping Scrapeless):

python Copy
from playwright.async_api import async_playwright

# Sua Chave API Scrapeless
API_KEY = "sua_chave_api_aqui"

# Construir URL de conexão do Scrapeless
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&session_ttl=180&proxy_country=ANY"

async with async_playwright() as p:
    # Conectar ao navegador em nuvem do Scrapeless
    browser = await p.chromium.connect_over_cdp(connection_url)
    page = await browser.newPage()
    # Sua lógica de scraping aqui

Passo 3: Testar em Sites Protegidos

Vamos tentar fazer scraping da mesma página protegida pelo Cloudflare que bloqueou o Playwright Stealth:

python Copy
from playwright.async_api import async_playwright
import asyncio

async def scraper():
    # Sua Chave API Scrapeless
    API_KEY = "sua_chave_api_aqui"
    
    # URL de conexão do Scrapeless
    connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&session_ttl=180&proxy_country=ANY"
    
    async with async_playwright() as p:
        # Conectar ao navegador em nuvem do Scrapeless
        browser = await p.chromium.connect_over_cdp(connection_url)
        page = await browser.new_page()
        
        # Acessar site protegido pelo Cloudflare
        await page.goto("https://www.scrapingcourse.com/antibot-challenge")
        
        # Extrair conteúdo
        content = await page.content()
        print(content)
        
        # Fazer captura de tela
        await page.screenshot(path="success_screenshot.png")
        
        await browser.close()

# rodar o scraper
if __name__ == "__main__":
    asyncio.run(scraper())

Resultado:

html Copy
<html lang="en">
<head>
    <title>Desafio Antibot - ScrapingCourse.com</title>
</head>
<body>
    <h2>
        Você contornou o desafio Antibot! :D
    </h2>
    <!-- Conteúdo extraído com sucesso -->
</body>
</html>

Parabéns! 🎉 Você contornou com sucesso a proteção do Cloudflare com o Navegador de Scraping Scrapeless.


Opções Avançadas de Configuração

O Navegador de Scraping Scrapeless oferece amplas opções de configuração para casos de uso avançados:

Configurações de Proxy Personalizadas

python Copy
# Usar um proxy de país específico
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&proxy_country=US&session_ttl=300"

# Usar seu próprio proxy
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&proxy_url=http://seu-proxy.com:8080"

Gerenciamento de Sessões

python Copy
# Criar sessão persistente
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&session_name=minha_sessao&session_ttl=600"

Ativar Gravação de Sessão para Depuração

python Copy
# Gravar sessão para depuração
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&session_recording=true"

Impressões Digitais Personalizadas

python Copy
# Usar impressão digital do navegador personalizada
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&fingerprint=custom"

Para mais opções de configuração, visite a Documentação do Scrapeless.


Recurso Playwright Stealth Navegador de Scraping Scrapeless
Complexidade de Configuração Média (requer configuração) Simples (uma linha de mudança)
Contorno Anti-Bot Básico (falha em sistemas avançados) Avançado (taxa de sucesso de 99,9%)
Contorno do Cloudflare ❌ Falha ✅ Sucesso
Resolução de CAPTCHA ❌ Requer manual ✅ Automático
Manutenção ❌ Atualizações constantes necessárias ✅ Zero manutenção
Rotação de IP ❌ Requer DIY ✅ Integrado (70M+ IPs)
Proxies Globais ❌ Serviço externo necessário ✅ 195 países cobertos
Desempenho Local (depende do hardware) ⚡ 10x mais rápido (baseado em nuvem)
Ferramentas de Depuração ❌ Limitadas ✅ Sessão Ao Vivo + Repetição
Escalabilidade ❌ Limitada pelos recursos locais ✅ Sessões concorrentes ilimitadas
Custo Grátis (mas com alto custo de infraestrutura) Pague conforme o uso (40-80% mais barato)
Suporte Apenas comunidade ✅ Suporte profissional

Casos de Uso no Mundo Real

O Scrapeless Scraping Browser se destaca em cenários onde o Playwright Stealth falha:

1. Monitoramento de Preços de E-commerce

  • Raspe Amazon, Walmart, eBay sem bloqueios
  • Acompanhe preços de concorrentes em tempo real
  • Lide com preços dinâmicos e atualizações de inventário

2. Coleta de Dados de Mídias Sociais

  • Extraia dados do Instagram, LinkedIn, Twitter
  • Ultrapasse paredes de login e limites de taxa
  • Mantenha sessões persistentes

3. Inteligência de Viagens e Hospitalidade

  • Monitore preços de voos, tarifas de hotéis
  • Acesse conteúdo geo-restrito
  • Lide com sites de reservas pesados em JavaScript

4. Pesquisa de Mercado e Geração de Leads

  • Raspe diretórios e bancos de dados B2B
  • Extraia informações de contato em grande escala
  • Cumpra limites de taxa automaticamente

5. SEO e Análise de Concorrentes

  • Acompanhe classificações de palavras-chave globalmente
  • Analise estratégias de concorrentes
  • Monitore mudanças no SERP em tempo real

Preço e Otimização de Custos

O Scrapeless Scraping Browser oferece preços flexíveis:

  • Camada Grátis: Perfeito para testes e pequenos projetos
  • Pague Conforme o Uso: Pague apenas pelo que você usa
  • Planos Corporativos: Soluções personalizadas com garantias de SLA

Comparação de Custos:

  • Executando Playwright localmente: $200-500/mês (custos de servidor + manutenção)
  • Usando Scrapeless: $50-150/mês (redução de custo de 40-80%)

Além disso, você elimina:

  • ❌ Custos de manutenção do servidor
  • ❌ Custos de gerenciamento de proxies
  • ❌ Custos de serviço de resolução de CAPTCHA
  • ❌ Tempo do desenvolvedor gasto em depuração

Melhores Práticas

1. Respeite os Limites de Taxa

Mesmo com as poderosas capacidades do Scrapeless, sempre respeite os limites de taxa dos sites-alvo:

python Copy
import asyncio

async def scrape_with_delay(urls):
    for url in urls:
        await page.goto(url)
        # Extraia dados
        await asyncio.sleep(2)  # 2 segundos de intervalo entre solicitações

2. Use Persistência de Sessão

Para sites que exigem login:

python Copy
# Crie uma sessão persistente
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&session_name=login_session&session_ttl=3600"

3. Ative a Gravação de Sessão para Depuração

Ao desenvolver:

python Copy
# Ative a gravação
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&session_recording=true"

Em seguida, visualize as gravações no painel do Scrapeless para depurar falhas.

4. Otimize a Seleção de Proxies

Escolha proxies com base no seu alvo:

python Copy
# Conteúdo apenas dos EUA
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&proxy_country=US"

# Raspar globalmente
connection_url = f"wss://browser.scrapeless.com/browser?token={API_KEY}&proxy_country=ANY"

Conclusão

Embora o Playwright seja uma ferramenta de navegação headless popular, suas propriedades padrão o tornam facilmente detectável por sites de destino. O Playwright Stealth ajuda a mascarar algumas falhas, mas fica aquém contra sistemas avançados de anti-bot, como Cloudflare, DataDome e AWS WAF.

Para extrair dados de forma confiável e em grande escala, recomendamos fortemente usar uma solução corporativa como o Scrapeless Scraping Browser.

Por que Scrapeless?

Zero Mudanças de Código: Uma linha de substituição em seus scripts existentes do Playwright
99,9% Taxa de Sucesso: Ultrapasse qualquer sistema anti-bot, incluindo Cloudflare
Resolução Automática de CAPTCHA: Sem intervenção manual necessária
Rede de Proxies Global: Mais de 70 milhões de IPs residenciais em 195 países
Zero Manutenção: Concentre-se na lógica do seu negócio, não na infraestrutura
Custo-Benefício: 40-80% mais barato do que soluções feitas por você
Suporte Profissional: Obtenha ajuda quando precisar

Experimente o Scrapeless Scraping Browser Gratuitamente – Sem necessidade de cartão de crédito!


Perguntas Frequentes

1. Por que usar o Playwright Stealth?

O Playwright Stealth ajuda a mascarar as propriedades de automação do Playwright para evitar a detecção básica de bots. É um bom ponto de partida para tarefas de raspagem simples, mas tem limitações contra sistemas avançados de anti-bot.

2. O Playwright Stealth é indetectável?

Não. Embora o Playwright Stealth possa contornar a detecção básica de bots, falha contra sistemas avançados de anti-bot, como Cloudflare, DataDome e AWS WAF. Para casos de uso em produção, recomendamos o Scrapeless Scraping Browser.

3. Qual é a melhor maneira de evitar detecção no Playwright?

A maneira mais confiável é usar um serviço de navegador em nuvem profissional como o Scrapeless Scraping Browser, que oferece:

  • Tecnologia anti-detecção de nível corporativo
  • Resolução automática de CAPTCHA
  • Rotação de proxies integrada
  • Zero manutenção
  • Garantia de atividade de 99,9%

4. Posso usar o Scrapeless com meu código existente do Playwright?

Sim! O Scrapeless requer mudanças mínimas no seu código existente. Basta substituir o lançamento do navegador por uma conexão CDP com o navegador em nuvem do Scrapeless:

python Copy
# Antes
```pt
browser = await p.chromium.launch(headless=True)

# Após
browser = await p.chromium.connect_over_cdp(connection_url)

5. Qual é o custo do Scrapeless?

O Scrapeless oferece preços flexíveis, incluindo um nível gratuito para testes. Os planos pay-as-you-go começam a partir de apenas alguns dólares por mês, tornando-se 40-80% mais barato do que manter sua própria infraestrutura. Ver preços atuais.

6. O Scrapeless suporta outras linguagens além do Python?

Sim! O Scrapeless funciona com qualquer linguagem que suporte Puppeteer, Playwright ou o protocolo CDP, incluindo:

  • Python
  • Node.js
  • Java

7. O Scrapeless consegue lidar com sites que requerem login?

Absolutamente! O Scrapeless suporta sessões persistentes, permitindo que você mantenha os estados de login em múltiplas requisições. Use o parâmetro session_name para criar sessões persistentes.


Pronto para elevar sua coleta de dados na web para o próximo nível?

Comece seu teste gratuito | Veja a documentação | Junte-se à comunidade do Discord


Isenção de responsabilidade: Este guia é para fins educacionais. Sempre respeite os termos de serviço dos sites e os arquivos robots.txt. A coleta de dados na web deve ser realizada apenas em dados publicamente disponíveis com a devida autorização.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Catálogo