🥳Junte-se à Comunidade Scrapeless e reivindique sua avaliação gratuita para acessar nossa poderosa ferramenta de raspagem da web!
De volta ao blog

Como desbloquear o CAPTCHA imageToText no Scrapeless?

Sophia Martinez
Sophia Martinez

Specialist in Anti-Bot Strategies

06-Jun-2025

Estamos muito animados em anunciar que o Scrapeless Browser lançou oficialmente o recurso imageToText, que suporta reconhecimento automático e preenchimento de conteúdo de Captcha de imagem via CDP!

O reconhecimento de Captcha sempre foi um ponto problemático na automação web, e a complexidade dos Captchas de imagem tem sido particularmente frustrante para muitos desenvolvedores.

Com o lançamento do recurso imageToText, o Scrapeless elimina a necessidade de serviços de OCR de terceiros adicionais e intervenção manual; tudo pode ser automatizado com uma única interface de API para reconhecimento e entrada.

Destaques do Recurso

  • Recém-Lançado: O comando Captcha.imageToText do CDP. Suporta nativamente o reconhecimento de Captcha de imagem e preenche automaticamente os campos de entrada especificados com os resultados, tudo isso em apenas alguns segundos.
  • Compatibilidade Dupla com Puppeteer e Playwright: Com o SDK Scrapeless, esse recurso pode ser facilmente invocado em ambos os frameworks de navegador headless mais comuns, suportando uma gama mais ampla de cenários de desenvolvimento.
  • Sem Necessidade de Downloads de Imagem ou Integração de Serviços Externos: O mecanismo de reconhecimento embutido é executado diretamente via CDP, tornando-o adequado para qualquer ambiente de implantação.

Casos de Uso

  • Lidar automaticamente com Captcha de imagem ao construir agentes de IA.
  • Encontrar com frequência proteção de página de produtos durante a coleta de dados em sites de comércio eletrônico.
  • Verificação de imagem para formulários de login, processos de registro e pontos de entrada de crawlers.
  • Serviços de dados em nível empresarial que exigem soluções escaláveis para contornar sistemas de verificação de imagem.

Como Integrar a Decodificação imageToText?

É muito simples chamar o Puppeteer; você só precisa adicionar o seguinte código ao seu programa existente:

JavaScript Copy
const client = await page.createCDPSession();
await client.send("Captcha.imageToText", {
  imageSelector: '.captcha__image',
  inputSelector: 'input[name="captcha"]',
  timeout: 30000,
})

Além disso, também suportamos playwright:

JavaScript Copy
await page.goto("https://www.scrapeless.com", timeout=60000, wait_until="load")
client = await page.target.createCDPSession()
await client.send('Captcha.imageToText', {
  'imageSelector': '.captcha__image',
  'inputSelector': 'input[name="captcha"]',
  'timeout': 30000,
})

Além disso, integrar o SDK Scrapeless invocará automaticamente o comando Captcha.imageToText, completando o processo de reconhecimento e entrada de imagem via DevTools Protocol. Os desenvolvedores não precisam de nenhuma configuração de OCR ou integração de plataforma de terceiros; está pronto para uso com apenas um clique!

JavaScript Copy
const { Puppeteer, createPuppeteerCDPSession } = require('@scrapeless-ai/sdk');
 
const browser = await Puppeteer.connect({
  session_name: 'sdk_test',
  session_ttl: 180,
  proxy_country: 'US',
  session_recording: true,
  defaultViewport: null
});
const page = await browser.newPage();
await page.goto('https://www.example.com');

const cdpSession = await createPuppeteerCDPSession(page);
 
await cdpSession.imageToText({
  imageSelector: '.captcha__image',
  inputSelector: 'input[name="captcha"]',
  timeout: 30000,
})

Confira Nosso Exemplo de Uso!

Para entender melhor os passos de implementação deste recurso, vamos usar o exemplo de acesso: interception1.web.de.

Protegemos firmemente a privacidade do site. Todos os dados neste blog são públicos e são utilizados apenas como uma demonstração do processo de rastreamento. Não salvamos nenhuma informação e dado.

  • Usando Tutorial:
imageToText
  • Pré-requisito

Faça login no Painel do Scrapeless e obtenha a Chave da API

obtenha a Chave da API Scrapeless
  • O código de acesso completo é o seguinte. Lembre-se de substituir sua chave de API e a URL de destino.
JavaScript Copy
import puppeteer from "puppeteer-core"

const query = new URLSearchParams({
    token: "YOUR_TOKEN",
    proxy_country: "ANY",
    session_recording: true,
    session_ttl: 900,
    session_name: "Default Script",
    defaultViewport: null,
})

const connectionURL = `wss://browser.scrapeless.com/browser?${query.toString()}`

const browser = await puppeteer.connect({
    browserWSEndpoint: connectionURL,
    defaultViewport: null,
})

const page = await browser.newPage()
// vá para o seu site de destino
await page.goto(
    "https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail",
    {
      timeout: 30000,
    }
);

// Criando sessão CDP
const client = await page.createCDPSession();

// Resolver captcha de imagem
await client.send("Captcha.imageToText", {
imageSelector: ".captcha__image", // Seletor de captcha de imagem
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // Seletor de entrada do resultado
timeout: 30000,
});

Em adição, você também pode contornar Captchas integrando o SDK Scrapeless. Aqui está o nosso código de referência:

JavaScript Copy
import { Puppeteer, createPuppeteerCDPSession } from '@scrapeless-ai/sdk';

async function runExample() {
  console.log('Criando instância do navegador Puppeteer...');
  const browser = await Puppeteer.connect({
    session_name: 'cdp-example-session',
    session_ttl: 300,
    proxy_country: 'US'
  });

  const page = await browser.newPage();

  console.log('Criando sessão CDP aprimorada pelo Scrapeless...');
  const cdpSession = await createPuppeteerCDPSession(page);

  console.log('Navegando para a página de login...');
  await page.goto('https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail');

  await cdpSession.imageToText({
    imageSelector: ".captcha__image", // Seletor de captcha de imagem
    inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // Seletor de entrada do resultado
    timeout: 30000,
  });

  await cdpSession.waitCaptchaDetected();

  await page.screenshot({ path: 'captcha-screenshot.png' });
}

runExample();

Conclusões Finais

O recurso imageToText lançado pelo Scrapeless Browser é uma atualização importante para enfrentar os desafios do Captcha de imagem. Ele integra o reconhecimento de imagem como uma capacidade nativa do SDK Scrapeless, proporcionando uma experiência verdadeiramente contínua para processos de automação.

Comece a usar o SDK Scrapeless agora para aproveitar este novo recurso, tornando as tarefas de processamento de Captcha mais eficientes e sem esforço!

Referência da documentação: API CDP - imageToText

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Catálogo