🥳Junte-se à Comunidade Scrapeless e reivindique sua avaliação gratuita para acessar nossa poderosa ferramenta de raspagem da web!
De volta ao blog

O Navegador Scrapeless Integra Oficialmente a Função imageToText!

Sophia Martinez
Sophia Martinez

Specialist in Anti-Bot Strategies

06-Jun-2025

Estamos muito animados para anunciar que o Scrapeless Browser lançou oficialmente o recurso imageToText, que suporta o reconhecimento automático e preenchimento do conteúdo de Captcha de imagem via CDP!

O reconhecimento de Captcha sempre foi um ponto problemático na automação da web, e a complexidade dos Captchas de imagem tem sido particularmente frustrante para muitos desenvolvedores.

Com o lançamento do recurso imageToText, o Scrapeless elimina a necessidade de serviços OCR de terceiros e intervenção manual; tudo pode ser automatizado com uma única interface API para reconhecimento e entrada.

Destaques do Recurso

  • Recém-lançado: O comando CDP Captcha.imageToText. Ele suporta nativamente o reconhecimento de Captcha de imagem e preenche automaticamente os campos de entrada especificados com os resultados, tudo em questão de segundos.
  • Compatibilidade Dual com Puppeteer e Playwright: Com o SDK Scrapeless, este recurso pode ser facilmente invocado em ambas as principais estruturas de navegador sem cabeça, apoiando uma ampla gama de cenários de desenvolvimento.
  • Sem necessidade de downloads de imagem ou integração de serviços externos: O mecanismo de reconhecimento embutido executa diretamente via CDP, tornando-o adequado para qualquer ambiente de implantação.

Casos de Uso

  • Manipulação automática de Captcha de imagem ao construir agentes de IA.
  • Encontrar com frequência proteção em páginas de produtos durante a coleta de dados em sites de e-commerce.
  • Verificação de imagem para formulários de login, processos de registro e pontos de entrada de crawlers.
  • Serviços de dados em nível empresarial exigem soluções escaláveis para contornar sistemas de verificação de imagem.

Como Integrar a Decodificação imageToText?

É muito simples chamar o Puppeteer; você só precisa adicionar o seguinte código ao seu programa existente:

JavaScript Copy
const client = await page.createCDPSession();
await client.send("Captcha.imageToText", {
  imageSelector: '.captcha__image',
  inputSelector: 'input[name="captcha"]',
  timeout: 30000,
})

Além disso, nós suportamos playwright:

JavaScript Copy
await page.goto("https://www.scrapeless.com", timeout=60000, wait_until="load")
client = await page.target.createCDPSession()
await client.send('Captcha.imageToText', {
  'imageSelector': '.captcha__image',
  'inputSelector': 'input[name="captcha"]',
  'timeout': 30000,
})

Além disso, integrar o [SDK Scrapeless](
// Resolver captcha de imagem
await client.send("Captcha.imageToText", {
imageSelector: ".captcha__image", // Seletor de captcha de imagem
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // Seletor de entrada de resultado
timeout: 30000,
});

Em adição, você também pode contornar Captchas integrando o SDK do Scrapeless. Aqui está nosso código de referência:

JavaScript Copy
import { Puppeteer, createPuppeteerCDPSession } from '@scrapeless-ai/sdk';

async function runExample() {
  console.log('Criando instância do navegador Puppeteer...');
  const browser = await Puppeteer.connect({
    session_name: 'cdp-example-session',
    session_ttl: 300,
    proxy_country: 'US'
  });

  const page = await browser.newPage();

  console.log('Criando sessão CDP aprimorada pelo Scrapeless...');
  const cdpSession = await createPuppeteerCDPSession(page);

  console.log('Navegando para a página de login...');
  await page.goto('https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail');

  await cdpSession.imageToText({
    imageSelector: ".captcha__image", // Seletor de captcha de imagem
    inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // Seletor de entrada de resultado
    timeout: 30000,
  });

  await cdpSession.waitCaptchaDetected();

  await page.screenshot({ path: 'captcha-screenshot.png' });
}

runExample();

As Conclusões

O recurso imageToText lançado pelo Scrapeless Browser é uma atualização importante para enfrentar os desafios do Captcha de imagem. Ele integra o reconhecimento de imagem como uma capacidade nativa do SDK do Scrapeless, proporcionando uma experiência verdadeiramente fluída para os processos de automação.

Comece a usar o SDK do Scrapeless agora para aproveitar esse novo recurso, tornando as tarefas de processamento de Captcha mais eficientes e descomplicadas!

Referência da documentação: API CDP - imageToText

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Catálogo