Como desbloquear o CAPTCHA imageToText no Scrapeless?

Specialist in Anti-Bot Strategies
Estamos muito animados em anunciar que o Scrapeless Browser lançou oficialmente o recurso imageToText
, que suporta reconhecimento automático e preenchimento de conteúdo de Captcha de imagem via CDP!
O reconhecimento de Captcha sempre foi um ponto problemático na automação web, e a complexidade dos Captchas de imagem tem sido particularmente frustrante para muitos desenvolvedores.
Com o lançamento do recurso imageToText
, o Scrapeless elimina a necessidade de serviços de OCR de terceiros adicionais e intervenção manual; tudo pode ser automatizado com uma única interface de API para reconhecimento e entrada.
Destaques do Recurso
- Recém-Lançado: O comando
Captcha.imageToText
do CDP. Suporta nativamente o reconhecimento de Captcha de imagem e preenche automaticamente os campos de entrada especificados com os resultados, tudo isso em apenas alguns segundos. - Compatibilidade Dupla com Puppeteer e Playwright: Com o SDK Scrapeless, esse recurso pode ser facilmente invocado em ambos os frameworks de navegador headless mais comuns, suportando uma gama mais ampla de cenários de desenvolvimento.
- Sem Necessidade de Downloads de Imagem ou Integração de Serviços Externos: O mecanismo de reconhecimento embutido é executado diretamente via CDP, tornando-o adequado para qualquer ambiente de implantação.
Casos de Uso
- Lidar automaticamente com Captcha de imagem ao construir agentes de IA.
- Encontrar com frequência proteção de página de produtos durante a coleta de dados em sites de comércio eletrônico.
- Verificação de imagem para formulários de login, processos de registro e pontos de entrada de crawlers.
- Serviços de dados em nível empresarial que exigem soluções escaláveis para contornar sistemas de verificação de imagem.
Como Integrar a Decodificação imageToText?
É muito simples chamar o Puppeteer; você só precisa adicionar o seguinte código ao seu programa existente:
JavaScript
const client = await page.createCDPSession();
await client.send("Captcha.imageToText", {
imageSelector: '.captcha__image',
inputSelector: 'input[name="captcha"]',
timeout: 30000,
})
Além disso, também suportamos playwright:
JavaScript
await page.goto("https://www.scrapeless.com", timeout=60000, wait_until="load")
client = await page.target.createCDPSession()
await client.send('Captcha.imageToText', {
'imageSelector': '.captcha__image',
'inputSelector': 'input[name="captcha"]',
'timeout': 30000,
})
Além disso, integrar o SDK Scrapeless invocará automaticamente o comando Captcha.imageToText
, completando o processo de reconhecimento e entrada de imagem via DevTools Protocol. Os desenvolvedores não precisam de nenhuma configuração de OCR ou integração de plataforma de terceiros; está pronto para uso com apenas um clique!
JavaScript
const { Puppeteer, createPuppeteerCDPSession } = require('@scrapeless-ai/sdk');
const browser = await Puppeteer.connect({
session_name: 'sdk_test',
session_ttl: 180,
proxy_country: 'US',
session_recording: true,
defaultViewport: null
});
const page = await browser.newPage();
await page.goto('https://www.example.com');
const cdpSession = await createPuppeteerCDPSession(page);
await cdpSession.imageToText({
imageSelector: '.captcha__image',
inputSelector: 'input[name="captcha"]',
timeout: 30000,
})
Confira Nosso Exemplo de Uso!
Para entender melhor os passos de implementação deste recurso, vamos usar o exemplo de acesso: interception1.web.de.
Protegemos firmemente a privacidade do site. Todos os dados neste blog são públicos e são utilizados apenas como uma demonstração do processo de rastreamento. Não salvamos nenhuma informação e dado.
- Usando Tutorial:

- Pré-requisito
Faça login no Painel do Scrapeless e obtenha a Chave da API

- O código de acesso completo é o seguinte. Lembre-se de substituir sua chave de API e a URL de destino.
JavaScript
import puppeteer from "puppeteer-core"
const query = new URLSearchParams({
token: "YOUR_TOKEN",
proxy_country: "ANY",
session_recording: true,
session_ttl: 900,
session_name: "Default Script",
defaultViewport: null,
})
const connectionURL = `wss://browser.scrapeless.com/browser?${query.toString()}`
const browser = await puppeteer.connect({
browserWSEndpoint: connectionURL,
defaultViewport: null,
})
const page = await browser.newPage()
// vá para o seu site de destino
await page.goto(
"https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail",
{
timeout: 30000,
}
);
// Criando sessão CDP
const client = await page.createCDPSession();
// Resolver captcha de imagem
await client.send("Captcha.imageToText", {
imageSelector: ".captcha__image", // Seletor de captcha de imagem
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // Seletor de entrada do resultado
timeout: 30000,
});
Em adição, você também pode contornar Captchas integrando o SDK Scrapeless. Aqui está o nosso código de referência:
JavaScript
import { Puppeteer, createPuppeteerCDPSession } from '@scrapeless-ai/sdk';
async function runExample() {
console.log('Criando instância do navegador Puppeteer...');
const browser = await Puppeteer.connect({
session_name: 'cdp-example-session',
session_ttl: 300,
proxy_country: 'US'
});
const page = await browser.newPage();
console.log('Criando sessão CDP aprimorada pelo Scrapeless...');
const cdpSession = await createPuppeteerCDPSession(page);
console.log('Navegando para a página de login...');
await page.goto('https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail');
await cdpSession.imageToText({
imageSelector: ".captcha__image", // Seletor de captcha de imagem
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // Seletor de entrada do resultado
timeout: 30000,
});
await cdpSession.waitCaptchaDetected();
await page.screenshot({ path: 'captcha-screenshot.png' });
}
runExample();
Conclusões Finais
O recurso imageToText
lançado pelo Scrapeless Browser é uma atualização importante para enfrentar os desafios do Captcha de imagem. Ele integra o reconhecimento de imagem como uma capacidade nativa do SDK Scrapeless, proporcionando uma experiência verdadeiramente contínua para processos de automação.
Comece a usar o SDK Scrapeless agora para aproveitar este novo recurso, tornando as tarefas de processamento de Captcha mais eficientes e sem esforço!
Referência da documentação: API CDP - imageToText
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.