O Navegador Scrapeless Integra Oficialmente a Função imageToText!

Specialist in Anti-Bot Strategies
Estamos muito animados para anunciar que o Scrapeless Browser lançou oficialmente o recurso imageToText
, que suporta o reconhecimento automático e preenchimento do conteúdo de Captcha de imagem via CDP!
O reconhecimento de Captcha sempre foi um ponto problemático na automação da web, e a complexidade dos Captchas de imagem tem sido particularmente frustrante para muitos desenvolvedores.
Com o lançamento do recurso imageToText
, o Scrapeless elimina a necessidade de serviços OCR de terceiros e intervenção manual; tudo pode ser automatizado com uma única interface API para reconhecimento e entrada.
Destaques do Recurso
- Recém-lançado: O comando CDP
Captcha.imageToText
. Ele suporta nativamente o reconhecimento de Captcha de imagem e preenche automaticamente os campos de entrada especificados com os resultados, tudo em questão de segundos. - Compatibilidade Dual com Puppeteer e Playwright: Com o SDK Scrapeless, este recurso pode ser facilmente invocado em ambas as principais estruturas de navegador sem cabeça, apoiando uma ampla gama de cenários de desenvolvimento.
- Sem necessidade de downloads de imagem ou integração de serviços externos: O mecanismo de reconhecimento embutido executa diretamente via CDP, tornando-o adequado para qualquer ambiente de implantação.
Casos de Uso
- Manipulação automática de Captcha de imagem ao construir agentes de IA.
- Encontrar com frequência proteção em páginas de produtos durante a coleta de dados em sites de e-commerce.
- Verificação de imagem para formulários de login, processos de registro e pontos de entrada de crawlers.
- Serviços de dados em nível empresarial exigem soluções escaláveis para contornar sistemas de verificação de imagem.
Como Integrar a Decodificação imageToText?
É muito simples chamar o Puppeteer; você só precisa adicionar o seguinte código ao seu programa existente:
JavaScript
const client = await page.createCDPSession();
await client.send("Captcha.imageToText", {
imageSelector: '.captcha__image',
inputSelector: 'input[name="captcha"]',
timeout: 30000,
})
Além disso, nós suportamos playwright:
JavaScript
await page.goto("https://www.scrapeless.com", timeout=60000, wait_until="load")
client = await page.target.createCDPSession()
await client.send('Captcha.imageToText', {
'imageSelector': '.captcha__image',
'inputSelector': 'input[name="captcha"]',
'timeout': 30000,
})
Além disso, integrar o [SDK Scrapeless](
// Resolver captcha de imagem
await client.send("Captcha.imageToText", {
imageSelector: ".captcha__image", // Seletor de captcha de imagem
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // Seletor de entrada de resultado
timeout: 30000,
});
Em adição, você também pode contornar Captchas integrando o SDK do Scrapeless. Aqui está nosso código de referência:
JavaScript
import { Puppeteer, createPuppeteerCDPSession } from '@scrapeless-ai/sdk';
async function runExample() {
console.log('Criando instância do navegador Puppeteer...');
const browser = await Puppeteer.connect({
session_name: 'cdp-example-session',
session_ttl: 300,
proxy_country: 'US'
});
const page = await browser.newPage();
console.log('Criando sessão CDP aprimorada pelo Scrapeless...');
const cdpSession = await createPuppeteerCDPSession(page);
console.log('Navegando para a página de login...');
await page.goto('https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail');
await cdpSession.imageToText({
imageSelector: ".captcha__image", // Seletor de captcha de imagem
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // Seletor de entrada de resultado
timeout: 30000,
});
await cdpSession.waitCaptchaDetected();
await page.screenshot({ path: 'captcha-screenshot.png' });
}
runExample();
As Conclusões
O recurso imageToText
lançado pelo Scrapeless Browser é uma atualização importante para enfrentar os desafios do Captcha de imagem. Ele integra o reconhecimento de imagem como uma capacidade nativa do SDK do Scrapeless, proporcionando uma experiência verdadeiramente fluída para os processos de automação.
Comece a usar o SDK do Scrapeless agora para aproveitar esse novo recurso, tornando as tarefas de processamento de Captcha mais eficientes e descomplicadas!
Referência da documentação: API CDP - imageToText
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.