ScrapelessでimageToText CAPTCHAを解除する方法は?

Specialist in Anti-Bot Strategies
私たちは非常に興奮して、Scrapeless Browserが公式にimageToText
機能をローンチしたことを発表します。この機能は、CDPを介して画像Captchaの内容を自動的に認識し、入力することをサポートします!
Captchaの認識は、ウェブオートメーションにおいて常に悩みの種であり、特に画像Captchaの複雑さは多くの開発者にとって特にフラストレーションの原因となっていました。
imageToText
機能のリリースにより、Scrapelessは追加のサードパーティOCRサービスや手動介入の必要性を排除し、認識と入力のための単一のAPIインターフェースですべてを自動化できます。
機能のハイライト
- 新規リリース:
Captcha.imageToText
CDPコマンド。これにより、画像Captchaの認識をネイティブにサポートし、指定された入力フィールドに結果を自動的に記入します。すべてが数秒以内に完了します。 - PuppeteerとPlaywrightとの二重互換性: Scrapeless SDKを使用すると、この機能は主流のヘッドレスブラウザフレームワークの両方で簡単に呼び出すことができ、より幅広い開発シナリオを支援します。
- 画像のダウンロードや外部サービスの統合は不要: 内蔵の認識エンジンは、CDPを介して直接実行され、どんな展開環境にも適しています。
ユースケース
- AIエージェントを構築する際の画像Captchaを自動的に処理する。
- eコマースウェブサイトでのデータ収集中に製品ページの保護に頻繁に遭遇する。
- ログインフォーム、登録プロセス、クローラーの入口に対する画像検証。
- 企業レベルのデータサービスは、画像検証システムを回避するためのスケーラブルなソリューションを必要とします。
imageToText
デコーディングの統合方法は?
Puppeteerを呼び出すのは非常に簡単です。既存のプログラムに次のコードを追加するだけです:
JavaScript
const client = await page.createCDPSession();
await client.send("Captcha.imageToText", {
imageSelector: '.captcha__image',
inputSelector: 'input[name="captcha"]',
timeout: 30000,
})
また、Playwrightもサポートしています:
JavaScript
await page.goto("https://www.scrapeless.com", timeout=60000, wait_until="load")
client = await page.target.createCDPSession()
await client.send('Captcha.imageToText', {
'imageSelector': '.captcha__image',
'inputSelector': 'input[name="captcha"]',
'timeout': 30000,
})
さらに、Scrapeless SDKを統合すると、Captcha.imageToText
コマンドが自動的に呼び出され、DevTools Protocolを介して画像認識と入力プロセスが完了します。開発者はOCRの設定やサードパーティプラットフォームの統合を必要とせず、ワンクリックで使用できる状態です!
JavaScript
const { Puppeteer, createPuppeteerCDPSession } = require('@scrapeless-ai/sdk');
const browser = await Puppeteer.connect({
session_name: 'sdk_test',
session_ttl: 180,
proxy_country: 'US',
session_recording: true,
defaultViewport: null
});
const page = await browser.newPage();
await page.goto('https://www.example.com');
const cdpSession = await createPuppeteerCDPSession(page);
await cdpSession.imageToText({
imageSelector: '.captcha__image',
inputSelector: 'input[name="captcha"]',
timeout: 30000,
})
使用例を確認しましょう!
この機能の実装ステップをよりよく理解するために、次の例にアクセスしてみましょう: interception1.web.de。
私たちはウェブサイトのプライバシーをしっかりと保護しています。このブログのすべてのデータは公開されており、クローリングプロセスのデモンストレーションとしてのみ使用されます。私たちは情報とデータを保存しません。
- 使用チュートリアル:

- 前提条件
ログインしてScrapelessダッシュボードからAPIキーを取得します。

- 完全なアクセスコードは次の通りです。APIキーとターゲットURLを置き換えることを忘れないでください。
JavaScript
import puppeteer from "puppeteer-core"
const query = new URLSearchParams({
token: "YOUR_TOKEN",
proxy_country: "ANY",
session_recording: true,
session_ttl: 900,
session_name: "Default Script",
defaultViewport: null,
})
const connectionURL = `wss://browser.scrapeless.com/browser?${query.toString()}`
const browser = await puppeteer.connect({
browserWSEndpoint: connectionURL,
defaultViewport: null,
})
const page = await browser.newPage()
// ターゲットウェブサイトに移動
await page.goto(
"https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail",
{
timeout: 30000,
}
);
// CDPセッションを作成
const client = await page.createCDPSession();
// 画像キャプチャを解決する
await client.send("Captcha.imageToText", {
imageSelector: ".captcha__image", // 画像キャプチャセレクタ
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // 結果入力セレクタ
timeout: 30000,
});
JavaScript
import { Puppeteer, createPuppeteerCDPSession } from '@scrapeless-ai/sdk';
async function runExample() {
console.log('Puppeteerブラウザインスタンスを作成中...');
const browser = await Puppeteer.connect({
session_name: 'cdp-example-session',
session_ttl: 300,
proxy_country: 'US'
});
const page = await browser.newPage();
console.log('Scrapeless強化CDPセッションを作成中...');
const cdpSession = await createPuppeteerCDPSession(page);
console.log('ログインページにナビゲート中...');
await page.goto('https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail');
await cdpSession.imageToText({
imageSelector: ".captcha__image", // 画像キャプチャセレクタ
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // 結果入力セレクタ
timeout: 30000,
});
await cdpSession.waitCaptchaDetected();
await page.screenshot({ path: 'captcha-screenshot.png' });
}
runExample();
重要なポイント
Scrapeless Browserによって開始されたimageToText
機能は、画像キャプチャの課題に対処するための重要なアップグレードです。これは、Scrapeless SDKのネイティブ機能として画像認識を統合し、オートメーションプロセスにおいて真にシームレスな体験を提供します。
今すぐScrapeless SDKを使用して、この新しい機能を活用し、キャプチャ処理タスクをより効率的かつ簡単に行いましょう!
ドキュメント参照: CDP API - imageToText
Scrapelessでは、適用される法律、規制、およびWebサイトのプライバシーポリシーを厳密に遵守しながら、公開されているデータのみにアクセスします。 このブログのコンテンツは、デモンストレーションのみを目的としており、違法または侵害の活動は含まれません。 このブログまたはサードパーティのリンクからの情報の使用に対するすべての責任を保証せず、放棄します。 スクレイピング活動に従事する前に、法律顧問に相談し、ターゲットウェブサイトの利用規約を確認するか、必要な許可を取得してください。