Scrapelessブラウザが画像をテキストに変換する機能を正式に統合!

Specialist in Anti-Bot Strategies
私たちは非常に興奮しているお知らせがあります。Scrapeless Browserが正式にimageToText
機能をリリースしました。これにより、CDPを介して画像Captchaの内容を自動的に認識し、入力することがサポートされます!
Captchaの認識は、ウェブ自動化において常に悩ましいポイントであり、特に画像Captchaの複雑さは多くの開発者にとって非常にフラストレーションの原因となってきました。
imageToText
機能のリリースにより、Scrapelessは追加のサードパーティOCRサービスや手動での介入を必要とせず、認識と入力のための単一のAPIインターフェースで自動化が可能になります。
機能のハイライト
- 新しくリリース:
Captcha.imageToText
CDPコマンド。これにより、画像Captchaの認識がネイティブにサポートされ、結果を指定された入力フィールドに自動的に記入することができ、すべてが数秒で完了します。 - PuppeteerとPlaywrightのデュアル互換性: Scrapeless SDKを使用すると、この機能は両方の主要なヘッドレスブラウザフレームワークで簡単に呼び出すことができ、より幅広い開発シナリオをサポートします。
- 画像のダウンロードや外部サービスの統合は不要: 組み込みの認識エンジンはCDPを介して直接実行されるため、あらゆるデプロイメント環境に適しています。
使用ケース
- AIエージェントを構築する際に画像Captchaを自動的に処理。
- eコマースウェブサイトでデータ収集を行う際に、商品のページ保護にしばしば遭遇。
- ログインフォームや登録プロセス、クローラのエントリーポイントのための画像確認。
- エンタープライズレベルのデータサービスは、画像確認システムを回避するためのスケーラブルなソリューションを必要とします。
imageToTextデコーディングの統合方法
Puppeteerを呼び出すのは非常に簡単です。既存のプログラムに以下のコードを追加するだけです。
JavaScript
const client = await page.createCDPSession();
await client.send("Captcha.imageToText", {
imageSelector: '.captcha__image',
inputSelector: 'input[name="captcha"]',
timeout: 30000,
})
また、私たちはplaywrightもサポートしています:
JavaScript
await page.goto("https://www.scrapeless.com", timeout=60000, wait_until="load")
client = await page.target.createCDPSession()
await client.send('Captcha.imageToText', {
'imageSelector': '.captcha__image',
'inputSelector': 'input[name="captcha"]',
'timeout': 30000,
})
さらに、Scrapeless SDKを統合すると、自動的にCaptcha.imageToText
コマンドが呼び出され、DevTools Protocolを介して画像の認識と入力プロセスが完了します。開発者はOCRの設定やサードパーティプラットフォームの統合を必要とせず、ワンクリックですぐに使用できます!
JavaScript
const { Puppeteer, createPuppeteerCDPSession } = require('@scrapeless-ai/sdk');
const browser = await Puppeteer.connect({
session_name: 'sdk_test',
session_ttl: 180,
proxy_country: 'US',
session_recording: true,
defaultViewport: null
});
const page = await browser.newPage();
await page.goto('https://www.example.com');
const cdpSession = await createPuppeteerCDPSession(page);
await cdpSession.imageToText({
imageSelector: '.captcha__image',
inputSelector: 'input[name="captcha"]',
timeout: 30000,
})
使用例をチェック!
この機能の実装手順をよりよく理解するために、以下のアクセス例を見てみましょう: interception1.web.de。
私たちはウェブサイトのプライバシーをしっかり守ります。このブログに含まれる全てのデータは公開されており、クローリングプロセスのデモンストレーションとしてのみ使用されます。情報やデータは保存しません。
- 使用チュートリアル:

- 前提条件
ログインしてScrapelessダッシュボードにアクセスし、APIキーを取得してください。

- 完全なアクセスコードは以下の通りです。APIキーとターゲットURLを置き換えることを忘れないでください。
JavaScript
import puppeteer from "puppeteer-core"
const query = new URLSearchParams({
token: "YOUR_TOKEN",
proxy_country: "ANY",
session_recording: true,
session_ttl: 900,
session_name: "Default Script",
defaultViewport: null,
})
const connectionURL = `wss://browser.scrapeless.com/browser?${query.toString()}`
const browser = await puppeteer.connect({
browserWSEndpoint: connectionURL,
defaultViewport: null,
})
const page = await browser.newPage()
// ターゲットウェブサイトに移動
await page.goto(
"https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail",
{
timeout: 30000,
}
);
// CDPセッションを作成
const client = await page.createCDPSession();
// 画像キャプチャを解決する
await client.send("Captcha.imageToText", {
imageSelector: ".captcha__image", // 画像キャプチャセレクタ
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // 結果入力セレクタ
timeout: 30000,
});
JavaScript
import { Puppeteer, createPuppeteerCDPSession } from '@scrapeless-ai/sdk';
async function runExample() {
console.log('Puppeteerブラウザインスタンスを作成中...');
const browser = await Puppeteer.connect({
session_name: 'cdp-example-session',
session_ttl: 300,
proxy_country: 'US'
});
const page = await browser.newPage();
console.log('Scrapeless拡張CDPセッションを作成中...');
const cdpSession = await createPuppeteerCDPSession(page);
console.log('ログインページに移動中...');
await page.goto('https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail');
await cdpSession.imageToText({
imageSelector: ".captcha__image", // 画像キャプチャセレクタ
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // 結果入力セレクタ
timeout: 30000,
});
await cdpSession.waitCaptchaDetected();
await page.screenshot({ path: 'captcha-screenshot.png' });
}
runExample();
要点
Scrapeless Browserが開始したimageToText
機能は、画像キャプチャの課題に対処するための重要なアップグレードです。これはScrapeless SDKのネイティブ機能として画像認識を統合し、プロセスの自動化において真にシームレスな体験を提供します。
今すぐScrapeless SDKを使用して、この新しい機能を活用し、キャプチャ処理タスクをより効率的で楽にしましょう!
ドキュメントの参照: CDP API - imageToText
Scrapelessでは、適用される法律、規制、およびWebサイトのプライバシーポリシーを厳密に遵守しながら、公開されているデータのみにアクセスします。 このブログのコンテンツは、デモンストレーションのみを目的としており、違法または侵害の活動は含まれません。 このブログまたはサードパーティのリンクからの情報の使用に対するすべての責任を保証せず、放棄します。 スクレイピング活動に従事する前に、法律顧問に相談し、ターゲットウェブサイトの利用規約を確認するか、必要な許可を取得してください。