🥳Scrapeless Communityに参加して、強力なWebスクレイピングツールキットにアクセスするために無料トライアルを取得してください!
ブログに戻ります

Scrapelessブラウザが画像をテキストに変換する機能を正式に統合!

Sophia Martinez
Sophia Martinez

Specialist in Anti-Bot Strategies

06-Jun-2025

私たちは非常に興奮しているお知らせがあります。Scrapeless Browserが正式にimageToText機能をリリースしました。これにより、CDPを介して画像Captchaの内容を自動的に認識し、入力することがサポートされます!

Captchaの認識は、ウェブ自動化において常に悩ましいポイントであり、特に画像Captchaの複雑さは多くの開発者にとって非常にフラストレーションの原因となってきました。

imageToText機能のリリースにより、Scrapelessは追加のサードパーティOCRサービスや手動での介入を必要とせず、認識と入力のための単一のAPIインターフェースで自動化が可能になります。

機能のハイライト

  • 新しくリリース: Captcha.imageToText CDPコマンド。これにより、画像Captchaの認識がネイティブにサポートされ、結果を指定された入力フィールドに自動的に記入することができ、すべてが数秒で完了します。
  • PuppeteerとPlaywrightのデュアル互換性: Scrapeless SDKを使用すると、この機能は両方の主要なヘッドレスブラウザフレームワークで簡単に呼び出すことができ、より幅広い開発シナリオをサポートします。
  • 画像のダウンロードや外部サービスの統合は不要: 組み込みの認識エンジンはCDPを介して直接実行されるため、あらゆるデプロイメント環境に適しています。

使用ケース

  • AIエージェントを構築する際に画像Captchaを自動的に処理。
  • eコマースウェブサイトでデータ収集を行う際に、商品のページ保護にしばしば遭遇。
  • ログインフォームや登録プロセス、クローラのエントリーポイントのための画像確認。
  • エンタープライズレベルのデータサービスは、画像確認システムを回避するためのスケーラブルなソリューションを必要とします。

imageToTextデコーディングの統合方法

Puppeteerを呼び出すのは非常に簡単です。既存のプログラムに以下のコードを追加するだけです。

JavaScript Copy
const client = await page.createCDPSession();
await client.send("Captcha.imageToText", {
  imageSelector: '.captcha__image',
  inputSelector: 'input[name="captcha"]',
  timeout: 30000,
})

また、私たちはplaywrightもサポートしています:

JavaScript Copy
await page.goto("https://www.scrapeless.com", timeout=60000, wait_until="load")
client = await page.target.createCDPSession()
await client.send('Captcha.imageToText', {
  'imageSelector': '.captcha__image',
  'inputSelector': 'input[name="captcha"]',
  'timeout': 30000,
})

さらに、Scrapeless SDKを統合すると、自動的にCaptcha.imageToTextコマンドが呼び出され、DevTools Protocolを介して画像の認識と入力プロセスが完了します。開発者はOCRの設定やサードパーティプラットフォームの統合を必要とせず、ワンクリックですぐに使用できます!

JavaScript Copy
const { Puppeteer, createPuppeteerCDPSession } = require('@scrapeless-ai/sdk');
 
const browser = await Puppeteer.connect({
  session_name: 'sdk_test',
  session_ttl: 180,
  proxy_country: 'US',
  session_recording: true,
  defaultViewport: null
});
const page = await browser.newPage();
await page.goto('https://www.example.com');

const cdpSession = await createPuppeteerCDPSession(page);
 
await cdpSession.imageToText({
  imageSelector: '.captcha__image',
  inputSelector: 'input[name="captcha"]',
  timeout: 30000,
})

使用例をチェック!

この機能の実装手順をよりよく理解するために、以下のアクセス例を見てみましょう: interception1.web.de

私たちはウェブサイトのプライバシーをしっかり守ります。このブログに含まれる全てのデータは公開されており、クローリングプロセスのデモンストレーションとしてのみ使用されます。情報やデータは保存しません。

  • 使用チュートリアル:
imageToText
  • 前提条件

ログインしてScrapelessダッシュボードにアクセスし、APIキーを取得してください。

get the Scrapeless API Key
  • 完全なアクセスコードは以下の通りです。APIキーとターゲットURLを置き換えることを忘れないでください。
JavaScript Copy
import puppeteer from "puppeteer-core"

const query = new URLSearchParams({
    token: "YOUR_TOKEN",
    proxy_country: "ANY",
    session_recording: true,
    session_ttl: 900,
    session_name: "Default Script",
    defaultViewport: null,
})

const connectionURL = `wss://browser.scrapeless.com/browser?${query.toString()}`

const browser = await puppeteer.connect({
    browserWSEndpoint: connectionURL,
    defaultViewport: null,
})

const page = await browser.newPage()
// ターゲットウェブサイトに移動
await page.goto(
    "https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail",
    {
      timeout: 30000,
    }
);

// CDPセッションを作成
const client = await page.createCDPSession();

// 画像キャプチャを解決する
await client.send("Captcha.imageToText", {
imageSelector: ".captcha__image", // 画像キャプチャセレクタ
inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // 結果入力セレクタ
timeout: 30000,
});

JavaScript Copy
import { Puppeteer, createPuppeteerCDPSession } from '@scrapeless-ai/sdk';

async function runExample() {
  console.log('Puppeteerブラウザインスタンスを作成中...');
  const browser = await Puppeteer.connect({
    session_name: 'cdp-example-session',
    session_ttl: 300,
    proxy_country: 'US'
  });

  const page = await browser.newPage();

  console.log('Scrapeless拡張CDPセッションを作成中...');
  const cdpSession = await createPuppeteerCDPSession(page);

  console.log('ログインページに移動中...');
  await page.goto('https://interception1.web.de/logininterceptionfrontend/?interceptiontype=VerifyLogin&interceptiontype=VerifyLogin&service=freemail');

  await cdpSession.imageToText({
    imageSelector: ".captcha__image", // 画像キャプチャセレクタ
    inputSelector: 'input[name="captchaPanel:captchaImagePanel:captchaInput:topWrapper:inputWrapper:input"', // 結果入力セレクタ
    timeout: 30000,
  });

  await cdpSession.waitCaptchaDetected();

  await page.screenshot({ path: 'captcha-screenshot.png' });
}

runExample();

要点

Scrapeless Browserが開始したimageToText機能は、画像キャプチャの課題に対処するための重要なアップグレードです。これはScrapeless SDKのネイティブ機能として画像認識を統合し、プロセスの自動化において真にシームレスな体験を提供します。

今すぐScrapeless SDKを使用して、この新しい機能を活用し、キャプチャ処理タスクをより効率的で楽にしましょう!

ドキュメントの参照: CDP API - imageToText

Scrapelessでは、適用される法律、規制、およびWebサイトのプライバシーポリシーを厳密に遵守しながら、公開されているデータのみにアクセスします。 このブログのコンテンツは、デモンストレーションのみを目的としており、違法または侵害の活動は含まれません。 このブログまたはサードパーティのリンクからの情報の使用に対するすべての責任を保証せず、放棄します。 スクレイピング活動に従事する前に、法律顧問に相談し、ターゲットウェブサイトの利用規約を確認するか、必要な許可を取得してください。

最も人気のある記事

カタログ