🎯 カスタマイズ可能で検出回避型のクラウドブラウザ。自社開発のChromiumを搭載し、ウェブクローラーAIエージェント向けに設計されています。👉今すぐ試す
ブログに戻ります

スクレイプレス LLM チャットスクレイパー

Sophia Martinez
Sophia Martinez

Specialist in Anti-Bot Strategies

10-Dec-2025

AI検索が従来の検索エンジンに取って代わる中、ユーザーからのクエリ、コンテンツ、意思決定がChatGPT、Perplexity、Copilot、Gemini、Google AI Overviewsなどのモデル内で行われるようになっています。ブランドやチームは、これらのAIエンジンからリアルタイムのインサイトを収集、分析、監視する方法を必要としています。これには、プロンプト、回答、引用、ランキング、トレンド、競合の言及が含まれます。

LLM Chat Scraper APIは、まさにこの目的のために構築されています。

このAPIは、すべての主要なAIモデルから構造化されたリアルタイムデータを抽出するための統一されたスクレイピングインターフェースを提供します。これにより、結果をGEO(Generative Engine Optimization)、競合監視、コンテンツ戦略最適化、検索インテリジェンスに利用できます。


始めに

LLM Chat Scraper APIの使用は、2つの簡単なステップで構成されています:


ステップ1: タスクを作成する

POSTリクエストを送信して、スクレイピングタスクを作成します。webhook.urlが指定されている場合、タスクが完了したときに結果が自動的にプッシュされます。

リクエスト例

bash Copy
curl '{api_host}/api/v2/scraper/request' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}' \
--data '{
  "actor": "scraper.chatgpt",
  "input": {
    "prompt": "データ抽出に最も信頼できるプロキシサービス",
    "country": "US",
    "web_search": true
  },
  "webhook": {
    "url": "http://www.youwebhook.com"
  }
}'

ステップ2: 結果を取得する

結果は5分間保存されます。迅速に取得するようにしてください。

リクエスト例

bash Copy
curl --request GET '{api_host}/api/v2/scraper/result/{task_id}' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}'

共通パラメータ

パラメータ タイプ 必須 説明
actor string true スクレイパータイプ(例:scraper.chatgpt)
webhook object false Webhook設定
webhook.url string false タスク結果をプッシュするURL
input object true タスク特有の入力フィールド

結果データ構造

フィールド タイプ 必須 説明
status string true タスクの状態:pending / running / success / failed
message string false エラーメッセージ(あれば)
task_result object false 最終結果フィールド(アクターによって異なる)

Webhookプッシュフォーマット

webhook.urlが指定されている場合、APIは結果をPOSTで送信します。

フィールド タイプ 必須 説明
task_id string true ユニークなタスクID
status string true successまたはfailed
input string true 元のリクエストパラメータ(JSON文字列)
task_result object false 結果ペイロード

HTTPステータスコード

ステータスコード 説明
200 結果を正常に取得しました
201 タスクが正常に作成されました
202 タスクはまだ実行中です
400 不正なリクエスト
410 タスクが期限切れ(12時間保存)
429 リクエストが多すぎます

スクレイパーの概要

以下は、サポートされているAIモデルのスクレイパーとそのデータ形式です。


1. ChatGPTスクレイパー

ボディパラメータ

パラメータ タイプ 必須 説明
prompt string true ユーザープロンプト
country string true 国/地域
web_search boolean false 内蔵ブラウザー検索を有効にする

レスポンスフィールド

フィールド 説明
prompt 元のプロンプト
result_text マークダウン形式の応答
model 使用されたモデル(例:gpt-5-1)
web_search 検索が有効かどうか
links 抽出されたリンク
search_result ウェブ検索結果
content_references ソース引用

2. Perplexityスクレイパー

主なレスポンスフィールド

  • prompt
  • result_text
  • related_prompt(関連質問)
  • web_results(タイトル、URL、スニペット)
  • media_items(動画、地図、画像)
  • locations(緯度/経度、説明、カテゴリ、住所)
    旅行、地域情報、ニュース、トレンドトピックのためのリッチな構造化データをサポートしています。

3. コパイロットスクレーパー

複数のモードをサポート:
検索スマートチャット推論学習

ボディパラメータ

パラメータ 説明
プロンプト 入力プロンプト
JPおよびTWはサポートされていません
モード 検索 / スマート / チャット / 推論 / 学習

レスポンスフィールド

  • result_text
  • prompt
  • mode
  • links
  • citations

4. ジェミニスクレーパー

レスポンスフィールド

  • result_text
  • prompt
  • citations (favicon, highlights, snippet, website_name)

Googleジェミニのレスポンスに類似したリッチな引用構造をサポートしています。


5. Google AI モードスクレーパー

Google AI概要 / AIOレスポンスの取得に使用されます。

レスポンスフィールド

フィールド 説明
result_text 主なAI回答
result_html 生のHTML
raw_url ソースURL
citations サムネイル付きの引用データ
search_result 従来の検索結果(利用可能な場合)

ヘルプ & FAQ

請求について

結果が生成されたが5分以内に取得されなかった場合、リクエストは請求されます。
無駄を避けるために:

  • 結果をすぐに取得するか、
  • 結果を自動受信するためのウェブフックを設定してください。

データソース

公開、ログイン不要のアクセス可能なデータのみを取得し、遵守とプライバシー保護を確保しています。


サポートされている国 / 地域

(以下は一部リスト)

国 / 地域 コード
オーストリア AT
オーストラリア AU
ベルギー BE
日本 JP
シンガポール SG
台湾 TW
アメリカ合衆国 US

195カ国以上の完全なリストはリクエストに応じて利用可能です。


結論

LLMチャットスクレーパーAPIは、チームが以下を実現する能力を提供します:

  • すべてのAIチャットプラットフォームでのブランド言及を監視する
  • AI回答における競合の存在とランキングを追跡する
  • モデルの出力、引用、およびトレンドを分析する
  • GEO(生成エンジン最適化)戦略を構築する
  • リアルタイムインテリジェンスパイプラインを自動化する
  • AI検索エコシステム全体から構造化データにアクセスする

それは単なるスクレーパーを超え、AI検索時代のためのデータインフラストラクチャレイヤーです

お問い合わせいただければ、完全なGEOデータソリューションをアンロックできます —
すべてのコンテンツがデータに支えられ、アルゴリズムの動作に合わせて配置され、測定可能な成長に向けて位置づけられます。

Scrapelessでは、適用される法律、規制、およびWebサイトのプライバシーポリシーを厳密に遵守しながら、公開されているデータのみにアクセスします。 このブログのコンテンツは、デモンストレーションのみを目的としており、違法または侵害の活動は含まれません。 このブログまたはサードパーティのリンクからの情報の使用に対するすべての責任を保証せず、放棄します。 スクレイピング活動に従事する前に、法律顧問に相談し、ターゲットウェブサイトの利用規約を確認するか、必要な許可を取得してください。

最も人気のある記事

カタログ