スクレイプレス LLM チャットスクレイパー
Specialist in Anti-Bot Strategies
AI検索が従来の検索エンジンに取って代わる中、ユーザーからのクエリ、コンテンツ、意思決定がChatGPT、Perplexity、Copilot、Gemini、Google AI Overviewsなどのモデル内で行われるようになっています。ブランドやチームは、これらのAIエンジンからリアルタイムのインサイトを収集、分析、監視する方法を必要としています。これには、プロンプト、回答、引用、ランキング、トレンド、競合の言及が含まれます。
LLM Chat Scraper APIは、まさにこの目的のために構築されています。
このAPIは、すべての主要なAIモデルから構造化されたリアルタイムデータを抽出するための統一されたスクレイピングインターフェースを提供します。これにより、結果をGEO(Generative Engine Optimization)、競合監視、コンテンツ戦略最適化、検索インテリジェンスに利用できます。
始めに
LLM Chat Scraper APIの使用は、2つの簡単なステップで構成されています:
ステップ1: タスクを作成する
POSTリクエストを送信して、スクレイピングタスクを作成します。webhook.urlが指定されている場合、タスクが完了したときに結果が自動的にプッシュされます。
リクエスト例
bash
curl '{api_host}/api/v2/scraper/request' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}' \
--data '{
"actor": "scraper.chatgpt",
"input": {
"prompt": "データ抽出に最も信頼できるプロキシサービス",
"country": "US",
"web_search": true
},
"webhook": {
"url": "http://www.youwebhook.com"
}
}'
ステップ2: 結果を取得する
結果は5分間保存されます。迅速に取得するようにしてください。
リクエスト例
bash
curl --request GET '{api_host}/api/v2/scraper/result/{task_id}' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}'
共通パラメータ
| パラメータ | タイプ | 必須 | 説明 |
|---|---|---|---|
| actor | string | true | スクレイパータイプ(例:scraper.chatgpt) |
| webhook | object | false | Webhook設定 |
| webhook.url | string | false | タスク結果をプッシュするURL |
| input | object | true | タスク特有の入力フィールド |
結果データ構造
| フィールド | タイプ | 必須 | 説明 |
|---|---|---|---|
| status | string | true | タスクの状態:pending / running / success / failed |
| message | string | false | エラーメッセージ(あれば) |
| task_result | object | false | 最終結果フィールド(アクターによって異なる) |
Webhookプッシュフォーマット
webhook.urlが指定されている場合、APIは結果をPOSTで送信します。
| フィールド | タイプ | 必須 | 説明 |
|---|---|---|---|
| task_id | string | true | ユニークなタスクID |
| status | string | true | successまたはfailed |
| input | string | true | 元のリクエストパラメータ(JSON文字列) |
| task_result | object | false | 結果ペイロード |
HTTPステータスコード
| ステータスコード | 説明 |
|---|---|
| 200 | 結果を正常に取得しました |
| 201 | タスクが正常に作成されました |
| 202 | タスクはまだ実行中です |
| 400 | 不正なリクエスト |
| 410 | タスクが期限切れ(12時間保存) |
| 429 | リクエストが多すぎます |
スクレイパーの概要
以下は、サポートされているAIモデルのスクレイパーとそのデータ形式です。
1. ChatGPTスクレイパー
ボディパラメータ
| パラメータ | タイプ | 必須 | 説明 |
|---|---|---|---|
| prompt | string | true | ユーザープロンプト |
| country | string | true | 国/地域 |
| web_search | boolean | false | 内蔵ブラウザー検索を有効にする |
レスポンスフィールド
| フィールド | 説明 |
|---|---|
| prompt | 元のプロンプト |
| result_text | マークダウン形式の応答 |
| model | 使用されたモデル(例:gpt-5-1) |
| web_search | 検索が有効かどうか |
| links | 抽出されたリンク |
| search_result | ウェブ検索結果 |
| content_references | ソース引用 |
2. Perplexityスクレイパー
主なレスポンスフィールド
- prompt
- result_text
- related_prompt(関連質問)
- web_results(タイトル、URL、スニペット)
- media_items(動画、地図、画像)
- locations(緯度/経度、説明、カテゴリ、住所)
旅行、地域情報、ニュース、トレンドトピックのためのリッチな構造化データをサポートしています。
3. コパイロットスクレーパー
複数のモードをサポート:
検索、スマート、チャット、推論、学習
ボディパラメータ
| パラメータ | 説明 |
|---|---|
| プロンプト | 入力プロンプト |
| 国 | JPおよびTWはサポートされていません |
| モード | 検索 / スマート / チャット / 推論 / 学習 |
レスポンスフィールド
- result_text
- prompt
- mode
- links
- citations
4. ジェミニスクレーパー
レスポンスフィールド
- result_text
- prompt
- citations (favicon, highlights, snippet, website_name)
Googleジェミニのレスポンスに類似したリッチな引用構造をサポートしています。
5. Google AI モードスクレーパー
Google AI概要 / AIOレスポンスの取得に使用されます。
レスポンスフィールド
| フィールド | 説明 |
|---|---|
| result_text | 主なAI回答 |
| result_html | 生のHTML |
| raw_url | ソースURL |
| citations | サムネイル付きの引用データ |
| search_result | 従来の検索結果(利用可能な場合) |
ヘルプ & FAQ
請求について
結果が生成されたが5分以内に取得されなかった場合、リクエストは請求されます。
無駄を避けるために:
- 結果をすぐに取得するか、
- 結果を自動受信するためのウェブフックを設定してください。
データソース
公開、ログイン不要のアクセス可能なデータのみを取得し、遵守とプライバシー保護を確保しています。
サポートされている国 / 地域
(以下は一部リスト)
| 国 / 地域 | コード |
|---|---|
| オーストリア | AT |
| オーストラリア | AU |
| ベルギー | BE |
| 日本 | JP |
| シンガポール | SG |
| 台湾 | TW |
| アメリカ合衆国 | US |
| … | … |
195カ国以上の完全なリストはリクエストに応じて利用可能です。
結論
LLMチャットスクレーパーAPIは、チームが以下を実現する能力を提供します:
- すべてのAIチャットプラットフォームでのブランド言及を監視する
- AI回答における競合の存在とランキングを追跡する
- モデルの出力、引用、およびトレンドを分析する
- GEO(生成エンジン最適化)戦略を構築する
- リアルタイムインテリジェンスパイプラインを自動化する
- AI検索エコシステム全体から構造化データにアクセスする
それは単なるスクレーパーを超え、AI検索時代のためのデータインフラストラクチャレイヤーです。
お問い合わせいただければ、完全なGEOデータソリューションをアンロックできます —
すべてのコンテンツがデータに支えられ、アルゴリズムの動作に合わせて配置され、測定可能な成長に向けて位置づけられます。
Scrapelessでは、適用される法律、規制、およびWebサイトのプライバシーポリシーを厳密に遵守しながら、公開されているデータのみにアクセスします。 このブログのコンテンツは、デモンストレーションのみを目的としており、違法または侵害の活動は含まれません。 このブログまたはサードパーティのリンクからの情報の使用に対するすべての責任を保証せず、放棄します。 スクレイピング活動に従事する前に、法律顧問に相談し、ターゲットウェブサイトの利用規約を確認するか、必要な許可を取得してください。



