AIショッピングデータソースの比較:製品データの所在
Scraping and Proxy Management Expert
TL;DR:
- AIショッピングデータは、1つのフィードではなく、4つの異なるサーフェスから取得されます。 ChatGPTショッピング、Google AIモード、Google AIオーバービュー、Googleショッピングはそれぞれ同じクエリに対して異なるデータ単位を返すため、選択するサーフェスによって監視できる内容が決まります。
- ChatGPTショッピングは、商人ごとのオファーリストを返す唯一のサーフェスです。
scraper.chatgptアクターはshopping: trueを指定すると、同じモデルがSony、Best Buy、Walmart、Targetで価格付けされたoffers[]配列を持つ製品を返します。 - Google AIモードは、1回の呼び出しで合成された回答、引用元、豊富な製品詳細を返します。 単一の
scraper.aimodeリクエストは、各製品にブランド、価格範囲、評価、店舗、レビューを持つ7つのcitationsと7つのproductsを返しました。 - Google AIオーバービューは、ショッピング意図が発火した場合にのみ
productsを表示します。scraper.overviewアクターはis_shoppingとis_overview_shoppingというフラグを返します。これらは「best running shoes 2026」についてのクエリではどちらもfalseだったため、productsはnullとして返りました — フラグ自体が商業的意図の信号です。 - Googleショッピングはカタログの基準であり、異なるエンドポイントを介して到達します。
scraper.google.searchアクターはtbm: "shop"を指定して/api/v1/scraper/requestに投稿しますが、LLMアクターが共有するv2実行エンドポイントとは異なり、ショッピングSERPの形状を返します:メタデータ、クエリの洗練、search_information。 - 無料で始められます。 新しいScrapelessアカウントには無料トライアルクレジットが含まれています — app.scrapeless.comでサインアップしてください。
はじめに:製品データは今や4つのサーフェスで生きています
「best running shoes 2026」と尋ねるシッパーは、もはや1つの結果ページにたどり着きません。同じクエリは、ChatGPTのショッピングカルーセル、GoogleのAIモード回答ページ、インラインAIオーバービューブロック、およびGoogleショッピングSERPに広がり、それぞれのサーフェスが異なる形のデータで応答します。1つは商人ごとの価格のオファーを返し、1つは引用元付きの合成回答を返し、1つは商業的意図のフラグを返し、1つはカタログインデックスを返します。「AIショッピングデータ」を単一のフィードとして扱うことは、各事実が実際にどこに存在しているかを見落としてしまいます。
この記事は、ソースマップであり、収集者のチュートリアルではありません。4つのサーフェスを横に並べて比較します:各サーフェスを読むアクター、何がそれを引き起こすのか、それが生み出すデータの単位、そしてそれが構築されている監視の仕事。全てのサーフェスはUniversal Scraping APIのアクターであるため、使用すべきベンダーではなく、実際に尋ねている質問に答えるサーフェスを選ぶことが重要です。特にインラインブロックサーフェスについては、Google AIオーバービューをスクレイピングするがscraper.overviewアクターを単独で扱っています。
4つのサーフェスを一目で見る
各サーフェスは購入の旅の異なるポイントであり、それを読むアクターはそれに応じて異なるペイロードを返します:
- ChatGPTショッピング — 購入意図のプロンプトに対してChatGPTが表示する製品カルーセルで、
scraper.chatgptがshopping: trueで読み取ります。 - Google AIモード — Googleのフルページの対話型回答エンジンで、
scraper.aimodeで読み取ります。 - Google AIオーバービュー — 有機的結果の上にあるインラインAIブロックで、
scraper.overviewで読み取ります。 - Googleショッピング — 専用のショッピングSERPで、
scraper.google.searchがtbm: "shop"で読み取ります。
ソーシングマトリックス:4つのサーフェスを並べて比較
以下のマトリックスが中心部分です — 列を下に読んで1つのサーフェスが生成するものを確認し、行を横に読んでなぜ単一のアクターがすべてのショッピング質問をカバーできないのかを確認します。
| サーフェス | アクター | 何がそれを引き起こすか | データの単位 | 地域別 | 出力形式 | 最適な監視の仕事 |
|---|---|---|---|---|---|---|
| ChatGPTショッピング | scraper.chatgpt (shopping: true) |
カルーセルを表示する購入意図のプロンプト | 商人ごとのオファー | country |
products[] → offers[]{merchant_name, price, available, details} |
商人間の価格比較 |
| Google AIモード | scraper.aimode |
調査や比較のプロンプト | 合成された回答、引用元、製品詳細 | country |
result_text / result_md / result_html, citations[], products[] |
引用の共有と製品詳細 |
| Google AIオーバービュー | scraper.overview |
インラインブロックを表示するクエリ; 商業意図が出た時のみ製品データ | 引用元付きの回答; 商業意図がある時のみproducts |
country |
content, source[], web_source[], is_shopping / is_overview_shopping, products (nullable) |
商業的意図のフラグと引用元 |
| Googleショッピング | scraper.google.search(tbm: "shop") | ショッピング垂直検索クエリ | ショッピングSERPインデックス | gl + hl | メタデータ、検索情報、この検索を絞り込む[]、ページネーション | カタログのベースライン |
ある輸送の詳細がクライアントデザインを前もって決定します:3つのLLMアクター(scraper.chatgpt、scraper.aimode、scraper.overview)はすべて/api/v2/scraper/executeにPOSTし、{ status, task_id, task_result }のエンベロープを返しますが、scraper.google.searchは/api/v1/scraper/requestにinput: { q, tbm: "shop", hl, gl }でPOSTします。3つのサーフェスは1つのクライアントを共有し、4つ目は独自のリクエスト形状を必要とします。
ChatGPTショッピング:クロスマーチャント価格サーフェス
ChatGPTショッピングは、4つのサーフェスの中で実際の価格をマーチャントごとに返す唯一のものです。input内でshopping: trueを指定すると、scraper.chatgptは各製品が見出しprice、rating、num_reviewsカウント、およびoffers[]リストを持つproducts[]配列を返します — 各マーチャントごとに1つのエントリがあり、それぞれ独自のmerchant_name、price、availableフラグ、および在庫と配達のためのdetails文字列があります。単一のヘッドフォンの結果は、Sony、Best Buy、Walmart、Targetの価格が同じモデルで1回のレスポンスで返されました。「このアイテムは今、店舗ごとにいくらですか」という質問に対して、このサーフェスが回答します。カルーセルはセッションごとにレンダリングされるため、1回の呼び出しでデータが入ったproducts配列と次の呼び出しで空のものが両方とも正常です — 配列をnullableとして扱い、スケジュールされた実行を集約してください。
Google AIモード:回答プラス製品詳細サーフェス
Google AIモードは、4つの中で最も層の多いペイロードを返します。単一のscraper.aimodeリクエストは、3つのフォーマット(result_text、result_md、result_html)で合成された回答、7つのソースのcitations[]配列、および7つのエントリのproducts[]配列を返しました — そして各製品オブジェクトは、単一の価格ではなく、brand、price_range、rating、stores、reviews、variantsという豊かな情報を持っています。AIモードは、Googleが研究や比較の質問をルーティングする場所であるため、引用共有サーフェス(回答が利用されたドメイン)および製品調査サーフェス(各推奨の詳細)としても機能します。トレードオフは、ChatGPTショッピングと同じようにクリーンなマーチャントごとのオファーを返さないことです;価格の詳細は範囲であり、店舗ごとに行の形式ではありません。
Google AIオーバービュー:商業意図フラグサーフェス
Google AIオーバービューは、クエリが商業的であるかどうかを教えてくれるサーフェスです。scraper.overviewアクターは、インラインブロックの回答をcontentとrawtextで返し、source[]およびweb_source[]に分かれた属性ソース(各エントリがwebsite_name、title、url、snippetを持つ)を返し、2つのブール値 — is_shoppingおよびis_overview_shoppingを持ちます。「2026年のベストランニングシューズ」の場合、両方のフラグはfalseとして返され、productsはnullでした。これは設計において正直な振る舞いです:AIオーバービューブロックは、そのショッピング意図が発火する時にのみ製品配列をポピュレートしますので、フラグはシグナルであり、バグではありません。それらを読んで、Googleがどのトラッキングされたクエリを取引と見なすのかを分類し、同じ引用共有メトリックのためにsource[]およびweb_source[]を読んでください。
json
// スキーマはscraper.overviewが返す内容です;フィールド値はライブ実行からの示例サンプルです。
{
"status": "success",
"task_id": "…",
"task_result": {
"is_shopping": false,
"is_overview_shopping": false,
"content": "2026年のベストランニングシューズは、最大クッションのスーパートレーナーに重きを置いています …",
"source": [
{ "website_name": "YouTube", "title": "2026年のベストランニングシューズ(ここまで) …", "url": "https://…", "snippet": "…", "stores": null }
],
"web_source": [
{ "website_name": "The Run Testers", "title": "2026年のベストランニングシューズ", "url": "https://…", "snippet": "…" }
],
"products": null,
"ads": null
}
}
トラッキングされたクエリがis_shoppingをtrueに切り替えると、同じレスポンスはポピュレートされたproducts配列を持ち始めます — このフラグは、パイプラインがこのサーフェスから製品データを読み始めるときのトリガーでもあります。
無料プランのAPIキーを取得します:app.scrapeless.com
Googleショッピング:カタログのベースライン
Google ショッピングは、他の三つのサーフェスが要約したカタログインデックスです。scraper.google.search アクターと tbm: "shop" が専用のショッピング垂直を読み取り、SERP 形状を返します — metadata(エンジンと生の URL)、search_information ブロック(query_displayed、organic_results_state、total_results)、Google がその用語のために提案するファセットクエリの refine_this_search[] 配列、および pagination です。これは、あるモデルの意見ではなく、ショッピングの景観をマッピングする Deep SerpApi の一部です。行の深さはクエリによって異なります:「best running shoes 2026」は、total_results が 0 で、代わりに値がリファインメントファセットにある薄い結果セットを返しましたので、このサーフェスは Google が用語のためにインデックスしているものの構造的基準として扱い、各クエリごとの行数を確認するようにしてください。
4 つのローカライズ方法と nullable のままのもの
すべてのサーフェスはローカライズしますが、同じフィールドを介してではありません。三つの LLM アクターは input 内に二文字の country を必要とします;scraper.google.search は gl(国)と hl(言語)を取ります。呼び出しごとに地域を固定し、同じものを比較します — US キャプチャと JP キャプチャは、すべての四つのサーフェスで異なるデータセットです。
すべてのサーフェスのすべてのフィールドは nullable であり、セッションごとに異なります。ChatGPT の products[] は shopping: true の場合でも空であることがあります;AI モードの citations[] および products[] は、実行ごとにカウントが変動します;AI 概要の products は is_shopping が false のときは null です;Google ショッピングの行数はクエリによって変動します。持続的に空の配列は、そのクエリと地域に対する回答がなかったことを意味します — それを記録して次に進む方が、失敗として読むよりも良いです。すべての呼び出しで task_id とキャプチャタイムスタンプを保存し、単一のレスポンスではなく時系列が信号となるようにします。
決定ガイド:どのサーフェスがどの仕事に
質問に対してサーフェスを固定します:
| 仕事が…の場合 | キャプチャ | 読み取り |
|---|---|---|
| マーチャント間の価格追跡 | ChatGPT ショッピング(scraper.chatgpt、shopping: true) |
products[] → offers[] |
| AI 回答における引用のシェア | Google AI モード + Google AI 概要 | citations[] / source[] + web_source[] |
| クエリが商業的であるかどうか | Google AI 概要(scraper.overview) |
is_shopping / is_overview_shopping |
| 用語のカタログ / SERP ベースライン | Google ショッピング(scraper.google.search、tbm: "shop") |
search_information、refine_this_search[] |
四つの 同じ v2 エンドポイントを使用する うちの三つは、ChatGPT ショッピング、AI モード、AI 概要を一つのクエリと国で捕捉するのは、異なるアクターの文字列を持つ同じクライアントです。Google ショッピングは、同じクエリと地域に対する v1 エンドポイントに対するセカンドリクエスト形状として、この画像に追加されますので、カタログベースラインはその上の AI サーフェスと整合します。
結論:フィードではなくサーフェスを選ぶ
AI ショッピングデータは四つのサーフェスがあり、それぞれが異なる質問に答えます:マーチャント間の価格については ChatGPT ショッピング、引用の詳細と製品の詳細については Google AI モード、商業意図のフラグとそのソースについては Google AI 概要、カタログベースラインについては Google ショッピングです。仕事をサーフェスにマッピングし、呼び出しごとに地域を固定し、すべてのフィールドを nullable と見なし、task_id とタイムスタンプを保存して時系列が信号となるようにします。スケジュールされた固定クエリセットを Universal Scraping API クレジットで実行すると、四つのサーフェスが製品データが存在する場所の調整されたビューになります。ここでのアクター名とレスポンスフィールドは、LLM Chat Scraper のライブ実行に対して確認されています。
AIショッピングデータパイプラインの構築準備はできましたか?
私たちのコミュニティに参加して、自由なプランを取得してAI回答データパイプラインを構築している開発者とつながりましょう:Discord · Telegram。
app.scrapeless.com にサインアップして無料のトライアルクレジットを取得し、上の四つのサーフェスに向けて一つのクライアントを指し、あなたのプログラムが追跡する製品データが実際にどこに存在するのかをマッピングしてください。
FAQ
Q: 四つのサーフェスの中で、実際のマーチャントごとの価格を返すのはどれですか?
チャットGPTショッピングのみ。shopping: trueのscraper.chatgptアクターは、商人ごとに1つの価格エントリを持つoffers[]リストを持ったproducts[]配列を返します。AIモードは各製品のprice_rangeを返し、AIオーバービューはショッピングの意図が発動する場合にのみ価格を返し、Googleショッピングは解決済みオファー行ではなくSERPインデックスを返します。
Q: すべての4つのインターフェースは同じエンドポイントを使用していますか?
いいえ。3つのLLMアクター(scraper.chatgpt、scraper.aimode、scraper.overview)は/api/v2/scraper/executeにPOSTし、{ status, task_id, task_result }エンベロープを共有します。scraper.google.searchは、input: { q, tbm: "shop", hl, gl }を使用して/api/v1/scraper/requestにPOSTするため、自分自身のリクエスト形状が必要です。
Q: なぜAIオーバービューのproductsフィールドがnullだったのですか?
Google AIオーバービューは、is_shopping(またはis_overview_shopping)がtrueのときにのみproductsを埋めます。「2026年のベストランニングシューズ」では、両方のフラグがfalseだったため、productsはnullとして返されました。これらのフラグは商業意図のシグナルです;これらを読んで、そのインターフェースに製品データが表示されるタイミングを知ってください。
Q: どのインターフェースが引用源を提供して、引用追跡ができますか?
そのうちの2つです。Google AIモードはcitations[]配列を返し、Google AIオーバービューはsource[]とweb_source[]を返します。各エントリはwebsite_name、title、urlによってソースを名前付けしています。各URLからホストを解析し、キャプチャ全体で集計して引用シェアテーブルを構築します。
Q: 1つのクライアントがすべての4つのインターフェースを読み取ることはできますか?
3つのインターフェース、はい — ChatGPTショッピング、AIモード、AIオーバービューはv2エンドポイント、ヘッダー、エンベロープを共有しているため、アクター名を入れ替えるのは1行の変更です。Googleショッピングは、gl/hlローカリゼーションを使用してv1エンドポイントに対して別のリクエストが必要なため、完全なパイプラインは共有されたv2クライアントに加えて1つの専用scraper.google.search呼び出しを実行します。
Scrapelessでは、適用される法律、規制、およびWebサイトのプライバシーポリシーを厳密に遵守しながら、公開されているデータのみにアクセスします。 このブログのコンテンツは、デモンストレーションのみを目的としており、違法または侵害の活動は含まれません。 このブログまたはサードパーティのリンクからの情報の使用に対するすべての責任を保証せず、放棄します。 スクレイピング活動に従事する前に、法律顧問に相談し、ターゲットウェブサイトの利用規約を確認するか、必要な許可を取得してください。



