Fontes de Dados de Compras de IA Comparadas: Onde os Dados dos Produtos Estão Localizados

James Thompson

Scraping and Proxy Management Expert

29-Jun-2026

TL;DR:

Os dados de compras de IA vêm de quatro superfícies distintas, não de um único feed. ChatGPT Shopping, Google AI Mode, Google AI Overview e Google Shopping retornam cada um uma unidade diferente de dados para a mesma consulta, então a superfície que você escolhe decide o que pode monitorar.
ChatGPT Shopping é a única superfície que retorna uma lista de ofertas por comerciante. O ator scraper.chatgpt com shopping: true retorna produtos com um array offers[] — o mesmo modelo precificado em Sony, Best Buy, Walmart e Target em uma única resposta.
Google AI Mode retorna uma resposta sintetizada, fontes citadas e detalhes ricos do produto em uma chamada. Um único pedido scraper.aimode retornou 7 citations e 7 products, cada produto carregando marca, faixa de preço, classificação, lojas e avaliações.
Google AI Overview só preenche products quando sua intenção de compra é acionada. O ator scraper.overview retorna as flags is_shopping e is_overview_shopping; ambas eram false para "melhores tênis de corrida 2026", então products retornou nulo — as flags em si são o sinal de intenção comercial.
Google Shopping é a base do catálogo, acessada por um endpoint diferente. O ator scraper.google.search com tbm: "shop" posta para /api/v1/scraper/request, não para o endpoint de execução v2 que os atores LLM compartilham, e retorna uma forma de SERP de compras: metadados, refinamentos de consulta e search_information.
Grátis para começar. Novas contas Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.

Introdução: os dados de produtos agora existem em quatro superfícies

Um comprador que pergunta "melhores tênis de corrida 2026" não chega mais a uma única página de resultados. A mesma consulta se espalha pelo carrossel de compras do ChatGPT, pela página de respostas do Google AI Mode, pelo bloco de visão geral de IA inline, e pela SERP de compras do Google — e cada superfície responde com uma forma diferente de dados. Uma retorna ofertas precificadas por comerciante; uma retorna uma resposta sintetizada com fontes citadas; uma retorna uma flag de intenção comercial; uma retorna um índice de catálogo. Tratar "dados de compras de IA" como um único feed ignora onde cada fato realmente reside.

Este post é o mapa de fontes, não um tutorial de coleta. Compara as quatro superfícies lado a lado: qual ator lê cada uma, o que a aciona, a unidade de dados que produz e o trabalho de monitoramento para o qual foi construído. Todos os quatro são atores do Universal Scraping API, então a decisão não é qual fornecedor usar — é qual superfície responde à pergunta que você realmente está fazendo. Para a superfície do bloco inline especificamente, coletar Visões Gerais do Google AI cobre o ator scraper.overview por conta própria.

As quatro superfícies em um relance

Cada superfície é um ponto diferente na jornada de compra, e o ator que a lê retorna uma carga correspondente diferente:

ChatGPT Shopping — o carrossel de produtos que o ChatGPT mostra para um prompt de intenção de compra, lido por scraper.chatgpt com shopping: true.
Google AI Mode — o motor de resposta conversacional de página inteira do Google, lido por scraper.aimode.
Google AI Overview — o bloco de IA inline acima dos resultados orgânicos, lido por scraper.overview.
Google Shopping — a SERP de compras dedicada, lida por scraper.google.search com tbm: "shop".

A matriz de fontes: quatro superfícies lado a lado

A matriz abaixo é o centro das atenções — leia uma coluna para ver o que uma superfície produz, leia uma linha para ver por que nenhum único ator cobre todas as perguntas de compra.

Superfície	Ator	O que a aciona	Unidade de dados	Localiza por	Forma de saída	Melhor trabalho de monitoramento
ChatGPT Shopping	`scraper.chatgpt` (`shopping: true`)	um prompt de intenção de compra que gera o carrossel naquela sessão	uma oferta por comerciante	`país`	`products[]` → `offers[]{merchant_name, price, available, details}`	preço cruzado por comerciante
Google AI Mode	`scraper.aimode`	um prompt de pesquisa ou comparação	uma resposta sintetizada, fontes citadas e detalhes do produto	`país`	`result_text` / `result_md` / `result_html`, `citations[]`, `products[]`	compartilhamento de citações mais detalhes do produto
Google AI Overview	`scraper.overview`	uma consulta que exibe o bloco inline; dados do produto somente quando a intenção de compra é acionada	uma resposta com fontes atribuídas; `products` somente com intenção comercial	`país`	`content`, `source[]`, `web_source[]`, `is_shopping` / `is_overview_shopping`, `products` (nullable)	flag de intenção comercial mais fonte da citação
Google Shopping	`scraper.google.search` (`tbm: "shop"`)	uma consulta de pesquisa em vertical de compras	um índice de SERP de compras	`gl` + `hl`	`metadados`, `informações_de_busca`, `refine_this_search[]`, `paginação`	base do catálogo

Um detalhe de transporte decide o design do cliente com antecedência: os três atores LLM (scraper.chatgpt, scraper.aimode, scraper.overview) todos fazem POST para /api/v2/scraper/execute e retornam o envelope { status, task_id, task_result }, enquanto scraper.google.search posta para /api/v1/scraper/request com input: { q, tbm: "shop", hl, gl }. Três superfícies compartilham um cliente; a quarta precisa de sua própria forma de solicitação.

ChatGPT Shopping: a superfície de preços entre comerciantes

ChatGPT Shopping é a única das quatro superfícies que retorna um preço real por comerciante. Com shopping: true dentro de input, scraper.chatgpt retorna um array products[] onde cada produto tem um preço em destaque, uma avaliação, uma contagem num_reviews, e uma lista offers[] — uma entrada por comerciante, cada uma com seu próprio nome_do_comerciante, preço, flag disponível, e uma string detalhes para estoque e entrega. Um único resultado de fone de ouvido retornou o mesmo modelo com preço na Sony, Best Buy, Walmart e Target em uma única resposta. Quando a pergunta é "quanto custa este item nas lojas agora", esta é a superfície que responde. O carrossel é renderizado por sessão, então um array products populado em uma chamada e um vazio na próxima são ambos normais — trate o array como anulável e agregue execuções programadas.

Google AI Mode: a superfície de resposta e detalhes do produto

Google AI Mode retorna o payload mais camadas das quatro. Uma única solicitação de scraper.aimode retornou a resposta sintetizada em três formatos (result_text, result_md, result_html), um array citations[] de 7 fontes, e um array products[] de 7 entradas — e cada objeto de produto é rico, contendo marca, faixa_de_preço, avaliação, lojas, avaliações, e variantes em vez de um único preço. AI Mode é onde o Google encaminha perguntas de pesquisa e comparação, portanto também atua como uma superfície de compartilhamento de citações (quais domínios a resposta utilizou) e uma superfície de pesquisa de produtos (os detalhes por trás de cada recomendação). A troca é que não retorna uma oferta limpa por comerciante da maneira que ChatGPT Shopping faz; o detalhe de preço é uma faixa, não uma linha por loja.

Google AI Overview: a superfície de sinalização de intenção comercial

Google AI Overview é a superfície que informa se uma consulta é comercial ou não. O ator scraper.overview retorna a resposta em bloco inline como conteúdo e rawtext, as fontes atribuídas divididas entre source[] e web_source[] (cada entrada transportando website_name, título, url, e snippets), e dois booleans — is_shopping e is_overview_shopping. Para "melhores tênis de corrida 2026", ambas as flags retornaram falso, e products foi nulo. Esse é o comportamento honesto ao qual projetar: o bloco AI Overview só popula um array de produtos quando sua intenção de compra é ativada, portanto as flags são o sinal, e não um bug. Leia-os para classificar quais de suas consultas monitoradas o Google trata como transacionais, e leia source[] mais web_source[] para a mesma métrica de compartilhamento de citações que o AI Mode suporta.

json Copy

// O esquema é o que scraper.overview retorna; os valores dos campos são uma amostra ilustrativa de uma execução ao vivo.
{
  "status": "success",
  "task_id": "…",
  "task_result": {
    "is_shopping": false,
    "is_overview_shopping": false,
    "content": "Os melhores tênis de corrida de 2026 apresentam um foco intenso em super tênis de alta amortização …",
    "source": [
      { "website_name": "YouTube", "title": "Melhores Tênis de Corrida de 2026 (Até agora) …", "url": "https://…", "snippet": "…", "stores": null }
    ],
    "web_source": [
      { "website_name": "The Run Testers", "title": "Os Melhores Tênis de Corrida 2026", "url": "https://…", "snippet": "…" }
    ],
    "products": null,
    "ads": null
  }
}

Quando uma consulta monitorada altera is_shopping para true, a mesma resposta começa a transportar um array products populado — então a flag também é o gatilho que informa a um pipeline quando começar a ler dados de produtos dessa superfície.

Obtenha sua chave de API no plano gratuito: app.scrapeless.com

Google Shopping: a base do catálogo

Google Shopping é o índice de catálogo do qual as outras três superfícies resumem. O ator scraper.google.search com tbm: "shop" lê a vertical de compras dedicada e retorna uma forma de SERP — metadata (motor e URL bruto), um bloco search_information (query_displayed, organic_results_state, total_results), um array refine_this_search[] de consultas de facetas que o Google sugere para o termo, e pagination. É a parte do Deep SerpApi que mapeia a paisagem de compras em vez da opinião de qualquer modelo sobre isso. A profundidade da linha varia conforme a consulta: "melhores tênis de corrida 2026" retornou um conjunto de resultados reduzido com total_results em 0 e o valor sentado nas facetas de refinamento, então trate esta superfície como a linha de base estrutural do que o Google indexa para um termo e confirme as contagens de linha por consulta ao invés de assumir uma grade completa.

Como as quatro se localizam e o que permanece nulo

Cada superfície se localiza, mas não através do mesmo campo. Os três atores LLM recebem um country de duas letras dentro de input; scraper.google.search recebe gl (país) mais hl (idioma). Defina a região por chamada e compare como semelhante — uma captura dos EUA e uma captura do Japão são conjuntos de dados diferentes em todas as quatro superfícies.

Cada campo em cada superfície é anulável e por sessão. O products[] do ChatGPT pode estar vazio mesmo com shopping: true; as contagens de citations[] e products[] do Modo AI oscilam de execução para execução; o products do AI Overview é nulo sempre que is_shopping é false; a contagem de linhas do Google Shopping varia com a consulta. Um array persistentemente vazio significa que não houve resposta para essa consulta e região — registre isso e siga em frente, em vez de interpretá-lo como uma falha. Armazene task_id e um timestamp de captura em cada chamada para que a série temporal, e não qualquer única resposta, seja o sinal.

Guia de decisão: qual superfície para qual trabalho

Defina a superfície para a questão:

Se o trabalho for…	Captura	Leitura
Rastreamento de preços entre comerciantes	ChatGPT Shopping (`scraper.chatgpt`, `shopping: true`)	`products[]` → `offers[]`
Participação de citações entre respostas de IA	Modo AI do Google + Visão Geral de IA do Google	`citations[]` / `source[]` + `web_source[]`
Se uma consulta é comercial	Visão Geral de IA do Google (`scraper.overview`)	`is_shopping` / `is_overview_shopping`
Linha de base de catálogo / SERP para um termo	Google Shopping (`scraper.google.search`, `tbm: "shop"`)	`search_information`, `refine_this_search[]`

Como três das quatro utilizam o mesmo endpoint v2 e envelope, capturar ChatGPT Shopping, Modo AI e Visão Geral de IA para uma consulta e região é o mesmo cliente com uma string de ator diferente. O Google Shopping se junta à imagem como uma segunda forma de solicitação contra o endpoint v1, chaves com a mesma consulta e região, então a linha de base do catálogo se alinha com as superfícies de IA acima.

Conclusão: escolha a superfície, não o feed

Os dados de compras de IA são quatro superfícies, e cada uma responde a uma pergunta diferente: ChatGPT Shopping para preço entre comerciantes, Modo AI do Google para citações mais detalhes de produtos, Visão Geral de IA do Google para o sinal de intenção comercial e suas fontes, e Google Shopping para a linha de base do catálogo. Mapeie o trabalho para a superfície, fixe a região por chamada, trate cada campo como anulável e armazene task_id mais um timestamp para que a série seja o sinal. Execute um conjunto fixo de consultas em um cronograma com créditos da Universal Scraping API e as quatro superfícies se tornam uma visão coordenada de onde os dados do produto que seu programa rastreia realmente residem. Os nomes dos atores e os campos de resposta aqui foram confirmados em execuções ao vivo no LLM Chat Scraper.

Pronto para Construir Seu Pipeline de Dados de Compras de IA?

Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores que estão construindo pipelines de dados de resposta de IA: Discord · Telegram.

Inscreva-se em app.scrapeless.com para créditos de teste gratuitos e aponte um cliente para as quatro superfícies acima para mapear onde os dados do produto que seu programa rastreia realmente residem.

FAQ

P: Qual das quatro superfícies retorna um preço real por comerciante?
Apenas ChatGPT Compras. O ator scraper.chatgpt com shopping: true retorna um array products[] cuja lista offers[] contém uma entrada com preço por comerciante. O Modo AI retorna uma price_range por produto, a Visão Geral AI retorna preços apenas quando sua intenção de compra é acionada, e o Google Shopping retorna um índice SERP em vez de uma linha de oferta resolvida.

Q: Todos os quatro superfícies usam o mesmo endpoint?
Não. Os três atores LLM — scraper.chatgpt, scraper.aimode e scraper.overview — enviam POST para /api/v2/scraper/execute e compartilham o envelope { status, task_id, task_result }. O scraper.google.search envia pedidos para /api/v1/scraper/request com input: { q, tbm: "shop", hl, gl }, portanto, precisa de sua própria estrutura de solicitação.

Q: Por que o campo products da Visão Geral AI estava nulo?
A Visão Geral AI do Google só preenche products quando is_shopping (ou is_overview_shopping) é true. Para "melhores tênis de corrida 2026", ambas as flags estavam false, então products voltou nulo. As flags são o sinal de intenção comercial; leia-as para saber quando os dados do produto aparecerão nessa superfície.

Q: Quais superfícies me dão fontes de citação para rastreamento de participação de citação?
Duas delas. O Modo AI do Google retorna um array citations[], e a Visão Geral AI do Google retorna source[] mais web_source[], cada entrada nomeando a fonte por website_name, title e url. Analise o host de cada URL e contabilize os capturas para construir uma tabela de participação de citação.

Q: Um cliente pode ler todas as quatro superfícies?
Três delas, sim — ChatGPT Compras, Modo AI e Visão Geral AI compartilham o endpoint v2, cabeçalho e envelope, então trocar o nome do ator é uma mudança de uma linha. O Google Shopping precisa de uma solicitação separada contra o endpoint v1 com localização gl/hl, então um pipeline completo executa o cliente v2 compartilhado além de uma chamada dedicada scraper.google.search.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Aprenda a integrar o Crawl4AI com o Scrapeless Cloud Browser para uma raspagem web eficiente e em grande escala. Desbloqueie proxies automáticos, impressões digitais personalizadas, reutilização de sessões e depuração em tempo real.

Sophia Martinez

20-Oct-2025

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Servidor MCP sem resíduos está oficialmente no ar! Construa seu Conector AI-Web definitivo.

Descubra como o Servidor Scrapeless MCP fornece aos LLMs capacidades de navegação e raspagem na web em tempo real. Aprenda a construir agentes de IA que pesquisam, extraem e interagem com conteúdo web dinâmico de forma integrada.

Michael Lee

17-Jul-2025

Guia de Ferramentas USPS Sem Scrap: Extração Eficiente e Conformidade de Dados de Remessa para Sistemas B2B

Aprenda a usar a ferramenta Scrapeless USPS para buscar dados de rastreamento estruturados e em tempo real de forma eficiente e em conformidade para plataformas ERP, OMS e SaaS.

Emily Chen

02-Jul-2025

Guia de Ferramentas USPS Sem Resíduos: Extração de Dados de Envio Eficiente e em Conformidade para Sistemas B2B

Catálogo