Fontes de Dados de Compras de IA Comparadas: Onde os Dados dos Produtos Estão Localizados
Scraping and Proxy Management Expert
TL;DR:
- Os dados de compras de IA vêm de quatro superfícies distintas, não de um único feed. ChatGPT Shopping, Google AI Mode, Google AI Overview e Google Shopping retornam cada um uma unidade diferente de dados para a mesma consulta, então a superfície que você escolhe decide o que pode monitorar.
- ChatGPT Shopping é a única superfície que retorna uma lista de ofertas por comerciante. O ator
scraper.chatgptcomshopping: trueretorna produtos com um arrayoffers[]— o mesmo modelo precificado em Sony, Best Buy, Walmart e Target em uma única resposta. - Google AI Mode retorna uma resposta sintetizada, fontes citadas e detalhes ricos do produto em uma chamada. Um único pedido
scraper.aimoderetornou 7citationse 7products, cada produto carregando marca, faixa de preço, classificação, lojas e avaliações. - Google AI Overview só preenche
productsquando sua intenção de compra é acionada. O atorscraper.overviewretorna as flagsis_shoppingeis_overview_shopping; ambas eramfalsepara "melhores tênis de corrida 2026", entãoproductsretornou nulo — as flags em si são o sinal de intenção comercial. - Google Shopping é a base do catálogo, acessada por um endpoint diferente. O ator
scraper.google.searchcomtbm: "shop"posta para/api/v1/scraper/request, não para o endpoint de execução v2 que os atores LLM compartilham, e retorna uma forma de SERP de compras: metadados, refinamentos de consulta esearch_information. - Grátis para começar. Novas contas Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.
Introdução: os dados de produtos agora existem em quatro superfícies
Um comprador que pergunta "melhores tênis de corrida 2026" não chega mais a uma única página de resultados. A mesma consulta se espalha pelo carrossel de compras do ChatGPT, pela página de respostas do Google AI Mode, pelo bloco de visão geral de IA inline, e pela SERP de compras do Google — e cada superfície responde com uma forma diferente de dados. Uma retorna ofertas precificadas por comerciante; uma retorna uma resposta sintetizada com fontes citadas; uma retorna uma flag de intenção comercial; uma retorna um índice de catálogo. Tratar "dados de compras de IA" como um único feed ignora onde cada fato realmente reside.
Este post é o mapa de fontes, não um tutorial de coleta. Compara as quatro superfícies lado a lado: qual ator lê cada uma, o que a aciona, a unidade de dados que produz e o trabalho de monitoramento para o qual foi construído. Todos os quatro são atores do Universal Scraping API, então a decisão não é qual fornecedor usar — é qual superfície responde à pergunta que você realmente está fazendo. Para a superfície do bloco inline especificamente, coletar Visões Gerais do Google AI cobre o ator scraper.overview por conta própria.
As quatro superfícies em um relance
Cada superfície é um ponto diferente na jornada de compra, e o ator que a lê retorna uma carga correspondente diferente:
- ChatGPT Shopping — o carrossel de produtos que o ChatGPT mostra para um prompt de intenção de compra, lido por
scraper.chatgptcomshopping: true. - Google AI Mode — o motor de resposta conversacional de página inteira do Google, lido por
scraper.aimode. - Google AI Overview — o bloco de IA inline acima dos resultados orgânicos, lido por
scraper.overview. - Google Shopping — a SERP de compras dedicada, lida por
scraper.google.searchcomtbm: "shop".
A matriz de fontes: quatro superfícies lado a lado
A matriz abaixo é o centro das atenções — leia uma coluna para ver o que uma superfície produz, leia uma linha para ver por que nenhum único ator cobre todas as perguntas de compra.
| Superfície | Ator | O que a aciona | Unidade de dados | Localiza por | Forma de saída | Melhor trabalho de monitoramento |
|---|---|---|---|---|---|---|
| ChatGPT Shopping | scraper.chatgpt (shopping: true) |
um prompt de intenção de compra que gera o carrossel naquela sessão | uma oferta por comerciante | país |
products[] → offers[]{merchant_name, price, available, details} |
preço cruzado por comerciante |
| Google AI Mode | scraper.aimode |
um prompt de pesquisa ou comparação | uma resposta sintetizada, fontes citadas e detalhes do produto | país |
result_text / result_md / result_html, citations[], products[] |
compartilhamento de citações mais detalhes do produto |
| Google AI Overview | scraper.overview |
uma consulta que exibe o bloco inline; dados do produto somente quando a intenção de compra é acionada | uma resposta com fontes atribuídas; products somente com intenção comercial |
país |
content, source[], web_source[], is_shopping / is_overview_shopping, products (nullable) |
flag de intenção comercial mais fonte da citação |
| Google Shopping | scraper.google.search (tbm: "shop") |
uma consulta de pesquisa em vertical de compras | um índice de SERP de compras | gl + hl |
metadados, informações_de_busca, refine_this_search[], paginação |
base do catálogo |
Um detalhe de transporte decide o design do cliente com antecedência: os três atores LLM (scraper.chatgpt, scraper.aimode, scraper.overview) todos fazem POST para /api/v2/scraper/execute e retornam o envelope { status, task_id, task_result }, enquanto scraper.google.search posta para /api/v1/scraper/request com input: { q, tbm: "shop", hl, gl }. Três superfícies compartilham um cliente; a quarta precisa de sua própria forma de solicitação.
ChatGPT Shopping: a superfície de preços entre comerciantes
ChatGPT Shopping é a única das quatro superfícies que retorna um preço real por comerciante. Com shopping: true dentro de input, scraper.chatgpt retorna um array products[] onde cada produto tem um preço em destaque, uma avaliação, uma contagem num_reviews, e uma lista offers[] — uma entrada por comerciante, cada uma com seu próprio nome_do_comerciante, preço, flag disponível, e uma string detalhes para estoque e entrega. Um único resultado de fone de ouvido retornou o mesmo modelo com preço na Sony, Best Buy, Walmart e Target em uma única resposta. Quando a pergunta é "quanto custa este item nas lojas agora", esta é a superfície que responde. O carrossel é renderizado por sessão, então um array products populado em uma chamada e um vazio na próxima são ambos normais — trate o array como anulável e agregue execuções programadas.
Google AI Mode: a superfície de resposta e detalhes do produto
Google AI Mode retorna o payload mais camadas das quatro. Uma única solicitação de scraper.aimode retornou a resposta sintetizada em três formatos (result_text, result_md, result_html), um array citations[] de 7 fontes, e um array products[] de 7 entradas — e cada objeto de produto é rico, contendo marca, faixa_de_preço, avaliação, lojas, avaliações, e variantes em vez de um único preço. AI Mode é onde o Google encaminha perguntas de pesquisa e comparação, portanto também atua como uma superfície de compartilhamento de citações (quais domínios a resposta utilizou) e uma superfície de pesquisa de produtos (os detalhes por trás de cada recomendação). A troca é que não retorna uma oferta limpa por comerciante da maneira que ChatGPT Shopping faz; o detalhe de preço é uma faixa, não uma linha por loja.
Google AI Overview: a superfície de sinalização de intenção comercial
Google AI Overview é a superfície que informa se uma consulta é comercial ou não. O ator scraper.overview retorna a resposta em bloco inline como conteúdo e rawtext, as fontes atribuídas divididas entre source[] e web_source[] (cada entrada transportando website_name, título, url, e snippets), e dois booleans — is_shopping e is_overview_shopping. Para "melhores tênis de corrida 2026", ambas as flags retornaram falso, e products foi nulo. Esse é o comportamento honesto ao qual projetar: o bloco AI Overview só popula um array de produtos quando sua intenção de compra é ativada, portanto as flags são o sinal, e não um bug. Leia-os para classificar quais de suas consultas monitoradas o Google trata como transacionais, e leia source[] mais web_source[] para a mesma métrica de compartilhamento de citações que o AI Mode suporta.
json
// O esquema é o que scraper.overview retorna; os valores dos campos são uma amostra ilustrativa de uma execução ao vivo.
{
"status": "success",
"task_id": "…",
"task_result": {
"is_shopping": false,
"is_overview_shopping": false,
"content": "Os melhores tênis de corrida de 2026 apresentam um foco intenso em super tênis de alta amortização …",
"source": [
{ "website_name": "YouTube", "title": "Melhores Tênis de Corrida de 2026 (Até agora) …", "url": "https://…", "snippet": "…", "stores": null }
],
"web_source": [
{ "website_name": "The Run Testers", "title": "Os Melhores Tênis de Corrida 2026", "url": "https://…", "snippet": "…" }
],
"products": null,
"ads": null
}
}
Quando uma consulta monitorada altera is_shopping para true, a mesma resposta começa a transportar um array products populado — então a flag também é o gatilho que informa a um pipeline quando começar a ler dados de produtos dessa superfície.
Obtenha sua chave de API no plano gratuito: app.scrapeless.com
Google Shopping: a base do catálogo
Google Shopping é o índice de catálogo do qual as outras três superfícies resumem. O ator scraper.google.search com tbm: "shop" lê a vertical de compras dedicada e retorna uma forma de SERP — metadata (motor e URL bruto), um bloco search_information (query_displayed, organic_results_state, total_results), um array refine_this_search[] de consultas de facetas que o Google sugere para o termo, e pagination. É a parte do Deep SerpApi que mapeia a paisagem de compras em vez da opinião de qualquer modelo sobre isso. A profundidade da linha varia conforme a consulta: "melhores tênis de corrida 2026" retornou um conjunto de resultados reduzido com total_results em 0 e o valor sentado nas facetas de refinamento, então trate esta superfície como a linha de base estrutural do que o Google indexa para um termo e confirme as contagens de linha por consulta ao invés de assumir uma grade completa.
Como as quatro se localizam e o que permanece nulo
Cada superfície se localiza, mas não através do mesmo campo. Os três atores LLM recebem um country de duas letras dentro de input; scraper.google.search recebe gl (país) mais hl (idioma). Defina a região por chamada e compare como semelhante — uma captura dos EUA e uma captura do Japão são conjuntos de dados diferentes em todas as quatro superfícies.
Cada campo em cada superfície é anulável e por sessão. O products[] do ChatGPT pode estar vazio mesmo com shopping: true; as contagens de citations[] e products[] do Modo AI oscilam de execução para execução; o products do AI Overview é nulo sempre que is_shopping é false; a contagem de linhas do Google Shopping varia com a consulta. Um array persistentemente vazio significa que não houve resposta para essa consulta e região — registre isso e siga em frente, em vez de interpretá-lo como uma falha. Armazene task_id e um timestamp de captura em cada chamada para que a série temporal, e não qualquer única resposta, seja o sinal.
Guia de decisão: qual superfície para qual trabalho
Defina a superfície para a questão:
| Se o trabalho for… | Captura | Leitura |
|---|---|---|
| Rastreamento de preços entre comerciantes | ChatGPT Shopping (scraper.chatgpt, shopping: true) |
products[] → offers[] |
| Participação de citações entre respostas de IA | Modo AI do Google + Visão Geral de IA do Google | citations[] / source[] + web_source[] |
| Se uma consulta é comercial | Visão Geral de IA do Google (scraper.overview) |
is_shopping / is_overview_shopping |
| Linha de base de catálogo / SERP para um termo | Google Shopping (scraper.google.search, tbm: "shop") |
search_information, refine_this_search[] |
Como três das quatro utilizam o mesmo endpoint v2 e envelope, capturar ChatGPT Shopping, Modo AI e Visão Geral de IA para uma consulta e região é o mesmo cliente com uma string de ator diferente. O Google Shopping se junta à imagem como uma segunda forma de solicitação contra o endpoint v1, chaves com a mesma consulta e região, então a linha de base do catálogo se alinha com as superfícies de IA acima.
Conclusão: escolha a superfície, não o feed
Os dados de compras de IA são quatro superfícies, e cada uma responde a uma pergunta diferente: ChatGPT Shopping para preço entre comerciantes, Modo AI do Google para citações mais detalhes de produtos, Visão Geral de IA do Google para o sinal de intenção comercial e suas fontes, e Google Shopping para a linha de base do catálogo. Mapeie o trabalho para a superfície, fixe a região por chamada, trate cada campo como anulável e armazene task_id mais um timestamp para que a série seja o sinal. Execute um conjunto fixo de consultas em um cronograma com créditos da Universal Scraping API e as quatro superfícies se tornam uma visão coordenada de onde os dados do produto que seu programa rastreia realmente residem. Os nomes dos atores e os campos de resposta aqui foram confirmados em execuções ao vivo no LLM Chat Scraper.
Pronto para Construir Seu Pipeline de Dados de Compras de IA?
Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores que estão construindo pipelines de dados de resposta de IA: Discord · Telegram.
Inscreva-se em app.scrapeless.com para créditos de teste gratuitos e aponte um cliente para as quatro superfícies acima para mapear onde os dados do produto que seu programa rastreia realmente residem.
FAQ
P: Qual das quatro superfícies retorna um preço real por comerciante?
Apenas ChatGPT Compras. O ator scraper.chatgpt com shopping: true retorna um array products[] cuja lista offers[] contém uma entrada com preço por comerciante. O Modo AI retorna uma price_range por produto, a Visão Geral AI retorna preços apenas quando sua intenção de compra é acionada, e o Google Shopping retorna um índice SERP em vez de uma linha de oferta resolvida.
Q: Todos os quatro superfícies usam o mesmo endpoint?
Não. Os três atores LLM — scraper.chatgpt, scraper.aimode e scraper.overview — enviam POST para /api/v2/scraper/execute e compartilham o envelope { status, task_id, task_result }. O scraper.google.search envia pedidos para /api/v1/scraper/request com input: { q, tbm: "shop", hl, gl }, portanto, precisa de sua própria estrutura de solicitação.
Q: Por que o campo products da Visão Geral AI estava nulo?
A Visão Geral AI do Google só preenche products quando is_shopping (ou is_overview_shopping) é true. Para "melhores tênis de corrida 2026", ambas as flags estavam false, então products voltou nulo. As flags são o sinal de intenção comercial; leia-as para saber quando os dados do produto aparecerão nessa superfície.
Q: Quais superfícies me dão fontes de citação para rastreamento de participação de citação?
Duas delas. O Modo AI do Google retorna um array citations[], e a Visão Geral AI do Google retorna source[] mais web_source[], cada entrada nomeando a fonte por website_name, title e url. Analise o host de cada URL e contabilize os capturas para construir uma tabela de participação de citação.
Q: Um cliente pode ler todas as quatro superfícies?
Três delas, sim — ChatGPT Compras, Modo AI e Visão Geral AI compartilham o endpoint v2, cabeçalho e envelope, então trocar o nome do ator é uma mudança de uma linha. O Google Shopping precisa de uma solicitação separada contra o endpoint v1 com localização gl/hl, então um pipeline completo executa o cliente v2 compartilhado além de uma chamada dedicada scraper.google.search.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.



