Raspagem de detalhes de produtos do Google Shopping com Scrapeless

Advanced Data Extraction Specialist
No ambiente empresarial global altamente competitivo de hoje, a tecnologia de web scraping tornou-se a força motriz principal para empresas de e-commerce e varejistas manterem sua competitividade de mercado. Ao coletar dados públicos precisos de milhares de fontes de dados-alvo em todo o mundo por meio de redes de agentes inteligentes, as empresas podem construir modelos de precificação dinâmica, otimizar a gestão de estoque, obter insights sobre as tendências de comportamento do consumidor e, por fim, fornecer aos usuários finais o sistema de preços de produtos mais competitivo.
Este guia demonstrará sistematicamente como obter legalmente dados públicos de produtos na plataforma Google Shopping por meio de ferramentas profissionais. Se você é uma equipe técnica que busca construir seu próprio pipeline de dados ou um tomador de decisões de negócios que busca suporte de inteligência de mercado, este artigo fornecerá um framework de ação com valor prático e estratégico.
O que é o Google Shopping?
O Google Shopping (anteriormente conhecido como Pesquisa de Produtos do Google, Produtos do Google e Froogle) é uma plataforma de compras onde os usuários podem navegar, comparar e comprar produtos de uma ampla gama de fornecedores pagos. Ele não apenas permite que os consumidores selecionem facilmente seus produtos favoritos de um grande número de marcas, mas também fornece aos varejistas um canal de promoção online eficiente. Quando os usuários clicam em um link de produto, eles serão direcionados diretamente para o site do fornecedor para concluir a compra, tornando o Google Shopping uma ferramenta poderosa para as empresas aumentarem a exposição do produto e promoverem vendas.
Visão geral da estrutura da página de resultados do Google Shopping
Os dados obtidos ao navegar no Google Shopping dependem de três parâmetros de entrada principais: pesquisa, produto e preço. Aqui está uma breve análise de cada parâmetro:
- Pesquisa: A lista de produtos do Google Shopping contém informações detalhadas sobre cada produto, como ID, título, descrição, preço e status do estoque.
- Produto: Exibe informações detalhadas sobre um único produto, incluindo vendas em outros varejistas e preços de produtos.
- Preço: Lista os preços dos produtos de todos os varejistas e informações adicionais, como detalhes de envio, custo total e nome do varejista.
Página de resultados de pesquisa

A página de resultados de pesquisa do Google Shopping exibe todos os produtos relacionados à consulta do usuário. Por exemplo, ao pesquisar "raquete de padel", a página exibirá os seguintes elementos:
- Barra de pesquisa: permite que os usuários insiram palavras-chave para pesquisar produtos.
- Lista de produtos: exibe informações detalhadas de todos os produtos nos resultados da pesquisa.
- Filtros: permite que os usuários filtrem produtos por faixa de preço, cor, estilo etc.
- Opções de classificação: suporta a classificação dos resultados por atributos como preço crescente/decrescente, popularidade etc.
Página do produto

Após clicar em um produto na página de resultados da pesquisa, os usuários são direcionados para a página do produto, que contém o seguinte:
- Nome do produto: O nome do produto.
- Destaques do produto: Uma visão geral rápida dos recursos principais do produto.
- Detalhes do produto: Uma descrição detalhada do produto.
- Informações de preços: Preços oferecidos por diferentes varejistas.
- Avaliações de produtos: Exibe avaliações de produtos e avaliações de clientes.
- Faixa de preços: Exibe os preços de venda mais baixos e mais altos de diferentes vendedores.
- Especificações gerais: Fornece parâmetros básicos do produto.
Página de preços

A página de preços agrega os preços dos produtos de diferentes varejistas e exibe informações como a reputação do varejista e se ele oferece a Garantia do Google. Esta página contém o seguinte:
- Nome do produto: O nome do produto que você pesquisou.
- Avaliação: A classificação geral do produto e o número de avaliações.
- Preços por loja: Lista as ofertas, promoções e links de compra dos varejistas.
- Filtros: Filtros que podem ser aplicados à lista de varejistas.
É legal raspar os resultados do Google Shopping?
Raspar dados é considerado legal em alguns casos:
- Uso justo: Em algumas jurisdições, o uso justo permite a raspagem limitada de dados para fins como pesquisa, educação ou uso não comercial.
- Dados públicos: Se os dados que você deseja raspar são públicos (como preços ou descrições de produtos no Google Shopping), então raspar esses dados pode parecer aceitável.
Como raspar os resultados do Google Shopping com Python [Guia completo]
Neste guia abrangente, iremos guiá-lo pelo processo de raspagem dos resultados do Google Shopping usando Python. Se você está coletando detalhes do produto, preços ou avaliações, este tutorial fornecerá instruções passo a passo para configurar seu ambiente de raspagem e começar a coletar dados de forma eficiente. Vamos aproveitar a poderosa API do Google Shopping Scrapeless para simplificar o processo, para que você possa se concentrar na construção do seu projeto sem se preocupar com lógica de raspagem complexa ou problemas legais.
[Vantagens técnicas da API Scrapeless]
- Mecanismo anti-rastreamento integrado (suporta Cloudflare/recaptcha v3)
- Processamento automático de conteúdo renderizado dinamicamente
- Fornece campos de dados padronizados para integração e análise rápidas
- Pool de proxy IP eficiente para garantir alta rastreabilidade concorrente e evitar bloqueio de IP
- Atualizações de dados em tempo real para garantir que as informações mais recentes do Google Shopping sejam capturadas
- Rede proxy global, suporta rastreio de dados multi-regionais e garante a cobertura de informações de produtos em diferentes mercados
- Alta escalabilidade, suporta necessidades de rastreamento de dados em larga escala, adequado para aplicativos de nível empresarial
Passo 1: configurar o Python e instalar as bibliotecas necessárias
Primeiro, precisamos construir um ambiente de rastreamento de dados e preparar as seguintes ferramentas:
- Python: Este é o software principal para executar o Python. Você pode baixar a versão que precisamos no link do site oficial, conforme mostrado na figura abaixo, mas é recomendável não baixar a versão mais recente. Você pode baixar 1-2 versões anteriores à versão mais recente.

- IDE Python: Qualquer IDE que suporte Python serve, mas recomendamos o PyCharm, que é um software de ferramenta de desenvolvimento IDE projetado especificamente para Python. Para a versão do PyCharm, recomendamos o PyCharm Community Edition gratuito.

- Pip: Você pode usar o Python Package Index para instalar as bibliotecas necessárias para executar seus programas com um único comando.

Nota: Se você for um usuário do Windows, não se esqueça de marcar a opção "Adicionar python.exe ao PATH" no assistente de instalação. Isso permitirá que o Windows use o Python e os comandos no terminal. Como o Python 3.4 ou posterior o inclui por padrão, você não precisa instalá-lo manualmente.

Por meio das etapas acima, o ambiente para rastrear dados do Google Shopping está configurado. Em seguida, você pode usar o PyCharm baixado em combinação com o Scrapeless para rastrear dados do Google Shopping.
Passo 2: usar o PyCharm e o Scrapeless para raspar dados do Google Shopping
- Inicie o PyCharm e selecione Arquivo>Novo projeto… na barra de menu.

- Em seguida, na janela que aparecer, selecione Pure Python no menu à esquerda e configure seu projeto da seguinte forma:
Nota: Na caixa vermelha abaixo, selecione o caminho de instalação do Python baixado na primeira etapa da configuração do ambiente

- Você pode criar um projeto chamado python-scraper, marque a opção "Criar script de boas-vindas main.py na pasta" e clique no botão "Criar". Depois que o PyCharm configurar o projeto por um tempo, você deverá ver o seguinte:

- Em seguida, clique com o botão direito para criar um novo arquivo Python.

- Para verificar se tudo está funcionando corretamente, abra a guia Terminal na parte inferior da tela e digite: python main.py. Após executar este comando, você deverá obter: Olá, PyCharm.
Passo 3: inscreva-se no Scrapeless e obtenha sua chave de API
Agora você pode copiar diretamente o código Scrapeless para o PyCharm e executá-lo, para que possa obter os dados em formato JSON do Google Shopping. Mas você precisa obter a chave de API do Scrapeless primeiro.
- Se você ainda não possui uma conta, inscreva-se no Scrapeless. Após se inscrever, faça login no seu painel.
- No seu painel Scrapeless, navegue até Gerenciamento de chave de API e clique em Criar chave de API. Você obterá sua chave de API. Basta colocar o mouse sobre ela e clicar para copiá-la. Esta chave será usada para autenticar sua solicitação ao chamar a API Scrapeless.

Passo 4: entender os parâmetros da API do Google Shopping Scrapeless
Parâmetros | Obrigatório | Desc |
---|---|---|
engine | VERDADEIRO | Definir parâmetro como google_shopping para usar o mecanismo de API do Google Shopping. |
q | VERDADEIRO | O parâmetro define a consulta que você deseja pesquisar. Você pode usar qualquer coisa que você usaria em uma pesquisa regular do Google Shopping. |
location | FALSO | O parâmetro define de onde você deseja que a pesquisa se origine. Se vários locais corresponderem à localização solicitada, escolheremos o mais popular. Os parâmetros de localização e uule não podem ser usados juntos. É recomendável especificar a localização no nível da cidade. |
uule | FALSO | O parâmetro é a localização codificada do Google que você deseja usar para a pesquisa. Os parâmetros uule e localização não podem ser usados juntos. |
gl | FALSO | O parâmetro define o país a ser usado para a pesquisa do Google. É um código de país de duas letras. (por exemplo, us para os Estados Unidos, uk para o Reino Unido ou fr para a França). O padrão é us . |
hl | FALSO | O parâmetro define o idioma a ser usado para a pesquisa no Google Maps. É um código de idioma de duas letras. (por exemplo, en para inglês, es para espanhol ou fr para francês). O padrão é en . |
tbs | FALSO | (a ser pesquisado) o parâmetro define parâmetros de pesquisa avançados que não são possíveis no campo de consulta regular. |
direct_link | FALSO | O parâmetro determina se os resultados da pesquisa devem incluir links diretos para cada produto. Por padrão, é falso. Se você precisar do link direto, defina-o como verdadeiro. Este parâmetro aplica-se apenas ao novo layout (EUA e alguns outros países). |
start | FALSO | O parâmetro define o deslocamento do resultado. Ele pula o número fornecido de resultados. É usado para paginação. (por exemplo, 0 (padrão) é a primeira página de resultados, 60 é a 2ª página de resultados, 120 é a 3ª página de resultados etc.). Para o novo layout, o parâmetro não é recomendado. |
num | FALSO | O parâmetro define o número máximo de resultados a serem retornados. (por exemplo, 60 (padrão) retorna 60 resultados, 40 retorna 40 resultados e 100 (máximo) retorna 100 resultados). Qualquer número maior que 100 será definido como padrão para 100. Qualquer número menor que 1 será definido como padrão para 60. |
Passo 5: como integrar a API Scrapeless à sua ferramenta de raspagem
Depois de ter sua chave de API, você pode começar a integrar a API Scrapeless às suas próprias ferramentas de raspagem. Aqui está um exemplo de como usar Python e solicitações para chamar a API Scrapeless e recuperar dados.
Exemplo de integração de código:
import json
import requests
class Payload:
def __init__(self, actor, input_data):
self.actor = actor
self.input = input_data
def send_request():
host = "api.scrapeless.com"
url = f"https://{host}/api/v1/scraper/request"
token = "your_token"
headers = {
"x-api-token": token
}
input_data = {
"engine": "google_shopping",
"q": "Macbook M3"
}
payload = Payload("scraper.google.shopping", input_data)
json_payload = json.dumps(payload.__dict__)
response = requests.post(url, headers=headers, data=json_payload)
if response.status_code != 200:
print("Erro:", response.status_code, response.text)
return
print("body", response.text)
if __name__ == "__main__":
send_request()
Substitua "your_token" pela sua CHAVE DE API Scrapeless. Você também pode personalizar seu código de raspagem de acordo com as informações do parâmetro da API acima.
Passo 6: analisar os dados resultantes
Os dados resultantes da API Scrapeless conterão informações detalhadas em formato JSON. O seguinte é um exemplo parcial dos dados resultantes, e as informações específicas podem ser visualizadas na documentação da API.
Explore outras APIs de e-commerce para raspagem de dados
Além de rastrear dados de produtos do Google Shopping, você também pode coletar e analisar tendências de mercado por meio de outras plataformas de e-commerce para entender o desempenho do produto, as mudanças de preço e as tendências de vendas em diferentes plataformas.
- API da Amazon: Por meio de nossa API da Amazon, você pode rastrear dados de produtos da Amazon de forma eficiente para entender preços, avaliações e estoque.
- API Shopee: Obtenha dados de produtos da plataforma Shopee e obtenha um entendimento profundo da demanda de produtos no mercado do Sudeste Asiático.
- API Shein: Por meio da API Shein, analise dados da indústria global de fast fashion para entender as preferências e tendências dos consumidores.
Se sua empresa precisa rastrear dados dessas plataformas de e-commerce, ou se você tiver necessidades semelhantes, nossa interface de API fornece recursos poderosos de rastreamento de dados, permitindo que você obtenha facilmente dados de produtos de várias plataformas de e-commerce. Se você precisar de uma solução personalizada, entre em contato diretamente com nossa equipe de vendas, e forneceremos o melhor serviço com base em suas necessidades específicas.
Junte-se à nossa comunidade Scrapeless Discord hoje! 🎉 Obtenha acesso exclusivo a uma avaliação gratuita do Scrapeless. Não perca - clique no link, é uma oferta por tempo limitado!
Scrapeless Deep SerpApi: Sua poderosa ferramenta de API do Google SERP
Deep SerpApi é uma API de mecanismo de busca especializada projetada especificamente para modelos de linguagem grandes (LLMs) e agentes de IA. Ele fornece informações em tempo real, precisas e imparciais, permitindo que aplicativos de IA recuperem e processem dados do Google e além de forma eficiente.
✅ Interface abrangente de cobertura de dados: abrange mais de 20 cenários do Google SERP e mecanismos de pesquisa convencionais.
✅ Rentabilidade: Deep SerpApi oferece preços a partir de US$ 0,10 por mil consultas, com tempo de resposta de 1 a 2 segundos, permitindo que desenvolvedores e empresas obtenham dados de forma eficiente e a baixo custo.
✅ Recursos avançados de integração de dados: pode integrar informações de todos os canais online e mecanismos de busca disponíveis.
✅ Obtenha atualizações em tempo real com dados atualizados nas últimas 24 horas.
Como parte de nossa roadmap futura, estamos totalmente comprometidos em atender às necessidades dos desenvolvedores de IA, simplificando a integração de informações da web dinâmica em soluções impulsionadas por IA. O objetivo é fornecer uma API tudo-em-um que permita a pesquisa e a extração de dados perfeita com uma única chamada.
🎺🎺Anúncio emocionante!
Programa de suporte para desenvolvedores: Integre o Scrapeless Deep SerpApi às suas ferramentas, aplicativos ou projetos de IA. [Já oferecemos suporte ao Dify e em breve ofereceremos suporte ao Langchain, Langflow, FlowiseAI e outras estruturas]. Em seguida, compartilhe seus resultados no GitHub ou nas redes sociais e você receberá suporte gratuito para desenvolvedores por 1 a 12 meses, até US$ 500 por mês.
Conclusão
Em resumo, raspar os resultados do Google Shopping com o Scrapeless fornece uma maneira eficaz de coletar dados valiosos para análise, pesquisa de produtos e comparação. Seguindo o guia passo a passo descrito neste artigo, você pode configurar facilmente as ferramentas necessárias, integrar a API Scrapeless ao seu fluxo de trabalho e começar a extrair informações relevantes de maneira compatível e eficiente. Se você é um desenvolvedor ou um proprietário de empresa que busca alavancar os dados do Google Shopping, o processo é simples e escalável. Lembre-se de sempre cumprir as diretrizes legais e éticas relacionadas à raspagem da web.
FAQs
P1: Como ajusto o número de resultados por página?
Para ajustar o número de resultados retornados por página, use o parâmetro limit. Por exemplo, definir "limit": 20 retornará 20 resultados por solicitação.
P2: Como rastreio outras páginas?
Use o parâmetro page para rastrear outras páginas. Por exemplo, "page": 2 retornará a segunda página de resultados.
P3: Posso rastrear dados de vários locais?
Sim, você pode especificar um país ou região usando o parâmetro location. Por exemplo, "location": "UK" rastreará os resultados do Google Shopping do Reino Unido.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.