🎯 Um navegador em nuvem personalizável e anti-detecção alimentado por Chromium desenvolvido internamente, projetado para rastreadores web e agentes de IA. 👉Experimente agora
De volta ao blog

Scraper de Chat LLM Sem Resíduos

Michael Lee
Michael Lee

Expert Network Defense Engineer

10-Dec-2025

À medida que a pesquisa por IA substitui os motores de busca tradicionais, mais consultas de usuários, conteúdo e tomada de decisões acontecem dentro de modelos como ChatGPT, Perplexity, Copilot, Gemini e Google AI Overviews. As marcas e equipes precisam de uma forma de coletar, analisar e monitorar insights em tempo real a partir desses motores de IA—incluindo prompts, respostas, citações, classificações, tendências e menções de concorrentes.

A API LLM Chat Scraper foi criada exatamente para este propósito.

Ela fornece uma interface de raspagem unificada para extrair dados estruturados e em tempo real de todos os principais modelos de IA—permitindo que você use os resultados para GEO (Otimização de Motor Generativo), monitoramento de concorrentes, otimização de estratégia de conteúdo e inteligência de busca.


Introdução

Usar a API LLM Chat Scraper consiste em dois passos simples:


Passo 1: Criar uma Tarefa

Envie uma solicitação POST para criar uma tarefa de raspagem. Se webhook.url for especificado, o resultado será enviado automaticamente quando a tarefa for concluída.

Exemplo de Solicitação

bash Copy
curl '{api_host}/api/v2/scraper/request' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}' \
--data '{
  "actor": "scraper.chatgpt",
  "input": {
    "prompt": "Serviço de proxy mais confiável para extração de dados",
    "country": "US",
    "web_search": true
  },
  "webhook": {
    "url": "http://www.seuwehook.com"
  }
}'

Passo 2: Recuperar o Resultado

Os resultados são armazenados por 5 minutos. Certifique-se de buscá-los prontamente.

Exemplo de Solicitação

bash Copy
curl --request GET '{api_host}/api/v2/scraper/result/{task_id}' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}'

Parâmetros Comuns

Parâmetro Tipo Requerido Descrição
actor string verdadeiro Tipo de raspador (ex: scraper.chatgpt)
webhook objeto falso Configuração do webhook
webhook.url string falso URL para enviar os resultados da tarefa
input objeto verdadeiro Campos de entrada específicos da tarefa

Estrutura de Dados do Resultado

Campo Tipo Requerido Descrição
status string verdadeiro Status da tarefa: pendente / em execução / sucesso / falha
message string falso Mensagem de erro (se houver)
task_result objeto falso Campos do resultado final (variam por ator)

Formato de Push do Webhook

Se webhook.url for especificado, a API envia o resultado via POST.

Campo Tipo Requerido Descrição
task_id string verdadeiro ID Único da Tarefa
status string verdadeiro sucesso ou falha
input string verdadeiro Parâmetros da solicitação original como string JSON
task_result objeto falso Payload do resultado

Códigos de Status HTTP

Código de Status Descrição
200 Resultado recuperado com sucesso
201 Tarefa criada com sucesso
202 Tarefa ainda em execução
400 Solicitação inválida
410 Tarefa expirada (armazenada por 12 horas)
429 Muitas solicitações

Visão Geral dos Raspadores

Abaixo estão os raspadores de modelos de IA suportados e seus formatos de dados.


1. Raspador ChatGPT

Parâmetros do Corpo

Parâmetro Tipo Requerido Descrição
prompt string verdadeiro Prompt do usuário
country string verdadeiro País/Região
web_search boolean falso Ativar busca no navegador

Campos de Resposta

Campo Descrição
prompt Prompt original
result_text Resposta formatada em Markdown
model Modelo utilizado (ex: gpt-5-1)
web_search Se a busca foi ativada
links Links extraídos
search_result Resultados da busca na web
content_references Citações de fontes

2. Raspador Perplexity

Principais Campos de Resposta

  • prompt
  • result_text
  • related_prompt (perguntas relacionadas)
  • web_results (título, URL, snippet)
  • media_items (vídeos, mapas, imagens)
  • locations (lat/lng, descrição, categorias, endereço)
    Suporta dados estruturados ricos para viagens, informações locais, notícias e tópicos em alta.

3. Copilot Scraper

Suporta múltiplos modos:
pesquisa, inteligente, chat, razão, estudo

Parâmetros do Corpo

Parâmetro Descrição
prompt Prompt de entrada
país JP e TW não suportados
modo pesquisa / inteligente / chat / razão / estudo

Campos de Resposta

  • result_text
  • prompt
  • modo
  • links
  • citações

4. Gemini Scraper

Campos de Resposta

  • result_text
  • prompt
  • citações (favicon, destaques, trecho, nome_do_site)

Suporta estruturas de citação ricas semelhantes às respostas do Google Gemini.


5. Google AI Mode Scraper

Usado para extrair Visões Gerais do Google AI / Respostas AIO.

Campos de Resposta

Campo Descrição
result_text Resposta principal da IA
result_html HTML bruto
raw_url URL da fonte
citações Dados de citação com thumbnails
search_result Resultados de busca tradicionais (se disponíveis)

Ajuda & FAQ

Cobrança

Se o resultado for gerado, mas não recuperado dentro de 5 minutos, o pedido ainda será cobrado.
Para evitar desperdício:

  • Recupere os resultados imediatamente, ou
  • Configure um webhook para receber resultados automaticamente

Fonte de Dados

Nós apenas extraímos dados públicos, acessíveis sem login, garantindo conformidade e proteção à privacidade.


Países / Regiões Suportados

(Lista parcial abaixo)

País / Região Código
Áustria AT
Austrália AU
Bélgica BE
Japão JP
Cingapura SG
Taiwan TW
Estados Unidos US

Lista completa com 195+ países está disponível sob solicitação.


Conclusão

A API LLM Chat Scraper dá às equipes a capacidade de:

  • Monitorar menções de marca em todas as plataformas de chat de IA
  • Rastrear a presença e o ranking dos concorrentes nas respostas de IA
  • Analisar saídas do modelo, citações e tendências
  • Construir estratégias de GEO (Otimização de Motor Generativo)
  • Automatizar pipelines de inteligência em tempo real
  • Acessar dados estruturados de todo o ecossistema de busca de IA

É mais do que um scraper — é uma camada de infraestrutura de dados para a Era da Busca de IA.

Entre em contato conosco para desbloquear a solução completa de dados GEO —
para que cada peça de conteúdo seja respaldada por dados, alinhada ao comportamento do algoritmo e posicionada para um crescimento mensurável.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Catálogo