Scraper de Chat LLM Sem Resíduos
Expert Network Defense Engineer
À medida que a pesquisa por IA substitui os motores de busca tradicionais, mais consultas de usuários, conteúdo e tomada de decisões acontecem dentro de modelos como ChatGPT, Perplexity, Copilot, Gemini e Google AI Overviews. As marcas e equipes precisam de uma forma de coletar, analisar e monitorar insights em tempo real a partir desses motores de IA—incluindo prompts, respostas, citações, classificações, tendências e menções de concorrentes.
A API LLM Chat Scraper foi criada exatamente para este propósito.
Ela fornece uma interface de raspagem unificada para extrair dados estruturados e em tempo real de todos os principais modelos de IA—permitindo que você use os resultados para GEO (Otimização de Motor Generativo), monitoramento de concorrentes, otimização de estratégia de conteúdo e inteligência de busca.
Introdução
Usar a API LLM Chat Scraper consiste em dois passos simples:
Passo 1: Criar uma Tarefa
Envie uma solicitação POST para criar uma tarefa de raspagem. Se webhook.url for especificado, o resultado será enviado automaticamente quando a tarefa for concluída.
Exemplo de Solicitação
bash
curl '{api_host}/api/v2/scraper/request' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}' \
--data '{
"actor": "scraper.chatgpt",
"input": {
"prompt": "Serviço de proxy mais confiável para extração de dados",
"country": "US",
"web_search": true
},
"webhook": {
"url": "http://www.seuwehook.com"
}
}'
Passo 2: Recuperar o Resultado
Os resultados são armazenados por 5 minutos. Certifique-se de buscá-los prontamente.
Exemplo de Solicitação
bash
curl --request GET '{api_host}/api/v2/scraper/result/{task_id}' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}'
Parâmetros Comuns
| Parâmetro | Tipo | Requerido | Descrição |
|---|---|---|---|
| actor | string | verdadeiro | Tipo de raspador (ex: scraper.chatgpt) |
| webhook | objeto | falso | Configuração do webhook |
| webhook.url | string | falso | URL para enviar os resultados da tarefa |
| input | objeto | verdadeiro | Campos de entrada específicos da tarefa |
Estrutura de Dados do Resultado
| Campo | Tipo | Requerido | Descrição |
|---|---|---|---|
| status | string | verdadeiro | Status da tarefa: pendente / em execução / sucesso / falha |
| message | string | falso | Mensagem de erro (se houver) |
| task_result | objeto | falso | Campos do resultado final (variam por ator) |
Formato de Push do Webhook
Se webhook.url for especificado, a API envia o resultado via POST.
| Campo | Tipo | Requerido | Descrição |
|---|---|---|---|
| task_id | string | verdadeiro | ID Único da Tarefa |
| status | string | verdadeiro | sucesso ou falha |
| input | string | verdadeiro | Parâmetros da solicitação original como string JSON |
| task_result | objeto | falso | Payload do resultado |
Códigos de Status HTTP
| Código de Status | Descrição |
|---|---|
| 200 | Resultado recuperado com sucesso |
| 201 | Tarefa criada com sucesso |
| 202 | Tarefa ainda em execução |
| 400 | Solicitação inválida |
| 410 | Tarefa expirada (armazenada por 12 horas) |
| 429 | Muitas solicitações |
Visão Geral dos Raspadores
Abaixo estão os raspadores de modelos de IA suportados e seus formatos de dados.
1. Raspador ChatGPT
Parâmetros do Corpo
| Parâmetro | Tipo | Requerido | Descrição |
|---|---|---|---|
| prompt | string | verdadeiro | Prompt do usuário |
| country | string | verdadeiro | País/Região |
| web_search | boolean | falso | Ativar busca no navegador |
Campos de Resposta
| Campo | Descrição |
|---|---|
| prompt | Prompt original |
| result_text | Resposta formatada em Markdown |
| model | Modelo utilizado (ex: gpt-5-1) |
| web_search | Se a busca foi ativada |
| links | Links extraídos |
| search_result | Resultados da busca na web |
| content_references | Citações de fontes |
2. Raspador Perplexity
Principais Campos de Resposta
- prompt
- result_text
- related_prompt (perguntas relacionadas)
- web_results (título, URL, snippet)
- media_items (vídeos, mapas, imagens)
- locations (lat/lng, descrição, categorias, endereço)
Suporta dados estruturados ricos para viagens, informações locais, notícias e tópicos em alta.
3. Copilot Scraper
Suporta múltiplos modos:
pesquisa, inteligente, chat, razão, estudo
Parâmetros do Corpo
| Parâmetro | Descrição |
|---|---|
| prompt | Prompt de entrada |
| país | JP e TW não suportados |
| modo | pesquisa / inteligente / chat / razão / estudo |
Campos de Resposta
- result_text
- prompt
- modo
- links
- citações
4. Gemini Scraper
Campos de Resposta
- result_text
- prompt
- citações (favicon, destaques, trecho, nome_do_site)
Suporta estruturas de citação ricas semelhantes às respostas do Google Gemini.
5. Google AI Mode Scraper
Usado para extrair Visões Gerais do Google AI / Respostas AIO.
Campos de Resposta
| Campo | Descrição |
|---|---|
| result_text | Resposta principal da IA |
| result_html | HTML bruto |
| raw_url | URL da fonte |
| citações | Dados de citação com thumbnails |
| search_result | Resultados de busca tradicionais (se disponíveis) |
Ajuda & FAQ
Cobrança
Se o resultado for gerado, mas não recuperado dentro de 5 minutos, o pedido ainda será cobrado.
Para evitar desperdício:
- Recupere os resultados imediatamente, ou
- Configure um webhook para receber resultados automaticamente
Fonte de Dados
Nós apenas extraímos dados públicos, acessíveis sem login, garantindo conformidade e proteção à privacidade.
Países / Regiões Suportados
(Lista parcial abaixo)
| País / Região | Código |
|---|---|
| Áustria | AT |
| Austrália | AU |
| Bélgica | BE |
| Japão | JP |
| Cingapura | SG |
| Taiwan | TW |
| Estados Unidos | US |
| … | … |
Lista completa com 195+ países está disponível sob solicitação.
Conclusão
A API LLM Chat Scraper dá às equipes a capacidade de:
- Monitorar menções de marca em todas as plataformas de chat de IA
- Rastrear a presença e o ranking dos concorrentes nas respostas de IA
- Analisar saídas do modelo, citações e tendências
- Construir estratégias de GEO (Otimização de Motor Generativo)
- Automatizar pipelines de inteligência em tempo real
- Acessar dados estruturados de todo o ecossistema de busca de IA
É mais do que um scraper — é uma camada de infraestrutura de dados para a Era da Busca de IA.
Entre em contato conosco para desbloquear a solução completa de dados GEO —
para que cada peça de conteúdo seja respaldada por dados, alinhada ao comportamento do algoritmo e posicionada para um crescimento mensurável.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.



