🎯 Um navegador em nuvem personalizável e anti-detecção alimentado por Chromium desenvolvido internamente, projetado para rastreadores web e agentes de IA. 👉Experimente agora
De volta ao blog

Como Raspagem de Respostas do Grok com a API Grok Scraper

Sophia Martinez
Sophia Martinez

Specialist in Anti-Bot Strategies

10-Jun-2026

TL;DR

  • Uma API de scraping do Grok retorna a resposta do xAI com seus dois painéis de origem como dados. Um POST para o ator scraper.grok captura a resposta completa, além de web_search_results e x_search_results — as páginas da web abertas e as postagens do X (Twitter) que o Grok citou, como arrays separados.
  • Três entradas, uma delas incomum. prompt carrega a pergunta, country define a saída residencial, e um modo de raciocínio necessário — MODEL_MODE_FAST, MODEL_MODE_EXPERT ou MODEL_MODE_AUTO — controla quão rigorosamente o Grok raciocina antes de responder.
  • As citações do X são o diferencial. O Grok combina busca na web ao vivo com o feed em tempo real do X; capturar apenas o texto da resposta descarta metade dos dados que dizem a quem foi creditado.
  • O envelope combina com os outros atores de LLM. { status, task_id, task_result }, um x-api-token, o mesmo endpoint — um cliente de captura do ChatGPT se estende ao Grok mudando o nome do ator e adicionando o mode.
  • Metadados da execução vêm de graça. Sugestões de acompanhamento, notas de rodapé, contagens de tokens e os identificadores de conversa da execução chegam na mesma carga, prontas para auditorias.
  • Gratuito para começar. Novas contas do Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.

Introdução: o motor de respostas com um feed social dentro

O Grok responde perguntas combinando dois tipos de fonte que nenhum outro assistente importante combina: busca na web ao vivo e postagens retiradas diretamente do X. Pergunte qual ferramenta comprar, qual API se mantém, qual marca confiar, e a resposta combina páginas da web e postagens do X em uma resposta citada. Para quem está monitorando como uma marca aparece nas respostas da IA, isso torna o Grok uma superfície distinta — as citações incluem a conversa social, não apenas a web indexada.

Capturar essas respostas manualmente é a história usual: uma interface com login, saída em streaming, respostas sensíveis à geolocalização e um DOM que nunca foi feito para ser analisado. E o Grok adiciona uma reviravolta própria — o modo de raciocínio muda a resposta, então um pipeline de captura precisa controlá-lo explicitamente.

O ator scraper.grok transforma tudo isso em um único pedido HTTP: prompt, país e modo dentro; resposta estruturada e ambos os painéis de citação fora. Este guia cobre a forma do pedido, o esquema da resposta, um cliente Python executável e os atores acompanhantes que cobrem o restante do panorama das respostas de IA. Para a visão classificada da categoria, veja o guia dos melhores scrapers de LLM.

O Que Você Pode Fazer Com Isso

  • Rastreamento de participação de citação em dois painéis. Conte quais domínios aparecem em web_search_results e quais contas aparecem em x_search_results para um conjunto fixo de prompts ao longo do tempo.
  • Monitoramento de marca onde o X conduz a narrativa. Para categorias onde o sentimento se forma primeiro no X, as citações do Grok mostram quais postagens estão moldando as respostas do modelo.
  • Comparação de modo de raciocínio. Capture o mesmo prompt sob FAST, EXPERT e AUTO e meça como a profundidade muda a resposta e as fontes.
  • Captura em múltiplos mercados. Fixe execuções por país e compare o que o Grok diz a diferentes mercados sobre a mesma pergunta.
  • Análise de resposta competitiva. Acompanhe quando o Grok começa ou para de recomendar um produto e trace a mudança até as citações por trás disso.
  • Construção de conjunto de dados. Armazene tríades de prompt–resposta–painel como JSON limpo para análise longitudinal.

Por Que o Scrapeless Grok Scraper

O ator scraper.grok faz parte da família Scrapeless LLM Chat Scraper dentro da linha da Universal Scraping API:

  • Ambos os painéis de citação como arrays discretos. Fontes da web abertas e postagens do X chegam separadamente — um relatório de participação de citação lê cada painel diretamente, sem reanálise.
  • O modo de raciocínio é uma entrada de primeira classe. Você decide quão rigorosamente o Grok pensa por execução, o que mantém uma série programada metodologicamente consistente.
  • Saída residencial fixada no país. As execuções passam por proxies residenciais em mais de 195 países, então respostas específicas da localidade são reproduzíveis.
  • Um contrato em todas as plataformas. O mesmo endpoint, cabeçalho e { status, task_id, task_result } cobrem os atores ChatGPT, Gemini, Perplexity e Copilot.

A referência de parâmetros está nos documentos do LLM Chat Scraper.

Pré-requisitos

  • Uma conta Scrapeless e chave de API — inscreva-se em app.scrapeless.com.
  • curl para o teste rápido, ou Python 3.10+ para o cliente abaixo.
  • Familiaridade básica com HTTP e JSON.
    Armazene sua chave no ambiente para que ela nunca apareça no código:
bash Copy
export SCRAPELESS_API_KEY=seu_token_api_aqui

Como funciona o Grok Scraper

  • Endpoint: POST https://api.scrapeless.com/api/v2/scraper/execute
  • Ator: scraper.grok
  • Cabeçalho de autenticação: x-api-token: $SCRAPELESS_API_KEY

Parâmetros da requisição

campo de entrada obrigatório descrição
prompt sim a pergunta a ser enviada ao Grok
country sim código de país de duas letras para a saída residencial da execução (por exemplo, US; JP e TW estão indisponíveis)
mode sim profundidade de raciocínio: MODEL_MODE_FAST, MODEL_MODE_EXPERT ou MODEL_MODE_AUTO

Captura rápida com curl

bash Copy
curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
  -H "Content-Type: application/json" \
  -H "x-api-token: ${SCRAPELESS_API_KEY}" \
  -d '{
    "actor": "scraper.grok",
    "input": {
      "prompt": "Qual API de web scraping lida com sites pesados em JavaScript?",
      "country": "US",
      "mode": "MODEL_MODE_EXPERT"
    }
  }'

Envelope de resposta

json Copy
// amostra ilustrativa — esquema de uma execução live do scraper.grok; valores abreviados
{
  "status": "success",
  "task_id": "52fc9c96-…",
  "task_result": {
    "user_query": "Qual API de web scraping lida com sites pesados em JavaScript?",
    "full_response": "Para sites pesados em JavaScript, as opções que se mantêm são…",
    "web_search_results": [
      { "title": "…", "url": "https://…", "preview": "…", "description": "…", "favicon": "…", "image": "…" }
    ],
    "x_search_results": [],
    "follow_up_suggestions": [ "…" ],
    "footnotes": [],
    "tool_usages": [ "…" ],
    "token_count": 1024,
    "user_model": "…",
    "response_id": "…",
    "conversation": { "conversation_id": "…", "title": "…", "create_time": "…" }
  }
}

Campo por campo:

campo tipo o que contém
task_result.user_query string o prompt como o Grok o recebeu
task_result.full_response string texto completo da resposta do Grok
task_result.web_search_results[] array citações de web aberto — title, url, preview, além de description, favicon e image quando presentes
task_result.x_search_results[] array as publicações X citadas pelo Grok; vazio quando o prompt não puxou fontes sociais
task_result.follow_up_suggestions[] array as perguntas de acompanhamento que o Grok oferece após a resposta
task_result.footnotes[] array entradas de notas de rodapé, quando a resposta as contém
task_result.tool_usages[] array as ferramentas que a execução invocou (pesquisar, navegar)
task_result.token_count número o uso de token da execução
task_result.conversation objeto identificadores da execução — conversation_id, title, timestamps — útil como chaves de auditoria

Obtenha sua chave API no plano gratuito: app.scrapeless.com

Integrando a API em Python

Um cliente completo: envie o prompt, verifique o envelope e imprima ambos os painéis de citação.

python Copy
import os
import requests

ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"


def ask_grok(prompt: str, country: str = "US", mode: str = "MODEL_MODE_EXPERT") -> dict:
    resp = requests.post(
        ENDPOINT,
        headers={
            "Content-Type": "application/json",
            "x-api-token": os.environ["SCRAPELESS_API_KEY"],
        },
        json={
            "actor": "scraper.grok",
            "input": {"prompt": prompt, "country": country, "mode": mode},
        },
        timeout=300,
    )
    resp.raise_for_status()
    return resp.json()


if __name__ == "__main__":
    data = ask_grok("Qual API de web scraping lida com sites pesados em JavaScript?")
    result = data.get("task_result", {})
    web = result.get("web_search_results") or []
    x = result.get("x_search_results") or []
    print(f"status={data.get('status')} web_sources={len(web)} x_sources={len(x)}")
    for i, src in enumerate(web[:5], 1):
        print(f"  [web {i}] {src.get('title', '')[:60]} → {src.get('url', '')[:60]}")
    for i, post in enumerate(x[:5], 1):
        print(f"  [x {i}] {str(post)[:80]}")

Para trabalho de compartilhamento de citação, agrupe os URLs de web_search_results por domínio e x_search_results por conta, e conte por prompt — os dois painéis são sinais independentes e valem a pena serem plotados separadamente.

Escolhendo o modo de raciocínio

O mode obrigatório é a entrada que não tem equivalente no ChatGPT, e muda tanto a latência quanto a saída:

  • MODEL_MODE_FAST — respostas mais rápidas; adequado para varreduras em alto volume onde a largura supera a profundidade.
  • MODEL_MODE_EXPERT — raciocínio mais profundo e tipicamente fontes mais ricas; adequado para os prompts que você mapeia ao longo do tempo. Permita execuções mais longas.
  • MODEL_MODE_AUTO — Grok escolhe por prompt; conveniente interativamente, mas uma série agendada é mais fácil de interpretar quando o modo é mantido constante.
    Independentemente de qual você escolher, armazene-o com cada captura — comparar uma execução EXPERT com uma execução FAST é comparar dois processos diferentes.

Atores acompanhantes para o restante da paisagem de respostas de IA

O endpoint, cabeçalho e envelope permanecem os mesmos em toda a família — apenas o nome do ator e as entradas específicas da plataforma mudam:

  • scraper.chatgptprompt + país opcional; retorna result_text com citações de content_references.
  • scraper.gemini — mesma entrada de dois campos; retorna result_text mais um array de citations.
  • scraper.perplexitypaís obrigatório e uma flag de web_search; retorna web_results, media_items e prompts relacionados.
  • scraper.copilot — a superfície de resposta do Copilot sob o mesmo contrato.
  • scraper.overview / scraper.aimode — bloco de Visão Geral de IA do Google e aba de Modo de IA; coberto do início ao fim no guia de Visão Geral de IA.

Os preços para esta linha são baseados no uso, com créditos de teste gratuitos na inscrição — as camadas atuais estão na página de preços.

Como evitar problemas comuns

  • Um x_search_results vazio é normal para muitos prompts. Perguntas técnicas e de produto frequentemente são resolvidas inteiramente a partir da web aberta. Prompts sobre pessoas, eventos e sentimento são os que puxam posts do X — formule adequadamente quando o painel X é o ponto.
  • Os tamanhos do painel variam de execução para execução. O mesmo prompt pode citar 35 fontes da web em uma execução e 20 na próxima. Armazene cada captura com seu conversation_id e leia a série, não uma única execução.
  • Mantenha o modo constante em uma série. O modo altera o processo de raciocínio; misturar modos dentro de um conjunto de prompts monitorados torna as linhas de tendência ininterpretáveis.
  • Trate os campos como anuláveis. footnotes muitas vezes está vazio, entradas de fontes da web carregam description/image somente algumas vezes, e x_search_results pode ser [] — leia o que está presente.
  • Cuidado com a lista de países. country é obrigatório e JP/TW não estão disponíveis; escolha os mercados sobre os quais você relata e mantenha-os fixos por série.

Conclusão: ambos os painéis, uma solicitação

Capturar Grok se resume a uma chamada: POST { actor: "scraper.grok", input: { prompt, country, mode } } com seu x-api-token, leia full_response para a resposta, e registre web_search_results e x_search_results como sinais de citação separados. Mantenha o modo constante, fixe o país, armazene o conversation_id, e o mesmo cliente escala de um prompt para um programa de monitoramento multi-mercado agendado.

FAQ

Q: Capturar respostas do Grok é legal?

O ator captura conteúdo de resposta renderizado publicamente. As regras variam por jurisdição e pelos termos de serviço da plataforma — revise os ToS relevantes e consulte um advogado para seu caso de uso, especialmente antes de redistribuir capturas. Nunca colete dados pessoais protegidos sob o GDPR ou CCPA.

Q: Como eu me autentico?

Cada solicitação carrega x-api-token: <sua chave>. Uma chave de conta cobre scraper.grok e cada outro ator da Scrapeless. Crie uma chave no plano gratuito em app.scrapeless.com.

Q: Eu preciso de um proxy?

Não. A saída residencial e o roteamento geográfico estão embutidos no ator; a entrada obrigatória country é toda a configuração.

Q: Por que mode é obrigatório?

A profundidade de raciocínio do Grok altera materialmente a resposta, então o ator a torna explícita em vez de oferecer um padrão silencioso. Em código, os valores são os enums da API — MODEL_MODE_FAST, MODEL_MODE_EXPERT, MODEL_MODE_AUTO.

Q: Como eu separo citações da web de citações do X?

Elas já chegam separadas: web_search_results contém as páginas da web aberta, x_search_results contém os posts do X. Leia cada array diretamente.

Q: Posso executar isso sem um SDK ou agente de IA?

Sim. É HTTP simples — curl, Python requests, Node fetch, ou qualquer cliente HTTP funciona diretamente contra POST /api/v2/scraper/execute.

Q: Meu código de captura do ChatGPT funciona para o Grok?

A autenticação, endpoint e envelope são idênticos. Altere o nome do ator, adicione o mode e country obrigatórios, e mapeie as chaves de task_result (full_response em vez de result_text, os dois painéis em vez de content_references).

Pronto para construir seu pipeline de dados de respostas de IA?

Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores construindo pipelines de respostas de IA: Discord · Telegram.

Inscreva-se em app.scrapeless.com para créditos de teste gratuitos, e aponte o ator scraper.grok para os prompts, modos e mercados que seu programa de monitoramento necessita.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Catálogo