Como Raspagem de Respostas do Grok com a API Grok Scraper

Sophia Martinez

Specialist in Anti-Bot Strategies

10-Jun-2026

TL;DR

Uma API de scraping do Grok retorna a resposta do xAI com seus dois painéis de origem como dados. Um POST para o ator scraper.grok captura a resposta completa, além de web_search_results e x_search_results — as páginas da web abertas e as postagens do X (Twitter) que o Grok citou, como arrays separados.
Três entradas, uma delas incomum. prompt carrega a pergunta, country define a saída residencial, e um modo de raciocínio necessário — MODEL_MODE_FAST, MODEL_MODE_EXPERT ou MODEL_MODE_AUTO — controla quão rigorosamente o Grok raciocina antes de responder.
As citações do X são o diferencial. O Grok combina busca na web ao vivo com o feed em tempo real do X; capturar apenas o texto da resposta descarta metade dos dados que dizem a quem foi creditado.
O envelope combina com os outros atores de LLM. { status, task_id, task_result }, um x-api-token, o mesmo endpoint — um cliente de captura do ChatGPT se estende ao Grok mudando o nome do ator e adicionando o mode.
Metadados da execução vêm de graça. Sugestões de acompanhamento, notas de rodapé, contagens de tokens e os identificadores de conversa da execução chegam na mesma carga, prontas para auditorias.
Gratuito para começar. Novas contas do Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.

O Grok responde perguntas combinando dois tipos de fonte que nenhum outro assistente importante combina: busca na web ao vivo e postagens retiradas diretamente do X. Pergunte qual ferramenta comprar, qual API se mantém, qual marca confiar, e a resposta combina páginas da web e postagens do X em uma resposta citada. Para quem está monitorando como uma marca aparece nas respostas da IA, isso torna o Grok uma superfície distinta — as citações incluem a conversa social, não apenas a web indexada.

Capturar essas respostas manualmente é a história usual: uma interface com login, saída em streaming, respostas sensíveis à geolocalização e um DOM que nunca foi feito para ser analisado. E o Grok adiciona uma reviravolta própria — o modo de raciocínio muda a resposta, então um pipeline de captura precisa controlá-lo explicitamente.

O ator scraper.grok transforma tudo isso em um único pedido HTTP: prompt, país e modo dentro; resposta estruturada e ambos os painéis de citação fora. Este guia cobre a forma do pedido, o esquema da resposta, um cliente Python executável e os atores acompanhantes que cobrem o restante do panorama das respostas de IA. Para a visão classificada da categoria, veja o guia dos melhores scrapers de LLM.

O Que Você Pode Fazer Com Isso

Rastreamento de participação de citação em dois painéis. Conte quais domínios aparecem em web_search_results e quais contas aparecem em x_search_results para um conjunto fixo de prompts ao longo do tempo.
Monitoramento de marca onde o X conduz a narrativa. Para categorias onde o sentimento se forma primeiro no X, as citações do Grok mostram quais postagens estão moldando as respostas do modelo.
Comparação de modo de raciocínio. Capture o mesmo prompt sob FAST, EXPERT e AUTO e meça como a profundidade muda a resposta e as fontes.
Captura em múltiplos mercados. Fixe execuções por país e compare o que o Grok diz a diferentes mercados sobre a mesma pergunta.
Análise de resposta competitiva. Acompanhe quando o Grok começa ou para de recomendar um produto e trace a mudança até as citações por trás disso.
Construção de conjunto de dados. Armazene tríades de prompt–resposta–painel como JSON limpo para análise longitudinal.

Por Que o Scrapeless Grok Scraper

O ator scraper.grok faz parte da família Scrapeless LLM Chat Scraper dentro da linha da Universal Scraping API:

Ambos os painéis de citação como arrays discretos. Fontes da web abertas e postagens do X chegam separadamente — um relatório de participação de citação lê cada painel diretamente, sem reanálise.
O modo de raciocínio é uma entrada de primeira classe. Você decide quão rigorosamente o Grok pensa por execução, o que mantém uma série programada metodologicamente consistente.
Saída residencial fixada no país. As execuções passam por proxies residenciais em mais de 195 países, então respostas específicas da localidade são reproduzíveis.
Um contrato em todas as plataformas. O mesmo endpoint, cabeçalho e { status, task_id, task_result } cobrem os atores ChatGPT, Gemini, Perplexity e Copilot.

A referência de parâmetros está nos documentos do LLM Chat Scraper.

Pré-requisitos

Uma conta Scrapeless e chave de API — inscreva-se em app.scrapeless.com.
curl para o teste rápido, ou Python 3.10+ para o cliente abaixo.
Familiaridade básica com HTTP e JSON.
Armazene sua chave no ambiente para que ela nunca apareça no código:

bash Copy

export SCRAPELESS_API_KEY=seu_token_api_aqui

Como funciona o Grok Scraper

Endpoint: POST https://api.scrapeless.com/api/v2/scraper/execute
Ator: scraper.grok
Cabeçalho de autenticação: x-api-token: $SCRAPELESS_API_KEY

Parâmetros da requisição

campo de entrada	obrigatório	descrição
`prompt`	sim	a pergunta a ser enviada ao Grok
`country`	sim	código de país de duas letras para a saída residencial da execução (por exemplo, `US`; JP e TW estão indisponíveis)
`mode`	sim	profundidade de raciocínio: `MODEL_MODE_FAST`, `MODEL_MODE_EXPERT` ou `MODEL_MODE_AUTO`

Captura rápida com curl

bash Copy

curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
  -H "Content-Type: application/json" \
  -H "x-api-token: ${SCRAPELESS_API_KEY}" \
  -d '{
    "actor": "scraper.grok",
    "input": {
      "prompt": "Qual API de web scraping lida com sites pesados em JavaScript?",
      "country": "US",
      "mode": "MODEL_MODE_EXPERT"
    }
  }'

Envelope de resposta

json Copy

// amostra ilustrativa — esquema de uma execução live do scraper.grok; valores abreviados
{
  "status": "success",
  "task_id": "52fc9c96-…",
  "task_result": {
    "user_query": "Qual API de web scraping lida com sites pesados em JavaScript?",
    "full_response": "Para sites pesados em JavaScript, as opções que se mantêm são…",
    "web_search_results": [
      { "title": "…", "url": "https://…", "preview": "…", "description": "…", "favicon": "…", "image": "…" }
    ],
    "x_search_results": [],
    "follow_up_suggestions": [ "…" ],
    "footnotes": [],
    "tool_usages": [ "…" ],
    "token_count": 1024,
    "user_model": "…",
    "response_id": "…",
    "conversation": { "conversation_id": "…", "title": "…", "create_time": "…" }
  }
}

Campo por campo:

campo	tipo	o que contém
`task_result.user_query`	string	o prompt como o Grok o recebeu
`task_result.full_response`	string	texto completo da resposta do Grok
`task_result.web_search_results[]`	array	citações de web aberto — `title`, `url`, `preview`, além de `description`, `favicon` e `image` quando presentes
`task_result.x_search_results[]`	array	as publicações X citadas pelo Grok; vazio quando o prompt não puxou fontes sociais
`task_result.follow_up_suggestions[]`	array	as perguntas de acompanhamento que o Grok oferece após a resposta
`task_result.footnotes[]`	array	entradas de notas de rodapé, quando a resposta as contém
`task_result.tool_usages[]`	array	as ferramentas que a execução invocou (pesquisar, navegar)
`task_result.token_count`	número	o uso de token da execução
`task_result.conversation`	objeto	identificadores da execução — `conversation_id`, `title`, timestamps — útil como chaves de auditoria

Obtenha sua chave API no plano gratuito: app.scrapeless.com

Integrando a API em Python

Um cliente completo: envie o prompt, verifique o envelope e imprima ambos os painéis de citação.

python Copy

import os
import requests

ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"


def ask_grok(prompt: str, country: str = "US", mode: str = "MODEL_MODE_EXPERT") -> dict:
    resp = requests.post(
        ENDPOINT,
        headers={
            "Content-Type": "application/json",
            "x-api-token": os.environ["SCRAPELESS_API_KEY"],
        },
        json={
            "actor": "scraper.grok",
            "input": {"prompt": prompt, "country": country, "mode": mode},
        },
        timeout=300,
    )
    resp.raise_for_status()
    return resp.json()


if __name__ == "__main__":
    data = ask_grok("Qual API de web scraping lida com sites pesados em JavaScript?")
    result = data.get("task_result", {})
    web = result.get("web_search_results") or []
    x = result.get("x_search_results") or []
    print(f"status={data.get('status')} web_sources={len(web)} x_sources={len(x)}")
    for i, src in enumerate(web[:5], 1):
        print(f"  [web {i}] {src.get('title', '')[:60]} → {src.get('url', '')[:60]}")
    for i, post in enumerate(x[:5], 1):
        print(f"  [x {i}] {str(post)[:80]}")

Para trabalho de compartilhamento de citação, agrupe os URLs de web_search_results por domínio e x_search_results por conta, e conte por prompt — os dois painéis são sinais independentes e valem a pena serem plotados separadamente.

Escolhendo o modo de raciocínio

O mode obrigatório é a entrada que não tem equivalente no ChatGPT, e muda tanto a latência quanto a saída:

MODEL_MODE_FAST — respostas mais rápidas; adequado para varreduras em alto volume onde a largura supera a profundidade.
MODEL_MODE_EXPERT — raciocínio mais profundo e tipicamente fontes mais ricas; adequado para os prompts que você mapeia ao longo do tempo. Permita execuções mais longas.
MODEL_MODE_AUTO — Grok escolhe por prompt; conveniente interativamente, mas uma série agendada é mais fácil de interpretar quando o modo é mantido constante.
Independentemente de qual você escolher, armazene-o com cada captura — comparar uma execução EXPERT com uma execução FAST é comparar dois processos diferentes.

Atores acompanhantes para o restante da paisagem de respostas de IA

O endpoint, cabeçalho e envelope permanecem os mesmos em toda a família — apenas o nome do ator e as entradas específicas da plataforma mudam:

scraper.chatgpt — prompt + país opcional; retorna result_text com citações de content_references.
scraper.gemini — mesma entrada de dois campos; retorna result_text mais um array de citations.
scraper.perplexity — país obrigatório e uma flag de web_search; retorna web_results, media_items e prompts relacionados.
scraper.copilot — a superfície de resposta do Copilot sob o mesmo contrato.
scraper.overview / scraper.aimode — bloco de Visão Geral de IA do Google e aba de Modo de IA; coberto do início ao fim no guia de Visão Geral de IA.

Os preços para esta linha são baseados no uso, com créditos de teste gratuitos na inscrição — as camadas atuais estão na página de preços.

Como evitar problemas comuns

Um x_search_results vazio é normal para muitos prompts. Perguntas técnicas e de produto frequentemente são resolvidas inteiramente a partir da web aberta. Prompts sobre pessoas, eventos e sentimento são os que puxam posts do X — formule adequadamente quando o painel X é o ponto.
Os tamanhos do painel variam de execução para execução. O mesmo prompt pode citar 35 fontes da web em uma execução e 20 na próxima. Armazene cada captura com seu conversation_id e leia a série, não uma única execução.
Mantenha o modo constante em uma série. O modo altera o processo de raciocínio; misturar modos dentro de um conjunto de prompts monitorados torna as linhas de tendência ininterpretáveis.
Trate os campos como anuláveis. footnotes muitas vezes está vazio, entradas de fontes da web carregam description/image somente algumas vezes, e x_search_results pode ser [] — leia o que está presente.
Cuidado com a lista de países. country é obrigatório e JP/TW não estão disponíveis; escolha os mercados sobre os quais você relata e mantenha-os fixos por série.

Conclusão: ambos os painéis, uma solicitação

Capturar Grok se resume a uma chamada: POST { actor: "scraper.grok", input: { prompt, country, mode } } com seu x-api-token, leia full_response para a resposta, e registre web_search_results e x_search_results como sinais de citação separados. Mantenha o modo constante, fixe o país, armazene o conversation_id, e o mesmo cliente escala de um prompt para um programa de monitoramento multi-mercado agendado.

FAQ

Q: Capturar respostas do Grok é legal?

O ator captura conteúdo de resposta renderizado publicamente. As regras variam por jurisdição e pelos termos de serviço da plataforma — revise os ToS relevantes e consulte um advogado para seu caso de uso, especialmente antes de redistribuir capturas. Nunca colete dados pessoais protegidos sob o GDPR ou CCPA.

Q: Como eu me autentico?

Cada solicitação carrega x-api-token: <sua chave>. Uma chave de conta cobre scraper.grok e cada outro ator da Scrapeless. Crie uma chave no plano gratuito em app.scrapeless.com.

Q: Eu preciso de um proxy?

Não. A saída residencial e o roteamento geográfico estão embutidos no ator; a entrada obrigatória country é toda a configuração.

Q: Por que mode é obrigatório?

A profundidade de raciocínio do Grok altera materialmente a resposta, então o ator a torna explícita em vez de oferecer um padrão silencioso. Em código, os valores são os enums da API — MODEL_MODE_FAST, MODEL_MODE_EXPERT, MODEL_MODE_AUTO.

Q: Como eu separo citações da web de citações do X?

Elas já chegam separadas: web_search_results contém as páginas da web aberta, x_search_results contém os posts do X. Leia cada array diretamente.

Q: Posso executar isso sem um SDK ou agente de IA?

Sim. É HTTP simples — curl, Python requests, Node fetch, ou qualquer cliente HTTP funciona diretamente contra POST /api/v2/scraper/execute.

Q: Meu código de captura do ChatGPT funciona para o Grok?

A autenticação, endpoint e envelope são idênticos. Altere o nome do ator, adicione o mode e country obrigatórios, e mapeie as chaves de task_result (full_response em vez de result_text, os dois painéis em vez de content_references).

Pronto para construir seu pipeline de dados de respostas de IA?

Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores construindo pipelines de respostas de IA: Discord · Telegram.

Inscreva-se em app.scrapeless.com para créditos de teste gratuitos, e aponte o ator scraper.grok para os prompts, modos e mercados que seu programa de monitoramento necessita.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Aprenda a integrar o Crawl4AI com o Scrapeless Cloud Browser para uma raspagem web eficiente e em grande escala. Desbloqueie proxies automáticos, impressões digitais personalizadas, reutilização de sessões e depuração em tempo real.

Sophia Martinez

20-Oct-2025

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Servidor MCP sem resíduos está oficialmente no ar! Construa seu Conector AI-Web definitivo.

Descubra como o Servidor Scrapeless MCP fornece aos LLMs capacidades de navegação e raspagem na web em tempo real. Aprenda a construir agentes de IA que pesquisam, extraem e interagem com conteúdo web dinâmico de forma integrada.

Michael Lee

17-Jul-2025

Guia de Ferramentas USPS Sem Scrap: Extração Eficiente e Conformidade de Dados de Remessa para Sistemas B2B

Aprenda a usar a ferramenta Scrapeless USPS para buscar dados de rastreamento estruturados e em tempo real de forma eficiente e em conformidade para plataformas ERP, OMS e SaaS.

Emily Chen

02-Jul-2025

Guia de Ferramentas USPS Sem Resíduos: Extração de Dados de Envio Eficiente e em Conformidade para Sistemas B2B

Catálogo