Como Raspagem de Respostas do Grok com a API Grok Scraper
Specialist in Anti-Bot Strategies
TL;DR
- Uma API de scraping do Grok retorna a resposta do xAI com seus dois painéis de origem como dados. Um POST para o ator
scraper.grokcaptura a resposta completa, além deweb_search_resultsex_search_results— as páginas da web abertas e as postagens do X (Twitter) que o Grok citou, como arrays separados. - Três entradas, uma delas incomum.
promptcarrega a pergunta,countrydefine a saída residencial, e um modo de raciocínio necessário —MODEL_MODE_FAST,MODEL_MODE_EXPERTouMODEL_MODE_AUTO— controla quão rigorosamente o Grok raciocina antes de responder. - As citações do X são o diferencial. O Grok combina busca na web ao vivo com o feed em tempo real do X; capturar apenas o texto da resposta descarta metade dos dados que dizem a quem foi creditado.
- O envelope combina com os outros atores de LLM.
{ status, task_id, task_result }, umx-api-token, o mesmo endpoint — um cliente de captura do ChatGPT se estende ao Grok mudando o nome do ator e adicionando omode. - Metadados da execução vêm de graça. Sugestões de acompanhamento, notas de rodapé, contagens de tokens e os identificadores de conversa da execução chegam na mesma carga, prontas para auditorias.
- Gratuito para começar. Novas contas do Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.
Introdução: o motor de respostas com um feed social dentro
O Grok responde perguntas combinando dois tipos de fonte que nenhum outro assistente importante combina: busca na web ao vivo e postagens retiradas diretamente do X. Pergunte qual ferramenta comprar, qual API se mantém, qual marca confiar, e a resposta combina páginas da web e postagens do X em uma resposta citada. Para quem está monitorando como uma marca aparece nas respostas da IA, isso torna o Grok uma superfície distinta — as citações incluem a conversa social, não apenas a web indexada.
Capturar essas respostas manualmente é a história usual: uma interface com login, saída em streaming, respostas sensíveis à geolocalização e um DOM que nunca foi feito para ser analisado. E o Grok adiciona uma reviravolta própria — o modo de raciocínio muda a resposta, então um pipeline de captura precisa controlá-lo explicitamente.
O ator scraper.grok transforma tudo isso em um único pedido HTTP: prompt, país e modo dentro; resposta estruturada e ambos os painéis de citação fora. Este guia cobre a forma do pedido, o esquema da resposta, um cliente Python executável e os atores acompanhantes que cobrem o restante do panorama das respostas de IA. Para a visão classificada da categoria, veja o guia dos melhores scrapers de LLM.
O Que Você Pode Fazer Com Isso
- Rastreamento de participação de citação em dois painéis. Conte quais domínios aparecem em
web_search_resultse quais contas aparecem emx_search_resultspara um conjunto fixo de prompts ao longo do tempo. - Monitoramento de marca onde o X conduz a narrativa. Para categorias onde o sentimento se forma primeiro no X, as citações do Grok mostram quais postagens estão moldando as respostas do modelo.
- Comparação de modo de raciocínio. Capture o mesmo prompt sob
FAST,EXPERTeAUTOe meça como a profundidade muda a resposta e as fontes. - Captura em múltiplos mercados. Fixe execuções por país e compare o que o Grok diz a diferentes mercados sobre a mesma pergunta.
- Análise de resposta competitiva. Acompanhe quando o Grok começa ou para de recomendar um produto e trace a mudança até as citações por trás disso.
- Construção de conjunto de dados. Armazene tríades de prompt–resposta–painel como JSON limpo para análise longitudinal.
Por Que o Scrapeless Grok Scraper
O ator scraper.grok faz parte da família Scrapeless LLM Chat Scraper dentro da linha da Universal Scraping API:
- Ambos os painéis de citação como arrays discretos. Fontes da web abertas e postagens do X chegam separadamente — um relatório de participação de citação lê cada painel diretamente, sem reanálise.
- O modo de raciocínio é uma entrada de primeira classe. Você decide quão rigorosamente o Grok pensa por execução, o que mantém uma série programada metodologicamente consistente.
- Saída residencial fixada no país. As execuções passam por proxies residenciais em mais de 195 países, então respostas específicas da localidade são reproduzíveis.
- Um contrato em todas as plataformas. O mesmo endpoint, cabeçalho e
{ status, task_id, task_result }cobrem os atores ChatGPT, Gemini, Perplexity e Copilot.
A referência de parâmetros está nos documentos do LLM Chat Scraper.
Pré-requisitos
- Uma conta Scrapeless e chave de API — inscreva-se em app.scrapeless.com.
curlpara o teste rápido, ou Python 3.10+ para o cliente abaixo.- Familiaridade básica com HTTP e JSON.
Armazene sua chave no ambiente para que ela nunca apareça no código:
bash
export SCRAPELESS_API_KEY=seu_token_api_aqui
Como funciona o Grok Scraper
- Endpoint:
POST https://api.scrapeless.com/api/v2/scraper/execute - Ator:
scraper.grok - Cabeçalho de autenticação:
x-api-token: $SCRAPELESS_API_KEY
Parâmetros da requisição
| campo de entrada | obrigatório | descrição |
|---|---|---|
prompt |
sim | a pergunta a ser enviada ao Grok |
country |
sim | código de país de duas letras para a saída residencial da execução (por exemplo, US; JP e TW estão indisponíveis) |
mode |
sim | profundidade de raciocínio: MODEL_MODE_FAST, MODEL_MODE_EXPERT ou MODEL_MODE_AUTO |
Captura rápida com curl
bash
curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
-H "Content-Type: application/json" \
-H "x-api-token: ${SCRAPELESS_API_KEY}" \
-d '{
"actor": "scraper.grok",
"input": {
"prompt": "Qual API de web scraping lida com sites pesados em JavaScript?",
"country": "US",
"mode": "MODEL_MODE_EXPERT"
}
}'
Envelope de resposta
json
// amostra ilustrativa — esquema de uma execução live do scraper.grok; valores abreviados
{
"status": "success",
"task_id": "52fc9c96-…",
"task_result": {
"user_query": "Qual API de web scraping lida com sites pesados em JavaScript?",
"full_response": "Para sites pesados em JavaScript, as opções que se mantêm são…",
"web_search_results": [
{ "title": "…", "url": "https://…", "preview": "…", "description": "…", "favicon": "…", "image": "…" }
],
"x_search_results": [],
"follow_up_suggestions": [ "…" ],
"footnotes": [],
"tool_usages": [ "…" ],
"token_count": 1024,
"user_model": "…",
"response_id": "…",
"conversation": { "conversation_id": "…", "title": "…", "create_time": "…" }
}
}
Campo por campo:
| campo | tipo | o que contém |
|---|---|---|
task_result.user_query |
string | o prompt como o Grok o recebeu |
task_result.full_response |
string | texto completo da resposta do Grok |
task_result.web_search_results[] |
array | citações de web aberto — title, url, preview, além de description, favicon e image quando presentes |
task_result.x_search_results[] |
array | as publicações X citadas pelo Grok; vazio quando o prompt não puxou fontes sociais |
task_result.follow_up_suggestions[] |
array | as perguntas de acompanhamento que o Grok oferece após a resposta |
task_result.footnotes[] |
array | entradas de notas de rodapé, quando a resposta as contém |
task_result.tool_usages[] |
array | as ferramentas que a execução invocou (pesquisar, navegar) |
task_result.token_count |
número | o uso de token da execução |
task_result.conversation |
objeto | identificadores da execução — conversation_id, title, timestamps — útil como chaves de auditoria |
Obtenha sua chave API no plano gratuito: app.scrapeless.com
Integrando a API em Python
Um cliente completo: envie o prompt, verifique o envelope e imprima ambos os painéis de citação.
python
import os
import requests
ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"
def ask_grok(prompt: str, country: str = "US", mode: str = "MODEL_MODE_EXPERT") -> dict:
resp = requests.post(
ENDPOINT,
headers={
"Content-Type": "application/json",
"x-api-token": os.environ["SCRAPELESS_API_KEY"],
},
json={
"actor": "scraper.grok",
"input": {"prompt": prompt, "country": country, "mode": mode},
},
timeout=300,
)
resp.raise_for_status()
return resp.json()
if __name__ == "__main__":
data = ask_grok("Qual API de web scraping lida com sites pesados em JavaScript?")
result = data.get("task_result", {})
web = result.get("web_search_results") or []
x = result.get("x_search_results") or []
print(f"status={data.get('status')} web_sources={len(web)} x_sources={len(x)}")
for i, src in enumerate(web[:5], 1):
print(f" [web {i}] {src.get('title', '')[:60]} → {src.get('url', '')[:60]}")
for i, post in enumerate(x[:5], 1):
print(f" [x {i}] {str(post)[:80]}")
Para trabalho de compartilhamento de citação, agrupe os URLs de web_search_results por domínio e x_search_results por conta, e conte por prompt — os dois painéis são sinais independentes e valem a pena serem plotados separadamente.
Escolhendo o modo de raciocínio
O mode obrigatório é a entrada que não tem equivalente no ChatGPT, e muda tanto a latência quanto a saída:
MODEL_MODE_FAST— respostas mais rápidas; adequado para varreduras em alto volume onde a largura supera a profundidade.MODEL_MODE_EXPERT— raciocínio mais profundo e tipicamente fontes mais ricas; adequado para os prompts que você mapeia ao longo do tempo. Permita execuções mais longas.MODEL_MODE_AUTO— Grok escolhe por prompt; conveniente interativamente, mas uma série agendada é mais fácil de interpretar quando o modo é mantido constante.
Independentemente de qual você escolher, armazene-o com cada captura — comparar uma execução EXPERT com uma execução FAST é comparar dois processos diferentes.
Atores acompanhantes para o restante da paisagem de respostas de IA
O endpoint, cabeçalho e envelope permanecem os mesmos em toda a família — apenas o nome do ator e as entradas específicas da plataforma mudam:
scraper.chatgpt—prompt+paísopcional; retornaresult_textcom citações decontent_references.scraper.gemini— mesma entrada de dois campos; retornaresult_textmais um array decitations.scraper.perplexity—paísobrigatório e uma flag deweb_search; retornaweb_results,media_itemse prompts relacionados.scraper.copilot— a superfície de resposta do Copilot sob o mesmo contrato.scraper.overview/scraper.aimode— bloco de Visão Geral de IA do Google e aba de Modo de IA; coberto do início ao fim no guia de Visão Geral de IA.
Os preços para esta linha são baseados no uso, com créditos de teste gratuitos na inscrição — as camadas atuais estão na página de preços.
Como evitar problemas comuns
- Um
x_search_resultsvazio é normal para muitos prompts. Perguntas técnicas e de produto frequentemente são resolvidas inteiramente a partir da web aberta. Prompts sobre pessoas, eventos e sentimento são os que puxam posts do X — formule adequadamente quando o painel X é o ponto. - Os tamanhos do painel variam de execução para execução. O mesmo prompt pode citar 35 fontes da web em uma execução e 20 na próxima. Armazene cada captura com seu
conversation_ide leia a série, não uma única execução. - Mantenha o modo constante em uma série. O modo altera o processo de raciocínio; misturar modos dentro de um conjunto de prompts monitorados torna as linhas de tendência ininterpretáveis.
- Trate os campos como anuláveis.
footnotesmuitas vezes está vazio, entradas de fontes da web carregamdescription/imagesomente algumas vezes, ex_search_resultspode ser[]— leia o que está presente. - Cuidado com a lista de países.
countryé obrigatório e JP/TW não estão disponíveis; escolha os mercados sobre os quais você relata e mantenha-os fixos por série.
Conclusão: ambos os painéis, uma solicitação
Capturar Grok se resume a uma chamada: POST { actor: "scraper.grok", input: { prompt, country, mode } } com seu x-api-token, leia full_response para a resposta, e registre web_search_results e x_search_results como sinais de citação separados. Mantenha o modo constante, fixe o país, armazene o conversation_id, e o mesmo cliente escala de um prompt para um programa de monitoramento multi-mercado agendado.
FAQ
Q: Capturar respostas do Grok é legal?
O ator captura conteúdo de resposta renderizado publicamente. As regras variam por jurisdição e pelos termos de serviço da plataforma — revise os ToS relevantes e consulte um advogado para seu caso de uso, especialmente antes de redistribuir capturas. Nunca colete dados pessoais protegidos sob o GDPR ou CCPA.
Q: Como eu me autentico?
Cada solicitação carrega x-api-token: <sua chave>. Uma chave de conta cobre scraper.grok e cada outro ator da Scrapeless. Crie uma chave no plano gratuito em app.scrapeless.com.
Q: Eu preciso de um proxy?
Não. A saída residencial e o roteamento geográfico estão embutidos no ator; a entrada obrigatória country é toda a configuração.
Q: Por que mode é obrigatório?
A profundidade de raciocínio do Grok altera materialmente a resposta, então o ator a torna explícita em vez de oferecer um padrão silencioso. Em código, os valores são os enums da API — MODEL_MODE_FAST, MODEL_MODE_EXPERT, MODEL_MODE_AUTO.
Q: Como eu separo citações da web de citações do X?
Elas já chegam separadas: web_search_results contém as páginas da web aberta, x_search_results contém os posts do X. Leia cada array diretamente.
Q: Posso executar isso sem um SDK ou agente de IA?
Sim. É HTTP simples — curl, Python requests, Node fetch, ou qualquer cliente HTTP funciona diretamente contra POST /api/v2/scraper/execute.
Q: Meu código de captura do ChatGPT funciona para o Grok?
A autenticação, endpoint e envelope são idênticos. Altere o nome do ator, adicione o mode e country obrigatórios, e mapeie as chaves de task_result (full_response em vez de result_text, os dois painéis em vez de content_references).
Pronto para construir seu pipeline de dados de respostas de IA?
Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores construindo pipelines de respostas de IA: Discord · Telegram.
Inscreva-se em app.scrapeless.com para créditos de teste gratuitos, e aponte o ator scraper.grok para os prompts, modos e mercados que seu programa de monitoramento necessita.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.



