n8n + LLM Scraper: Capture Respostas de IA em um Fluxo de Trabalho Sem Código
Senior Web Scraping Engineer
Principais Conclusões:
- n8n comunica-se com o Scrapeless LLM Chat Scraper através de um nó de Requisição HTTP — sem código, sem SDK. Um único nó envia um POST para
https://api.scrapeless.com/api/v2/scraper/executecom um cabeçalhox-api-tokene um corpo JSON, e a resposta chega ao fluxo de trabalho como dados que o próximo nó pode ler. - O corpo da requisição é
{ ator, entrada }e nada mais. Defina o corpo como{"actor":"scraper.chatgpt","input":{"prompt":"…","country":"US","web_search":true}}e o nó retorna{ status, task_id, task_result }— o mesmo envelope que todos os atores do Scrapeless LLM utilizam. - Um Gatilho de Agendamento transforma a chamada em um monitor contínuo. Conecte
Gatilho de Agendamento → Requisição HTTP → SE → Definir/Planilha/DBe o n8n re-executa o prompt definido em um intervalo, anexando cada resposta a uma planilha ou tabela sem que ninguém abra um terminal. - O nó SE trata a execução vazia como dados, não como uma falha. O modelo preenche
task_resultpor sessão, então uma resposta vazia é nenhuma resposta para aquela consulta nesta execução — ramifique sobre isso, registre que não há nada a armazenar e prossiga; a próxima execução agendada captura a preenchida. - O nó Cliente MCP é a alternativa ao nó agente. Quando o fluxo de trabalho é um agente de IA em vez de um pipeline fixo, direcione o nó Cliente MCP do n8n para o servidor MCP da Scrapeless e a mesma captura se torna uma ferramenta que o agente chama por conta própria.
- Gratuito para começar. Novas contas Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.
Introdução: o motor de respostas se torna uma entrada de fluxo de trabalho
Os motores de resposta LLM agora estão entre os usuários e a web aberta, e as perguntas que uma marca se preocupa — quem é recomendado, quais fontes são citadas, qual preço aparece — são respondidas dentro do ChatGPT antes que qualquer página receba um clique. Ler essa superfície em um cronograma é um trabalho de coleta de dados, e o n8n já é onde muitas equipes realizam seus trabalhos de dados programados.
A fricção é que o ChatGPT não possui uma API de resposta oficial, e dirigir a interface de chat a partir de uma ferramenta de automação significa barreiras de login, respostas transmitidas, e campos que resolvem do lado do cliente após a resposta ser renderizada. O nó de Requisição HTTP do n8n pode chamar qualquer endpoint REST, mas não tem nada para chamar até que a renderização, egressão residencial e análise ocorram em outro lugar primeiro.
O Scrapeless LLM Chat Scraper é esse outro lugar: um POST retorna a resposta renderizada do ChatGPT como JSON, então o nó de Requisição HTTP tem um endpoint limpo para alcançar e o restante do fluxo de trabalho lê campos estruturados. Este post conecta o n8n a esse ator sem código — um Gatilho de Agendamento, um nó de Requisição HTTP, um ramo SE para execuções vazias e um nó de armazenamento — e mostra o caminho do nó agente para fluxos de trabalho que precisam do scraper como uma ferramenta de IA. Para a visão classificada dos próprios scrapers de motor de resposta, os melhores scrapers LLM comparam as superfícies lado a lado.
Uma nota sobre o escopo: o contrato de requisição abaixo é verificado contra o ator scraper.chatgpt ativo, e cada nome de parâmetro n8n é confirmado contra a referência atual do nó n8n. O fluxo de trabalho de ponta a ponta é descrito a partir dessas duas peças verificadas — este post não apresenta uma execução com captura de tela como prova.
O Que Você Pode Fazer Com Isso
- Monitoramento de respostas agendadas. Execute um conjunto de prompts fixos a cada hora ou cada manhã e anexe cada resposta do ChatGPT a uma planilha, para que a deriva de respostas se torne uma série temporal em vez de uma verificação manual.
- Rastreamento de citação. Leia
task_result.search_resultpara as fontes que o ChatGPT consultou e faça a contagem dos domínios ao longo das execuções para ver quem o modelo continua citando na sua categoria. - Alertas de menção à marca. Ramifique se o texto da resposta menciona seu produto e direcione um nó Slack ou de e-mail a partir do SE quando uma menção aparecer ou desaparecer.
- Captura multi-engine em um único fluxo de trabalho. Duplicar o nó de Requisição HTTP e trocar a string do ator para
scraper.geminiouscraper.perplexity— o envelope é idêntico, então os nós a montante não mudam. - Transferência de operações para não desenvolvedores. Uma vez que o fluxo de trabalho exista, um colega edita a lista de prompts em um nó de Definição ou em uma planilha sem tocar no código, e a captura continua a funcionar.
- Chamadas de ferramentas do agente. Exponha o scraper através do nó Cliente MCP para que um agente de IA do n8n decida quando consultar um motor de resposta como parte de uma tarefa maior.
Por Que o Scrapeless LLM Chat Scraper para n8n
O Scrapeless LLM Chat Scraper é o ator scraper.chatgpt, parte da linha API de Raspagem Universal, e se encaixa no n8n porque é um POST autenticado com JSON de entrada e JSON de saída. Para um fluxo de trabalho sem código especificamente, ele traz:
- Um único endpoint REST que o nó de Requisição HTTP chama diretamente — sem SDK a ser instalado no host n8n, sem navegador para manipular.
- Renderização do lado do servidor, egressos residenciais e tratamento contra bots, para que o nó receba uma resposta final em vez de uma página de login.
- O campo
countryna requisição, que define o mercado de egressos dentro do corpo JSON — um nó cobre a captura por mercado. - Um envelope
{ status, task_id, task_result }compartilhado entrescraper.chatgpt,scraper.geminiescraper.perplexity, assim um nó funcional se duplica para os outros motores sem alterações. - Um cabeçalho
x-api-tokencomo a única autenticação — uma única credencial n8n ou valor de cabeçalho, reutilizável em todos os nós que chamam Scrapeless.
Obtenha sua chave de API no plano gratuito em app.scrapeless.com.
Pré-requisitos
- Uma instância n8n (nuvem ou auto-hospedada) onde você pode adicionar um fluxo de trabalho.
- Uma conta Scrapeless e chave de API — inscreva-se em app.scrapeless.com.
- A chave de API disponível para colar no cabeçalho do nó de Requisição HTTP (ou armazenada como uma credencial n8n).
- Um destino para as linhas capturadas — um nó Set, um nó do Google Sheets ou um nó de banco de dados como Postgres.
Nenhum runtime de linguagem, proxy ou solucionador de CAPTCHA é necessário; a requisição é HTTP simples e o trabalho pesado ocorre do lado Scrapeless.
O fluxo de trabalho em uma visão geral
Toda a captura consiste em quatro nós em uma linha:
Schedule Trigger → HTTP Request → IF → Set / Google Sheets / Postgres
(intervalo) (POST ator) (vazio?) (armazenar a resposta)
O Schedule Trigger dispara em um intervalo, o nó de Requisição HTTP chama scraper.chatgpt, o nó IF verifica se a resposta veio preenchida e o nó de armazenamento escreve a linha. O ramo vazio do nó IF é onde uma execução sem resposta é registrada e descartada — não enviada novamente. Cada nó abaixo nomeia apenas parâmetros que existem na referência atual do nó n8n.
Passo 1 — Schedule Trigger
O Schedule Trigger inicia o fluxo de trabalho em uma cadência fixa para que a captura ocorra sem ninguém pressionando play. Adicione um nó Schedule Trigger (tipo versão 1.3) e defina suas Regras de Disparo para um intervalo — a cada hora, a cada algumas horas ou uma vez por dia, dependendo da frequência com que as respostas que você monitora tendem a mudar. Para monitoramento de motores de resposta, diariamente ou duas vezes por dia geralmente é suficiente, uma vez que a série ao longo das semanas é o sinal, não a mudança minuto a minuto.
O disparo emite um item por vez. Se você quiser vários prompts por execução, siga-o com um nó Set que emita sua lista de prompts, ou leia os prompts de uma planilha — cada prompt então fluirá pelo nó de Requisição HTTP como seu próprio item.
Passo 2 — Nó de Requisição HTTP: chamar o ator
O nó de Requisição HTTP é a integração. Ele POSTa a chamada do ator para Scrapeless e retorna a resposta analisada para o fluxo de trabalho. Adicione um nó HTTP Request (tipo versão 4.4) e defina estes parâmetros:
- Método →
POST - URL →
https://api.scrapeless.com/api/v2/scraper/execute - Enviar Cabeçalhos → ativado. Adicione um cabeçalho: nome
x-api-token, valor sua chave de API Scrapeless (ou referencie uma credencial n8n). - Enviar Corpo → ativado.
- Tipo de Conteúdo do Corpo →
JSON. - Especificar Corpo → Usando JSON, então cole a chamada do ator no campo JSON.
O corpo JSON é todo o contrato — o nome do ator mais um objeto input:
json
{
"actor": "scraper.chatgpt",
"input": {
"prompt": "melhores tênis de corrida 2026",
"country": "BR",
"web_search": true
}
}
Para tornar o prompt dinâmico, substitua a string estática por uma expressão n8n que leia o item que chega — por exemplo, puxando prompt do nó Set ou da linha da planilha que alimentou este nó. country define o egressos residenciais para a execução, e web_search permite que o modelo puxe fontes ao vivo, o que melhora a frequência com que a resposta é resolvida. Cada campo fica dentro de input; enviar prompt ou country no nível superior do corpo é rejeitado pelo ator.
Defina o Tempo Limite do nó generosamente. Uma resposta renderizada pode demorar a voltar, então um tempo limite padrão curto cortará a chamada antes que a resposta chegue — dê espaço.
O nó retorna o envelope padrão, { status, task_id, task_result }, como o JSON do item. Nós a jusante leem a resposta de task_result.result_text e as fontes de task_result.search_result.
Obtenha sua chave de API no plano gratuito: app.scrapeless.com
Passo 3 — Nó IF: ramificação em uma resposta vazia
O nó IF decide se há algo a ser armazenado. As respostas do ChatGPT são geradas por sessão, então o mesmo prompt pode retornar uma resposta completa em uma execução e um task_result vazio na próxima — isso não é uma falha, é a ausência de resposta para essa consulta nesta execução. Adicione um nó IF (tipo versão 2.3) após o nó de Solicitação HTTP e escreva uma regra de Condições única que teste se o campo de resposta está vazio — por exemplo, verificando se a expressão task_result.result_text não está vazia.
- Ramo Falso (resposta presente) → conecte ao nó de armazenamento na Etapa 4.
- Ramo Verdadeiro (resposta vazia) → registre que a execução não produziu nada e pare. Um nó NoOp, ou um nó Set que escreva uma linha de marcador "execução vazia", é suficiente.
O ramo vazio não chama o ator novamente. A próxima execução programada é a próxima chance de uma resposta populada, e agregar as execuções que retornam a resposta é todo o padrão. Trate o resultado vazio como dados nulos, não como um erro a ser perseguido.
Etapa 4 — Armazene a resposta
O nó de armazenamento transforma cada resposta populada em uma linha que você pode consultar mais tarde. Conecte o ramo de resposta-presente do nó IF ao destino que se encaixa no programa:
- Nó Set → molde o item para os campos que você mantém: o prompt,
task_result.result_text, os domínios de origem detask_result.search_result, otask_ide um timestamp de captura. Útil como uma etapa de formato final mesmo quando outro nó faz a gravação. - Nó Google Sheets → anexe uma linha por execução para um log compartilhável, sem banco de dados, que não desenvolvedores possam ler e editar.
- Nó Postgres (ou outro banco de dados) → insira em uma tabela quando a captura alimenta um armazém ou um painel.
Armazene task_id e o tempo de execução em cada linha. O comprimento da resposta, a contagem de citações e as fontes nomeadas mudam de execução para execução, então o valor é a série de capturas, não uma única resposta.
O nó oficial Scrapeless — e por que este guia usa Solicitação HTTP
O n8n tem um nó comunitário oficial Scrapeless (n8n-nodes-scrapeless). Instale-o, autentique uma vez com uma credencial Scrapeless, e ele fornece operações tipadas para três superfícies: Deep SerpApi (Google Search e Google Trends), a API Universal de Scraping (Web Unlocker) e o Crawler (Scrape e Crawl). Para qualquer um desses trabalhos, o nó é a escolha mais limpa — não há URL ou corpo JSON para construir manualmente.
Os atores LLM Chat Scraper — scraper.chatgpt, scraper.gemini, scraper.perplexity e scraper.aimode — não estão expostos como operações na versão atual do nó, então capturar a resposta de um motor de resposta é o caso em que o nó Solicitação HTTP é o caminho: ele chega diretamente a /api/v2/scraper/execute, que é exatamente o que os passos acima constroem. Se uma versão posterior do nó adicionar uma operação LLM, a credencial Scrapeless e a forma do fluxo de trabalho se mantêm — apenas o nó do meio muda.
A alternativa do nó agente: Cliente MCP + servidor MCP Scrapeless
Quando o fluxo de trabalho é um agente de IA em vez de um pipeline fixo, o nó Cliente MCP do n8n substitui a chamada HTTP construída manualmente. O nó Cliente MCP conecta-se a um servidor MCP e expõe as ferramentas desse servidor a um agente de IA do n8n, para que o agente as chame por conta própria quando sua razão precisar delas. Aponte-o para o servidor MCP Scrapeless e a captura do motor de resposta se torna uma das ferramentas que o agente pode invocar — o agente decide quando consultar o ChatGPT como parte de uma tarefa maior, em vez de você conectar a chamada em um ramo fixo.
Os dois caminhos atendem a necessidades diferentes. O nó Solicitação HTTP é a ferramenta certa para uma captura determinística e programada — mesmos prompts, mesma cadência, linhas previsíveis. O nó Cliente MCP é a ferramenta certa quando um agente deve escolher dinamicamente se e o que consultar. A superfície subjacente Scrapeless é a mesma; apenas quem dispara a chamada muda.
O que você recebe de volta
O nó Solicitação HTTP retorna o envelope padrão do ator como o item JSON. A resposta está sob task_result, com a prosa em result_text e as fontes consultadas em search_result. A forma abaixo é o que scraper.chatgpt retorna; os valores dos campos são uma amostra ilustrativa de uma execução ao vivo (texto e fontes ajustados).
json
// O esquema é o que scraper.chatgpt retorna; os valores dos campos são uma amostra ilustrativa de uma execução ao vivo.
{
"status": "success",
"task_id": "…",
"task_result": {
"prompt": "melhores tênis de corrida 2026",
"model": "gpt-5-mini",
"result_text": "Aqui estão os melhores tênis de corrida em 2026, com base em testes recentes entre marcas principais (ASICS, Nike, HOKA, Adidas, Brooks, Saucony) …",
"content_references": [],
"search_result": [
{ "title": "10 Melhores Tênis de Corrida de 2026 | Testado e Classificado", "url": "https://…", "snippet": "…", "attribution": "outdoorgearlab.com" }
],
"links": [],
"web_search": true
}
}
Algumas notas honestas sobre a leitura disso dentro do n8n:
- Cada campo é anulável.
result_textpode estar vazio esearch_resultpode ser um array vazio em uma execução dada — o nó IF da Etapa 3 existe exatamente para esse caso. Proteja-se contra campos ausentes em qualquer expressão que os leia. search_resulté a superfície de citação. Cada entrada possui umtítulo,url,snippeteatribuição; extraia o host da URL em um nó Set e contabilize nas execuções para a participação na citação.web_searchecoa o pedido. Reflete se a busca em fonte ao vivo estava ativada para a execução; mantenha comotrueno corpo para melhor resolução nos prompts de recomendação.- A saída varia de execução para execução. O comprimento da resposta e a contagem de fontes mudam para o mesmo prompt, que é o motivo pelo qual o timestamp de captura e o
task_idpertencem a cada linha armazenada.
FAQ
P: Preciso escrever algum código para conectar o n8n ao LLM Chat Scraper?
Não. A integração é o nó de Requisição HTTP incorporado, configurado com um método POST, a URL /api/v2/scraper/execute, um cabeçalho x-api-token e um corpo JSON. Não há SDK para instalar no host do n8n e nenhum nó de função para escrever.
P: Onde coloco minha chave da API do Scrapeless no n8n?
No cabeçalho do nó de Requisição HTTP — habilite Enviar Cabeçalhos, adicione um cabeçalho chamado x-api-token, e defina seu valor como sua chave, ou faça referência a uma credencial n8n para que a chave não seja armazenada no próprio nó. O mesmo cabeçalho funciona em toda chamada Scrapeless no fluxo de trabalho.
P: Como envio vários prompts em uma única execução?
Siga o Gatilho de Agendamento com um nó Set que produz sua lista de prompts, ou leia os prompts de uma Planilha do Google. Cada prompt se torna seu próprio item e flui através do nó de Requisição HTTP separadamente, então uma execução captura todo o conjunto.
P: O que acontece quando a resposta vem vazia?
As respostas do ChatGPT são por sessão, então um task_result vazio significa que não há resposta para aquela consulta naquela execução. O ramo vazio do nó IF registra a operação não executada e para; a próxima execução agendada é a próxima chance de uma resposta preenchida. O fluxo de trabalho não reenvia a mesma chamada.
P: Posso capturar Gemini e Perplexity no mesmo fluxo de trabalho?
Sim. Duplicar o nó de Requisição HTTP e alterar a string do ator para scraper.gemini ou scraper.perplexity. O endpoint, cabeçalho e o envelope { status, task_id, task_result } são idênticos, então os nós IF e de armazenamento a jusante não mudam.
P: Quando devo usar o nó MCP Client em vez do nó de Requisição HTTP?
Use o nó de Requisição HTTP para uma captura fixa e agendada com prompts previsíveis. Use o nó MCP Client, apontando para o servidor Scrapeless MCP, quando um agente de IA do n8n deve decidir por conta própria se e o que consultar — o scraper então atua como uma ferramenta que o agente chama.
P: Preciso de um proxy ou um navegador rodando no meu host do n8n?
Não. Renderização, saída residencial e tratamento anti-bot são todos executados do lado do servidor no Scrapeless. O host do n8n apenas faz uma requisição HTTPS de saída; o campo country no corpo seleciona o mercado de saída.
P: Coletar respostas do ChatGPT é legal?
Os dados retornados são a resposta visivelmente pública que o ChatGPT mostra a qualquer usuário. Assim como em qualquer scraping, a legalidade depende da jurisdição e do uso — revise os termos relevantes e consulte um advogado antes de construir sobre isso, e colete apenas dados de resposta e fonte públicos, nunca dados pessoais.
Conclusão: uma captura em pé com quatro nós
Conectar o n8n ao Scrapeless LLM Chat Scraper se resume a um nó de Requisição HTTP: POST { actor, input } para /api/v2/scraper/execute com um cabeçalho x-api-token, ler task_result de volta, ramificar na execução vazia e armazenar a linha. Um Gatilho de Agendamento transforma isso em um monitor em pé, e o nó MCP Client transforma em uma ferramenta de agente quando o fluxo de trabalho precisa de uma. Mantenha o conjunto de prompts escopado, fixe o country por mercado, trate cada campo como anulável e armazene task_id além de um timestamp para que a série seja o sinal. Execute um conjunto fixo de prompts em um cronograma com créditos da Universal Scraping API, e o mecanismo de resposta se torna uma entrada limpa para o que o resto do fluxo de trabalho faz. O contrato de requisição e os nomes dos campos são confirmados com o LLM Chat Scraper ao vivo, e os parâmetros do nó em relação à referência atual do nó n8n.
Pronto para construir seu pipeline de dados de respostas de IA?
Junte-se à nossa comunidade para reivindicar um plano gratuito e se conectar com desenvolvedores que estão criando pipelines de dados de respostas de IA: Discord · Telegram.
Inscreva-se em app.scrapeless.com para créditos de teste gratuitos e direcione o fluxo de trabalho de quatro nós acima para os prompts, motores e mercados que seu programa acompanha.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.



