🎯 Um navegador em nuvem personalizável e anti-detecção alimentado por Chromium desenvolvido internamente, projetado para rastreadores web e agentes de IA. 👉Experimente agora
De volta ao blog

n8n + LLM Scraper: Capture Respostas de IA em um Fluxo de Trabalho Sem Código

Alex Johnson
Alex Johnson

Senior Web Scraping Engineer

17-Jun-2026

Principais Conclusões:

  • n8n comunica-se com o Scrapeless LLM Chat Scraper através de um nó de Requisição HTTP — sem código, sem SDK. Um único nó envia um POST para https://api.scrapeless.com/api/v2/scraper/execute com um cabeçalho x-api-token e um corpo JSON, e a resposta chega ao fluxo de trabalho como dados que o próximo nó pode ler.
  • O corpo da requisição é { ator, entrada } e nada mais. Defina o corpo como {"actor":"scraper.chatgpt","input":{"prompt":"…","country":"US","web_search":true}} e o nó retorna { status, task_id, task_result } — o mesmo envelope que todos os atores do Scrapeless LLM utilizam.
  • Um Gatilho de Agendamento transforma a chamada em um monitor contínuo. Conecte Gatilho de Agendamento → Requisição HTTP → SE → Definir/Planilha/DB e o n8n re-executa o prompt definido em um intervalo, anexando cada resposta a uma planilha ou tabela sem que ninguém abra um terminal.
  • O nó SE trata a execução vazia como dados, não como uma falha. O modelo preenche task_result por sessão, então uma resposta vazia é nenhuma resposta para aquela consulta nesta execução — ramifique sobre isso, registre que não há nada a armazenar e prossiga; a próxima execução agendada captura a preenchida.
  • O nó Cliente MCP é a alternativa ao nó agente. Quando o fluxo de trabalho é um agente de IA em vez de um pipeline fixo, direcione o nó Cliente MCP do n8n para o servidor MCP da Scrapeless e a mesma captura se torna uma ferramenta que o agente chama por conta própria.
  • Gratuito para começar. Novas contas Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.

Introdução: o motor de respostas se torna uma entrada de fluxo de trabalho

Os motores de resposta LLM agora estão entre os usuários e a web aberta, e as perguntas que uma marca se preocupa — quem é recomendado, quais fontes são citadas, qual preço aparece — são respondidas dentro do ChatGPT antes que qualquer página receba um clique. Ler essa superfície em um cronograma é um trabalho de coleta de dados, e o n8n já é onde muitas equipes realizam seus trabalhos de dados programados.

A fricção é que o ChatGPT não possui uma API de resposta oficial, e dirigir a interface de chat a partir de uma ferramenta de automação significa barreiras de login, respostas transmitidas, e campos que resolvem do lado do cliente após a resposta ser renderizada. O nó de Requisição HTTP do n8n pode chamar qualquer endpoint REST, mas não tem nada para chamar até que a renderização, egressão residencial e análise ocorram em outro lugar primeiro.

O Scrapeless LLM Chat Scraper é esse outro lugar: um POST retorna a resposta renderizada do ChatGPT como JSON, então o nó de Requisição HTTP tem um endpoint limpo para alcançar e o restante do fluxo de trabalho lê campos estruturados. Este post conecta o n8n a esse ator sem código — um Gatilho de Agendamento, um nó de Requisição HTTP, um ramo SE para execuções vazias e um nó de armazenamento — e mostra o caminho do nó agente para fluxos de trabalho que precisam do scraper como uma ferramenta de IA. Para a visão classificada dos próprios scrapers de motor de resposta, os melhores scrapers LLM comparam as superfícies lado a lado.

Uma nota sobre o escopo: o contrato de requisição abaixo é verificado contra o ator scraper.chatgpt ativo, e cada nome de parâmetro n8n é confirmado contra a referência atual do nó n8n. O fluxo de trabalho de ponta a ponta é descrito a partir dessas duas peças verificadas — este post não apresenta uma execução com captura de tela como prova.


O Que Você Pode Fazer Com Isso

  • Monitoramento de respostas agendadas. Execute um conjunto de prompts fixos a cada hora ou cada manhã e anexe cada resposta do ChatGPT a uma planilha, para que a deriva de respostas se torne uma série temporal em vez de uma verificação manual.
  • Rastreamento de citação. Leia task_result.search_result para as fontes que o ChatGPT consultou e faça a contagem dos domínios ao longo das execuções para ver quem o modelo continua citando na sua categoria.
  • Alertas de menção à marca. Ramifique se o texto da resposta menciona seu produto e direcione um nó Slack ou de e-mail a partir do SE quando uma menção aparecer ou desaparecer.
  • Captura multi-engine em um único fluxo de trabalho. Duplicar o nó de Requisição HTTP e trocar a string do ator para scraper.gemini ou scraper.perplexity — o envelope é idêntico, então os nós a montante não mudam.
  • Transferência de operações para não desenvolvedores. Uma vez que o fluxo de trabalho exista, um colega edita a lista de prompts em um nó de Definição ou em uma planilha sem tocar no código, e a captura continua a funcionar.
  • Chamadas de ferramentas do agente. Exponha o scraper através do nó Cliente MCP para que um agente de IA do n8n decida quando consultar um motor de resposta como parte de uma tarefa maior.

Por Que o Scrapeless LLM Chat Scraper para n8n

O Scrapeless LLM Chat Scraper é o ator scraper.chatgpt, parte da linha API de Raspagem Universal, e se encaixa no n8n porque é um POST autenticado com JSON de entrada e JSON de saída. Para um fluxo de trabalho sem código especificamente, ele traz:

  • Um único endpoint REST que o nó de Requisição HTTP chama diretamente — sem SDK a ser instalado no host n8n, sem navegador para manipular.
  • Renderização do lado do servidor, egressos residenciais e tratamento contra bots, para que o nó receba uma resposta final em vez de uma página de login.
  • O campo country na requisição, que define o mercado de egressos dentro do corpo JSON — um nó cobre a captura por mercado.
  • Um envelope { status, task_id, task_result } compartilhado entre scraper.chatgpt, scraper.gemini e scraper.perplexity, assim um nó funcional se duplica para os outros motores sem alterações.
  • Um cabeçalho x-api-token como a única autenticação — uma única credencial n8n ou valor de cabeçalho, reutilizável em todos os nós que chamam Scrapeless.

Obtenha sua chave de API no plano gratuito em app.scrapeless.com.


Pré-requisitos

  • Uma instância n8n (nuvem ou auto-hospedada) onde você pode adicionar um fluxo de trabalho.
  • Uma conta Scrapeless e chave de API — inscreva-se em app.scrapeless.com.
  • A chave de API disponível para colar no cabeçalho do nó de Requisição HTTP (ou armazenada como uma credencial n8n).
  • Um destino para as linhas capturadas — um nó Set, um nó do Google Sheets ou um nó de banco de dados como Postgres.

Nenhum runtime de linguagem, proxy ou solucionador de CAPTCHA é necessário; a requisição é HTTP simples e o trabalho pesado ocorre do lado Scrapeless.


O fluxo de trabalho em uma visão geral

Toda a captura consiste em quatro nós em uma linha:

Copy
Schedule Trigger  →  HTTP Request  →  IF  →  Set / Google Sheets / Postgres
   (intervalo)        (POST ator)      (vazio?)      (armazenar a resposta)

O Schedule Trigger dispara em um intervalo, o nó de Requisição HTTP chama scraper.chatgpt, o nó IF verifica se a resposta veio preenchida e o nó de armazenamento escreve a linha. O ramo vazio do nó IF é onde uma execução sem resposta é registrada e descartada — não enviada novamente. Cada nó abaixo nomeia apenas parâmetros que existem na referência atual do nó n8n.


Passo 1 — Schedule Trigger

O Schedule Trigger inicia o fluxo de trabalho em uma cadência fixa para que a captura ocorra sem ninguém pressionando play. Adicione um nó Schedule Trigger (tipo versão 1.3) e defina suas Regras de Disparo para um intervalo — a cada hora, a cada algumas horas ou uma vez por dia, dependendo da frequência com que as respostas que você monitora tendem a mudar. Para monitoramento de motores de resposta, diariamente ou duas vezes por dia geralmente é suficiente, uma vez que a série ao longo das semanas é o sinal, não a mudança minuto a minuto.

O disparo emite um item por vez. Se você quiser vários prompts por execução, siga-o com um nó Set que emita sua lista de prompts, ou leia os prompts de uma planilha — cada prompt então fluirá pelo nó de Requisição HTTP como seu próprio item.


Passo 2 — Nó de Requisição HTTP: chamar o ator

O nó de Requisição HTTP é a integração. Ele POSTa a chamada do ator para Scrapeless e retorna a resposta analisada para o fluxo de trabalho. Adicione um nó HTTP Request (tipo versão 4.4) e defina estes parâmetros:

  • MétodoPOST
  • URLhttps://api.scrapeless.com/api/v2/scraper/execute
  • Enviar Cabeçalhos → ativado. Adicione um cabeçalho: nome x-api-token, valor sua chave de API Scrapeless (ou referencie uma credencial n8n).
  • Enviar Corpo → ativado.
  • Tipo de Conteúdo do CorpoJSON.
  • Especificar CorpoUsando JSON, então cole a chamada do ator no campo JSON.

O corpo JSON é todo o contrato — o nome do ator mais um objeto input:

json Copy
{
  "actor": "scraper.chatgpt",
  "input": {
    "prompt": "melhores tênis de corrida 2026",
    "country": "BR",
    "web_search": true
  }
}

Para tornar o prompt dinâmico, substitua a string estática por uma expressão n8n que leia o item que chega — por exemplo, puxando prompt do nó Set ou da linha da planilha que alimentou este nó. country define o egressos residenciais para a execução, e web_search permite que o modelo puxe fontes ao vivo, o que melhora a frequência com que a resposta é resolvida. Cada campo fica dentro de input; enviar prompt ou country no nível superior do corpo é rejeitado pelo ator.

Defina o Tempo Limite do nó generosamente. Uma resposta renderizada pode demorar a voltar, então um tempo limite padrão curto cortará a chamada antes que a resposta chegue — dê espaço.

O nó retorna o envelope padrão, { status, task_id, task_result }, como o JSON do item. Nós a jusante leem a resposta de task_result.result_text e as fontes de task_result.search_result.

Obtenha sua chave de API no plano gratuito: app.scrapeless.com


Passo 3 — Nó IF: ramificação em uma resposta vazia

O nó IF decide se há algo a ser armazenado. As respostas do ChatGPT são geradas por sessão, então o mesmo prompt pode retornar uma resposta completa em uma execução e um task_result vazio na próxima — isso não é uma falha, é a ausência de resposta para essa consulta nesta execução. Adicione um nó IF (tipo versão 2.3) após o nó de Solicitação HTTP e escreva uma regra de Condições única que teste se o campo de resposta está vazio — por exemplo, verificando se a expressão task_result.result_text não está vazia.

  • Ramo Falso (resposta presente) → conecte ao nó de armazenamento na Etapa 4.
  • Ramo Verdadeiro (resposta vazia) → registre que a execução não produziu nada e pare. Um nó NoOp, ou um nó Set que escreva uma linha de marcador "execução vazia", é suficiente.

O ramo vazio não chama o ator novamente. A próxima execução programada é a próxima chance de uma resposta populada, e agregar as execuções que retornam a resposta é todo o padrão. Trate o resultado vazio como dados nulos, não como um erro a ser perseguido.


Etapa 4 — Armazene a resposta

O nó de armazenamento transforma cada resposta populada em uma linha que você pode consultar mais tarde. Conecte o ramo de resposta-presente do nó IF ao destino que se encaixa no programa:

  • Nó Set → molde o item para os campos que você mantém: o prompt, task_result.result_text, os domínios de origem de task_result.search_result, o task_id e um timestamp de captura. Útil como uma etapa de formato final mesmo quando outro nó faz a gravação.
  • Nó Google Sheets → anexe uma linha por execução para um log compartilhável, sem banco de dados, que não desenvolvedores possam ler e editar.
  • Nó Postgres (ou outro banco de dados) → insira em uma tabela quando a captura alimenta um armazém ou um painel.

Armazene task_id e o tempo de execução em cada linha. O comprimento da resposta, a contagem de citações e as fontes nomeadas mudam de execução para execução, então o valor é a série de capturas, não uma única resposta.


O nó oficial Scrapeless — e por que este guia usa Solicitação HTTP

O n8n tem um nó comunitário oficial Scrapeless (n8n-nodes-scrapeless). Instale-o, autentique uma vez com uma credencial Scrapeless, e ele fornece operações tipadas para três superfícies: Deep SerpApi (Google Search e Google Trends), a API Universal de Scraping (Web Unlocker) e o Crawler (Scrape e Crawl). Para qualquer um desses trabalhos, o nó é a escolha mais limpa — não há URL ou corpo JSON para construir manualmente.

Os atores LLM Chat Scraper — scraper.chatgpt, scraper.gemini, scraper.perplexity e scraper.aimode — não estão expostos como operações na versão atual do nó, então capturar a resposta de um motor de resposta é o caso em que o nó Solicitação HTTP é o caminho: ele chega diretamente a /api/v2/scraper/execute, que é exatamente o que os passos acima constroem. Se uma versão posterior do nó adicionar uma operação LLM, a credencial Scrapeless e a forma do fluxo de trabalho se mantêm — apenas o nó do meio muda.


A alternativa do nó agente: Cliente MCP + servidor MCP Scrapeless

Quando o fluxo de trabalho é um agente de IA em vez de um pipeline fixo, o nó Cliente MCP do n8n substitui a chamada HTTP construída manualmente. O nó Cliente MCP conecta-se a um servidor MCP e expõe as ferramentas desse servidor a um agente de IA do n8n, para que o agente as chame por conta própria quando sua razão precisar delas. Aponte-o para o servidor MCP Scrapeless e a captura do motor de resposta se torna uma das ferramentas que o agente pode invocar — o agente decide quando consultar o ChatGPT como parte de uma tarefa maior, em vez de você conectar a chamada em um ramo fixo.

Os dois caminhos atendem a necessidades diferentes. O nó Solicitação HTTP é a ferramenta certa para uma captura determinística e programada — mesmos prompts, mesma cadência, linhas previsíveis. O nó Cliente MCP é a ferramenta certa quando um agente deve escolher dinamicamente se e o que consultar. A superfície subjacente Scrapeless é a mesma; apenas quem dispara a chamada muda.


O que você recebe de volta

O nó Solicitação HTTP retorna o envelope padrão do ator como o item JSON. A resposta está sob task_result, com a prosa em result_text e as fontes consultadas em search_result. A forma abaixo é o que scraper.chatgpt retorna; os valores dos campos são uma amostra ilustrativa de uma execução ao vivo (texto e fontes ajustados).

json Copy
// O esquema é o que scraper.chatgpt retorna; os valores dos campos são uma amostra ilustrativa de uma execução ao vivo.
{
  "status": "success",
  "task_id": "…",
  "task_result": {
    "prompt": "melhores tênis de corrida 2026",
    "model": "gpt-5-mini",
    "result_text": "Aqui estão os melhores tênis de corrida em 2026, com base em testes recentes entre marcas principais (ASICS, Nike, HOKA, Adidas, Brooks, Saucony) …",
    "content_references": [],
    "search_result": [
      { "title": "10 Melhores Tênis de Corrida de 2026 | Testado e Classificado", "url": "https://…", "snippet": "…", "attribution": "outdoorgearlab.com" }
    ],
    "links": [],
    "web_search": true
  }
}

Algumas notas honestas sobre a leitura disso dentro do n8n:

  • Cada campo é anulável. result_text pode estar vazio e search_result pode ser um array vazio em uma execução dada — o nó IF da Etapa 3 existe exatamente para esse caso. Proteja-se contra campos ausentes em qualquer expressão que os leia.
  • search_result é a superfície de citação. Cada entrada possui um título, url, snippet e atribuição; extraia o host da URL em um nó Set e contabilize nas execuções para a participação na citação.
  • web_search ecoa o pedido. Reflete se a busca em fonte ao vivo estava ativada para a execução; mantenha como true no corpo para melhor resolução nos prompts de recomendação.
  • A saída varia de execução para execução. O comprimento da resposta e a contagem de fontes mudam para o mesmo prompt, que é o motivo pelo qual o timestamp de captura e o task_id pertencem a cada linha armazenada.

FAQ

P: Preciso escrever algum código para conectar o n8n ao LLM Chat Scraper?
Não. A integração é o nó de Requisição HTTP incorporado, configurado com um método POST, a URL /api/v2/scraper/execute, um cabeçalho x-api-token e um corpo JSON. Não há SDK para instalar no host do n8n e nenhum nó de função para escrever.

P: Onde coloco minha chave da API do Scrapeless no n8n?
No cabeçalho do nó de Requisição HTTP — habilite Enviar Cabeçalhos, adicione um cabeçalho chamado x-api-token, e defina seu valor como sua chave, ou faça referência a uma credencial n8n para que a chave não seja armazenada no próprio nó. O mesmo cabeçalho funciona em toda chamada Scrapeless no fluxo de trabalho.

P: Como envio vários prompts em uma única execução?
Siga o Gatilho de Agendamento com um nó Set que produz sua lista de prompts, ou leia os prompts de uma Planilha do Google. Cada prompt se torna seu próprio item e flui através do nó de Requisição HTTP separadamente, então uma execução captura todo o conjunto.

P: O que acontece quando a resposta vem vazia?
As respostas do ChatGPT são por sessão, então um task_result vazio significa que não há resposta para aquela consulta naquela execução. O ramo vazio do nó IF registra a operação não executada e para; a próxima execução agendada é a próxima chance de uma resposta preenchida. O fluxo de trabalho não reenvia a mesma chamada.

P: Posso capturar Gemini e Perplexity no mesmo fluxo de trabalho?
Sim. Duplicar o nó de Requisição HTTP e alterar a string do ator para scraper.gemini ou scraper.perplexity. O endpoint, cabeçalho e o envelope { status, task_id, task_result } são idênticos, então os nós IF e de armazenamento a jusante não mudam.

P: Quando devo usar o nó MCP Client em vez do nó de Requisição HTTP?
Use o nó de Requisição HTTP para uma captura fixa e agendada com prompts previsíveis. Use o nó MCP Client, apontando para o servidor Scrapeless MCP, quando um agente de IA do n8n deve decidir por conta própria se e o que consultar — o scraper então atua como uma ferramenta que o agente chama.

P: Preciso de um proxy ou um navegador rodando no meu host do n8n?
Não. Renderização, saída residencial e tratamento anti-bot são todos executados do lado do servidor no Scrapeless. O host do n8n apenas faz uma requisição HTTPS de saída; o campo country no corpo seleciona o mercado de saída.

P: Coletar respostas do ChatGPT é legal?
Os dados retornados são a resposta visivelmente pública que o ChatGPT mostra a qualquer usuário. Assim como em qualquer scraping, a legalidade depende da jurisdição e do uso — revise os termos relevantes e consulte um advogado antes de construir sobre isso, e colete apenas dados de resposta e fonte públicos, nunca dados pessoais.


Conclusão: uma captura em pé com quatro nós

Conectar o n8n ao Scrapeless LLM Chat Scraper se resume a um nó de Requisição HTTP: POST { actor, input } para /api/v2/scraper/execute com um cabeçalho x-api-token, ler task_result de volta, ramificar na execução vazia e armazenar a linha. Um Gatilho de Agendamento transforma isso em um monitor em pé, e o nó MCP Client transforma em uma ferramenta de agente quando o fluxo de trabalho precisa de uma. Mantenha o conjunto de prompts escopado, fixe o country por mercado, trate cada campo como anulável e armazene task_id além de um timestamp para que a série seja o sinal. Execute um conjunto fixo de prompts em um cronograma com créditos da Universal Scraping API, e o mecanismo de resposta se torna uma entrada limpa para o que o resto do fluxo de trabalho faz. O contrato de requisição e os nomes dos campos são confirmados com o LLM Chat Scraper ao vivo, e os parâmetros do nó em relação à referência atual do nó n8n.


Pronto para construir seu pipeline de dados de respostas de IA?

Junte-se à nossa comunidade para reivindicar um plano gratuito e se conectar com desenvolvedores que estão criando pipelines de dados de respostas de IA: Discord · Telegram.

Inscreva-se em app.scrapeless.com para créditos de teste gratuitos e direcione o fluxo de trabalho de quatro nós acima para os prompts, motores e mercados que seu programa acompanha.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Catálogo