🥳Junte-se à Comunidade Scrapeless e reivindique sua avaliação gratuita para acessar nossa poderosa ferramenta de raspagem da web!
De volta ao blog

Como Construir um Agente de Busca de Emprego Automatizado com Scrapeless e Google Sheets

Emily Chen
Emily Chen

Advanced Data Extraction Specialist

04-Jul-2025

Manter-se atualizado com novas oportunidades de emprego é fundamental para candidatos, recrutadores e entusiastas de tecnologia. Em vez de verificar manualmente os sites, você pode automatizar todo o processo — raspando quadros de empregos em intervalos regulares e salvando os resultados no Google Sheets para fácil rastreamento e compartilhamento.

Este guia mostrará como construir um agente automatizado de busca de empregos usando Scrapeless, n8n e Google Sheets. Você criará um fluxo de trabalho que raspa listagens de empregos da página de Empregos do Y Combinator a cada 6 horas, extrai dados estruturados e os armazena em uma planilha.


Pré-requisitos

Antes de começar, certifique-se de ter:

  • n8n: Uma plataforma de automação sem código (auto-hospedada ou em nuvem).
  • Scrapeless API: Obtenha sua chave da API do Scrapeless.
    1. Faça login no Painel do Scrapeless.
    2. Em seguida, clique em "Configurações" à esquerda -> selecione "Gerenciamento de Chave API" -> clique em "Criar Chave API". Por fim, clique na Chave API que você criou para copiá-la.
chave api scrapeless
  • Conta do Google Sheets: Para salvar e visualizar os dados de emprego.
  • Site Alvo: Este exemplo usa a página de Empregos do Y Combinator.

Como Construir um Agente Automatizado de Busca de Empregos com Scrapeless e Google Sheets

1. Gatilho de Agendamento: Executar a Cada 6 Horas

Tipo de Nó: Gatilho de Agendamento

Configurações:

  • Campo de Intervalo: horas
  • Valor do Intervalo: 6
Gatilho de Agendamento

Este nó garante que o seu fluxo de trabalho seja executado automaticamente a cada 6 horas, sem entrada manual.


2. Raspador Scrapeless: Raspando Listagens de Empregos

Tipo de Nó: Nó Scrapeless

Configurações:

  • Recurso: crawler
  • Operação: crawl
  • URL: https://www.ycombinator.com/jobs
  • Limitar Páginas de Raspagem: 2
  • Credenciais: Sua Chave da API Scrapeless
Nó Scrapeless

Saída: Um array de objetos contendo dados ricos de empregos no formato Markdown.


3. Extrair Conteúdo Markdown

Tipo de Nó: Nó de Código JavaScript

Propósito: Extrair apenas o campo markdown dos resultados brutos da raspagem.

Copy
const raw = items[0].json;
const output = raw.map(obj => ({
  json: {
    markdown: obj.markdown,
  }
}));
return output;
Extrair Conteúdo Markdown

4. Analisar Markdown: Extrair Introdução e Lista de Empregos

Tipo de Nó: Nó de Código JavaScript

Propósito: Separar o markdown em uma introdução e uma lista estruturada de títulos de empregos e links.

Copy
return items.map(item => {
  const md = item.json.markdown;
  const splitRegex = /^#{1,3}\s*.+jobs added recently\s*$/im;
  const parts = md.split(splitRegex);
  const introSectionRaw = parts[0] || '';
  const jobsSectionRaw = parts.slice(1).join('') || '';
  const intro = introSectionRaw.replace(/^#+\s*/gm, '').trim();

  const jobs = [];
  const re = /\-\s*\[(?!\!)([^\]]+)\]\((https?:\/\/[^\)]+)\)/g;
  let match;
  while ((match = re.exec(jobsSectionRaw))) {
    jobs.push({
      title: match[1].trim(),
      link: match[2].trim(),
    });
  }

  return {
    json: {
      intro,
      jobs,
    },
  };
});
Nó de Código JavaScript

5. Achatar Empregos para Exportação

Tipo de Nó: Nó de Código JavaScript

Propósito: Converter cada emprego em uma linha separada para fácil exportação.

Copy
const output = [];
items.forEach(item => {
  const intro = item.json.intro;
  const jobs = item.json.jobs || [];
  jobs.forEach(job => {
    output.push({
      json: {
        intro,
        jobTitle: job.title,
        jobLink: job.link,
      },
    });
  });
});
return output;
Nó de Código JavaScript

6. Adicionar ao Google Sheets

Tipo de Nó: Nó do Google Sheets

Configurações:

  • Operação: append
  • URL do Documento: Você também pode selecionar diretamente o nome da Planilha do Google que você criou (método recomendado)
  • Nome da Planilha: Links (ID da Aba: gid=0)
  • Mapeamento de Colunas:
    • title{{ $json.jobTitle }}
    • link{{ $json.jobLink }}
  • Converter Tipos: false
  • OAuth: Conecte sua conta do Google Sheets

Os dados finais são automaticamente adicionados à sua planilha para rastreamento ou análise posterior.

Adicionar ao Google Sheets

7. Exemplo de resultado de saída

Exemplo de resultado de saída

Diagrama do Fluxo de Trabalho

Diagrama de Fluxo de Trabalho
Como Construir um Agente de Busca de Empregos Automatizado com Scrapeless e Google Sheets

Cada nó é modular e personalizável. Você pode alterar o site, a frequência de raspagem ou a lógica de formatação dos dados conforme necessário.


Ideias de Personalização

  • Raspar Mais Sites: Substitua a URL pelo LinkedIn, AngelList ou outros sites de empregos.
  • Adicionar Notificações: Envie atualizações de empregos para Slack, Discord ou e-mail.
  • Aprimorar com IA: Use nós GPT para gerar resumos de empregos ou tags de palavras-chave.

Casos de Uso Empresarial Aplicáveis

Este agente de busca de empregos automatizado pode ser aplicado em diversos cenários de negócios, incluindo:

  • Agências de Recrutamento: Monitorar continuamente sites de empregos de nicho e páginas de carreira de empresas para descobrir novas vagas para seu banco de talentos.
  • Incubadoras e Aceleradoras de Startups: Acompanhar as atividades de contratações das empresas do portfólio (como startups do Y Combinator) e se manter informado sobre a demanda de mercado.
  • Equipes de RH e Talentos: Automatizar a inteligência competitiva ao rastrear anúncios de empregos de empresas rivais ou líderes do setor.
  • Plataformas Agregadoras de Empregos: Agregar empregos de múltiplas fontes e simplificar a publicação em suas próprias plataformas sem raspagem manual.
  • Comunidades de Trabalho Freelance e Remoto: Selecionar novas listas de empregos para newsletters, fóruns comunitários ou sites de empregos voltados para públicos específicos.
  • Equipes de Pesquisa de Mercado: Analisar tendências de contratações em diferentes indústrias para obter insights sobre crescimento de mercado, pilhas de tecnologia em demanda ou funções emergentes.

Esse fluxo de trabalho é especialmente útil para empresas que precisam de inteligência de mercado de trabalho regular, estruturada e escalável, economizando inúmeras horas de esforço manual e garantindo a precisão dos dados.


Fluxo de Trabalho do Agente de Busca de Empregos Automatizado

Fluxo de Trabalho do Agente de Busca de Empregos Automatizado
n8n_workflow.json
• 37 KB
Scrapeless

Conclusão

Com Scrapeless, n8n e Google Sheets, você pode facilmente construir um agente de busca de empregos totalmente automatizado que raspa listas de empregos, limpa os dados e salva em uma planilha. Essa configuração é flexível, econômica e ideal para indivíduos, recrutadores ou equipes que desejam monitoramento de empregos em tempo real sem esforço manual.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Catálogo