Como Construir um Agente de Busca de Emprego Automatizado com Scrapeless e Google Sheets

Advanced Data Extraction Specialist
Manter-se atualizado com novas oportunidades de emprego é fundamental para candidatos, recrutadores e entusiastas de tecnologia. Em vez de verificar manualmente os sites, você pode automatizar todo o processo — raspando quadros de empregos em intervalos regulares e salvando os resultados no Google Sheets para fácil rastreamento e compartilhamento.
Este guia mostrará como construir um agente automatizado de busca de empregos usando Scrapeless, n8n e Google Sheets. Você criará um fluxo de trabalho que raspa listagens de empregos da página de Empregos do Y Combinator a cada 6 horas, extrai dados estruturados e os armazena em uma planilha.
Pré-requisitos
Antes de começar, certifique-se de ter:
- n8n: Uma plataforma de automação sem código (auto-hospedada ou em nuvem).
- Scrapeless API: Obtenha sua chave da API do Scrapeless.
- Faça login no Painel do Scrapeless.
- Em seguida, clique em "Configurações" à esquerda -> selecione "Gerenciamento de Chave API" -> clique em "Criar Chave API". Por fim, clique na Chave API que você criou para copiá-la.

- Conta do Google Sheets: Para salvar e visualizar os dados de emprego.
- Site Alvo: Este exemplo usa a página de Empregos do Y Combinator.
Como Construir um Agente Automatizado de Busca de Empregos com Scrapeless e Google Sheets
1. Gatilho de Agendamento: Executar a Cada 6 Horas
Tipo de Nó: Gatilho de Agendamento
Configurações:
- Campo de Intervalo:
horas
- Valor do Intervalo:
6

Este nó garante que o seu fluxo de trabalho seja executado automaticamente a cada 6 horas, sem entrada manual.
2. Raspador Scrapeless: Raspando Listagens de Empregos
Tipo de Nó: Nó Scrapeless
Configurações:
- Recurso:
crawler
- Operação:
crawl
- URL:
https://www.ycombinator.com/jobs
- Limitar Páginas de Raspagem: 2
- Credenciais:
Sua Chave da API Scrapeless

Saída: Um array de objetos contendo dados ricos de empregos no formato Markdown.
3. Extrair Conteúdo Markdown
Tipo de Nó: Nó de Código JavaScript
Propósito: Extrair apenas o campo markdown
dos resultados brutos da raspagem.
const raw = items[0].json;
const output = raw.map(obj => ({
json: {
markdown: obj.markdown,
}
}));
return output;

4. Analisar Markdown: Extrair Introdução e Lista de Empregos
Tipo de Nó: Nó de Código JavaScript
Propósito: Separar o markdown em uma introdução e uma lista estruturada de títulos de empregos e links.
return items.map(item => {
const md = item.json.markdown;
const splitRegex = /^#{1,3}\s*.+jobs added recently\s*$/im;
const parts = md.split(splitRegex);
const introSectionRaw = parts[0] || '';
const jobsSectionRaw = parts.slice(1).join('') || '';
const intro = introSectionRaw.replace(/^#+\s*/gm, '').trim();
const jobs = [];
const re = /\-\s*\[(?!\!)([^\]]+)\]\((https?:\/\/[^\)]+)\)/g;
let match;
while ((match = re.exec(jobsSectionRaw))) {
jobs.push({
title: match[1].trim(),
link: match[2].trim(),
});
}
return {
json: {
intro,
jobs,
},
};
});

5. Achatar Empregos para Exportação
Tipo de Nó: Nó de Código JavaScript
Propósito: Converter cada emprego em uma linha separada para fácil exportação.
const output = [];
items.forEach(item => {
const intro = item.json.intro;
const jobs = item.json.jobs || [];
jobs.forEach(job => {
output.push({
json: {
intro,
jobTitle: job.title,
jobLink: job.link,
},
});
});
});
return output;

6. Adicionar ao Google Sheets
Tipo de Nó: Nó do Google Sheets
Configurações:
- Operação:
append
- URL do Documento: Você também pode selecionar diretamente o nome da Planilha do Google que você criou (método recomendado)
- Nome da Planilha:
Links
(ID da Aba:gid=0
) - Mapeamento de Colunas:
title
←{{ $json.jobTitle }}
link
←{{ $json.jobLink }}
- Converter Tipos:
false
- OAuth: Conecte sua conta do Google Sheets
Os dados finais são automaticamente adicionados à sua planilha para rastreamento ou análise posterior.

7. Exemplo de resultado de saída

Diagrama do Fluxo de Trabalho


Cada nó é modular e personalizável. Você pode alterar o site, a frequência de raspagem ou a lógica de formatação dos dados conforme necessário.
Ideias de Personalização
- Raspar Mais Sites: Substitua a URL pelo LinkedIn, AngelList ou outros sites de empregos.
- Adicionar Notificações: Envie atualizações de empregos para Slack, Discord ou e-mail.
- Aprimorar com IA: Use nós GPT para gerar resumos de empregos ou tags de palavras-chave.
Casos de Uso Empresarial Aplicáveis
Este agente de busca de empregos automatizado pode ser aplicado em diversos cenários de negócios, incluindo:
- Agências de Recrutamento: Monitorar continuamente sites de empregos de nicho e páginas de carreira de empresas para descobrir novas vagas para seu banco de talentos.
- Incubadoras e Aceleradoras de Startups: Acompanhar as atividades de contratações das empresas do portfólio (como startups do Y Combinator) e se manter informado sobre a demanda de mercado.
- Equipes de RH e Talentos: Automatizar a inteligência competitiva ao rastrear anúncios de empregos de empresas rivais ou líderes do setor.
- Plataformas Agregadoras de Empregos: Agregar empregos de múltiplas fontes e simplificar a publicação em suas próprias plataformas sem raspagem manual.
- Comunidades de Trabalho Freelance e Remoto: Selecionar novas listas de empregos para newsletters, fóruns comunitários ou sites de empregos voltados para públicos específicos.
- Equipes de Pesquisa de Mercado: Analisar tendências de contratações em diferentes indústrias para obter insights sobre crescimento de mercado, pilhas de tecnologia em demanda ou funções emergentes.
Esse fluxo de trabalho é especialmente útil para empresas que precisam de inteligência de mercado de trabalho regular, estruturada e escalável, economizando inúmeras horas de esforço manual e garantindo a precisão dos dados.
Fluxo de Trabalho do Agente de Busca de Empregos Automatizado
Conclusão
Com Scrapeless, n8n e Google Sheets, você pode facilmente construir um agente de busca de empregos totalmente automatizado que raspa listas de empregos, limpa os dados e salva em uma planilha. Essa configuração é flexível, econômica e ideal para indivíduos, recrutadores ou equipes que desejam monitoramento de empregos em tempo real sem esforço manual.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.