ऑटोमेटेड जॉब फ़ाइंडर एजेंट कैसे बनाएं जो स्क्रैपेलेस और गूगल शीट्स के साथ हो

Advanced Data Extraction Specialist
नौकरियों की नई सूचियों के साथ अद्यतित रहना नौकरी के चाहने वालों, भर्ती करने वालों और तकनीकी उत्साही लोगों के लिए महत्वपूर्ण है। वेबसाइटों की मैन्युअल जांच करने के बजाय, आप पूरी प्रक्रिया को स्वचालित कर सकते हैं—नौकरी बोर्ड को नियमित अंतराल पर स्क्रैप करके और परिणामों को आसान ट्रैकिंग और साझा करने के लिए Google Sheets में सहेज सकते हैं।
यह गाइड आपको Scrapeless, n8n, और Google Sheets का उपयोग करके एक स्वचालित नौकरी खोजने वाले एजेंट को बनाने का तरीका दिखाएगी। आप एक वर्कफ़्लो बनाएंगे जो हर 6 घंटे में Y Combinator नौकरियों के पृष्ठ से नौकरी की सूचियों को स्क्रैप करता है, संरचित डेटा निकालता है, और उसे एक स्प्रेडशीट में संग्रहीत करता है।
पूर्वापेक्षाएँ
आरंभ करने से पहले, सुनिश्चित करें कि आपके पास:
- n8n: एक नो-कोड स्वचालन प्लेटफ़ॉर्म (स्व-होस्टेड या क्लाउड)।
- Scrapeless API: Scrapeless से अपना API कुंजी प्राप्त करें।
- लॉग इन करें Scrapeless डैशबोर्ड पर।
- फिर बाएँ ओर "Setting" पर क्लिक करें -> "API Key Management" चुनें -> "Create API Key" पर क्लिक करें। अंत में, आप द्वारा बनाए गए API कुंजी पर क्लिक करके इसे कॉपी करें।

- Google Sheets खाता: नौकरी के डेटा को सहेजने और देखने के लिए।
- लक्षित वेबसाइट: यह उदाहरण Y Combinator नौकरियों के पृष्ठ का उपयोग करता है।
Scrapeless और Google Sheets के साथ स्वचालित नौकरी खोजने वाले एजेंट का निर्माण कैसे करें
1. शेड्यूल ट्रिगर: हर 6 घंटे में चलाएं
नोड प्रकार: शेड्यूल ट्रिगर
सेटिंग्स:
- अंतराल फ़ील्ड:
hours
- अंतराल मूल्य:
6

यह नोड सुनिश्चित करता है कि आपका वर्कफ़्लो हर 6 घंटे में स्वचालित रूप से चलता है बिना मैन्युअल इनपुट के।
2. Scrapeless क्रॉलर: नौकरी की सूचियाँ स्क्रैप करें
नोड प्रकार: Scrapeless नोड
सेटिंग्स:
- संसाधन:
crawler
- ऑपरेशन:
crawl
- URL:
https://www.ycombinator.com/jobs
- सीमित क्रॉल पृष्ठ: 2
- प्रमाणीकरण:
आपका Scrapeless API Key

आउटपुट: Markdown प्रारूप में समृद्ध नौकरी डेटा वाले वस्तुओं का एक सरणी।
3. मार्कडाउन सामग्री निकालें
नोड प्रकार: जावास्क्रिप्ट कोड नोड
उद्देश्य: कच्चे क्रॉल परिणामों से केवल markdown
फ़ील्ड निकालें।
const raw = items[0].json;
const output = raw.map(obj => ({
json: {
markdown: obj.markdown,
}
}));
return output;

4. मार्कडाउन पार्स करें: परिचय और नौकरी की सूची निकालें
नोड प्रकार: जावास्क्रिप्ट कोड नोड
उद्देश्य: मार्कडाउन को एक परिचय और नौकरी के शीर्षकों और लिंक की संरचित सूची में विभाजित करना।
return items.map(item => {
const md = item.json.markdown;
const splitRegex = /^#{1,3}\s*.+jobs added recently\s*$/im;
const parts = md.split(splitRegex);
const introSectionRaw = parts[0] || '';
const jobsSectionRaw = parts.slice(1).join('') || '';
const intro = introSectionRaw.replace(/^#+\s*/gm, '').trim();
const jobs = [];
const re = /\-\s*\[(?!\!)([^\]]+)\]\((https?:\/\/[^\)]+)\)/g;
let match;
while ((match = re.exec(jobsSectionRaw))) {
jobs.push({
title: match[1].trim(),
link: match[2].trim(),
});
}
return {
json: {
intro,
jobs,
},
};
});

5. निर्यात के लिए नौकरियों को समतल करें
नोड प्रकार: जावास्क्रिप्ट कोड नोड
उद्देश्य: प्रत्येक नौकरी को आसान निर्यात के लिए अलग-अलग पंक्तियों में परिवर्तित करना।
const output = [];
items.forEach(item => {
const intro = item.json.intro;
const jobs = item.json.jobs || [];
jobs.forEach(job => {
output.push({
json: {
intro,
jobTitle: job.title,
jobLink: job.link,
},
});
});
});
return output;

6. Google Sheets में जोड़ें
नोड प्रकार: Google Sheets नोड
सेटिंग्स:
- ऑपरेशन:
append
- दस्तावेज़ URL: आप सीधे उस Google Sheets का नाम भी चुन सकते हैं जो आपने बनाया (सिफारिश की गई विधि)
- शीट नाम:
Links
(टैब ID:gid=0
) - कॉलम मैपिंग:
title
←{{ $json.jobTitle }}
link
←{{ $json.jobLink }}
- प्रकार रूपांतरित करें:
false
- OAuth: अपने Google Sheets खाते को कनेक्ट करें
अंतिम डेटा स्वचालित रूप से आपके शीट में जोड़ दिया जाता है ताकि आप इसका ट्रैक रख सकें या आगे विश्लेषण कर सकें।

7. परिणाम का उदाहरण

कार्यप्रवाह आरेख


प्रत्येक नोड मॉड्यूलर और अनुकूलनशील है। आवश्यकता अनुसार आप वेबसाइट, स्क्रैपिंग आवृत्ति, या डेटा प्रारूपण लॉजिक को बदल सकते हैं।
अनुकूलन विचार
- अधिक साइटों को स्क्रैप करें: लिंक्डइन, एंजेललिस्ट, या अन्य नौकरी बोर्ड के साथ URL को बदलें।
- सूचनाएँ जोड़ें: नौकरी अपडेट्स को स्लैक, डिस्कॉर्ड, या ईमेल पर भेजें।
- AI के साथ बढ़ाएं: नौकरी के सारांश या कीवर्ड टैग उत्पन्न करने के लिए GPT नोड्स का उपयोग करें।
लागू व्यवसाय उपयोग मामले
यह स्वचालित नौकरी खोजक एजेंट विभिन्न व्यावसायिक परिदृश्यों में लागू किया जा सकता है, जिसमें शामिल हैं:
- भर्ती एजेंसियाँ: अपने प्रतिभा पूल के लिए नए अवसर खोजने के लिए विशिष्ट नौकरी बोर्ड और कंपनी करियर पृष्ठों की निरंतर निगरानी करें।
- स्टार्टअप इंक्यूबेटर और एक्सलेरेटर: पोर्टफोलियो कंपनियों (जैसे Y Combinator स्टार्टअप) की भर्ती गतिविधियों पर नज़र रखें और बाजार की मांग के बारे में सूचित रहें।
- HR और प्रतिभा टीमें: प्रतिकूल कंपनियों या उद्योग के नेताओं से नौकरी पोस्टिंग को ट्रैक करके प्रतिस्पर्धात्मक बुद्धिमत्ता को स्वचालित करें।
- नौकरी एग्रीगेटर प्लेटफ़ॉर्म: कई स्रोतों से नौकरियों को एकत्रित करें और मैनुअल स्क्रैपिंग के बिना अपने प्लेटफ़ॉर्म पर प्रकाशन को सुव्यवस्थित करें।
- फ्रीलांस और दूरस्थ कार्य समुदाय: विशेष दर्शकों के लिए न्यूज़लेटर्स, सामुदायिक फ़ोरम, या नौकरी बोर्ड के लिए ताज़ा नौकरी लिस्टिंग का चयन करें।
- मुद्रा अनुसंधान टीमें: विभिन्न उद्योगों में भर्ती रुझानों का विश्लेषण करें ताकि बाजार वृद्धि, मांग में तकनीकी स्टैक्स, या उभरती भूमिकाओं के बारे में जानकारी प्राप्त हो सके।
यह कार्यप्रवाह विशेष रूप से उन कंपनियों के लिए उपयोगी है जिन्हें नियमित, संरचित और स्केलेबल नौकरी बाजार की बुद्धिमत्ता की आवश्यकता होती है, जो अनगिनत घंटों की मैन्युअल प्रयासों को बचाती है और डेटा की सटीकता सुनिश्चित करती है।
स्वचालित नौकरी खोजक एजेंट कार्यप्रवाह
निष्कर्ष
स्क्रेपलेस, n8n, और गूगल शीट्स के साथ, आप आसानी से एक पूरी तरह से स्वचालित नौकरी खोजक एजेंट बना सकते हैं जो नौकरी की सूची को स्क्रैप करता है, डेटा को साफ करता है, और उसे एक स्प्रेडशीट में सहेजता है। यह सेटअप लचीला, लागत-कुशल है, और उन व्यक्तियों, भर्तीकर्ताओं, या टीमों के लिए आदर्श है जो बिना मैन्युअल प्रयास के वास्तविक समय की नौकरी निगरानी करना चाहते हैं।
स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।