🥳हमारे शक्तिशाली वेब स्क्रैपिंग टूलकिट तक पहुंचने के लिए स्क्रैपलेस कम्युनिटी और अपने नि: शुल्क परीक्षण का दावा करें!
वापस ब्लॉग पर

ऑटोमेटेड जॉब फ़ाइंडर एजेंट कैसे बनाएं जो स्क्रैपेलेस और गूगल शीट्स के साथ हो

Emily Chen
Emily Chen

Advanced Data Extraction Specialist

04-Jul-2025

नौकरियों की नई सूचियों के साथ अद्यतित रहना नौकरी के चाहने वालों, भर्ती करने वालों और तकनीकी उत्साही लोगों के लिए महत्वपूर्ण है। वेबसाइटों की मैन्युअल जांच करने के बजाय, आप पूरी प्रक्रिया को स्वचालित कर सकते हैं—नौकरी बोर्ड को नियमित अंतराल पर स्क्रैप करके और परिणामों को आसान ट्रैकिंग और साझा करने के लिए Google Sheets में सहेज सकते हैं।

यह गाइड आपको Scrapeless, n8n, और Google Sheets का उपयोग करके एक स्वचालित नौकरी खोजने वाले एजेंट को बनाने का तरीका दिखाएगी। आप एक वर्कफ़्लो बनाएंगे जो हर 6 घंटे में Y Combinator नौकरियों के पृष्ठ से नौकरी की सूचियों को स्क्रैप करता है, संरचित डेटा निकालता है, और उसे एक स्प्रेडशीट में संग्रहीत करता है।


पूर्वापेक्षाएँ

आरंभ करने से पहले, सुनिश्चित करें कि आपके पास:

  • n8n: एक नो-कोड स्वचालन प्लेटफ़ॉर्म (स्व-होस्टेड या क्लाउड)।
  • Scrapeless API: Scrapeless से अपना API कुंजी प्राप्त करें।
    1. लॉग इन करें Scrapeless डैशबोर्ड पर।
    2. फिर बाएँ ओर "Setting" पर क्लिक करें -> "API Key Management" चुनें -> "Create API Key" पर क्लिक करें। अंत में, आप द्वारा बनाए गए API कुंजी पर क्लिक करके इसे कॉपी करें।
scrapeless api key
  • Google Sheets खाता: नौकरी के डेटा को सहेजने और देखने के लिए।
  • लक्षित वेबसाइट: यह उदाहरण Y Combinator नौकरियों के पृष्ठ का उपयोग करता है।

Scrapeless और Google Sheets के साथ स्वचालित नौकरी खोजने वाले एजेंट का निर्माण कैसे करें

1. शेड्यूल ट्रिगर: हर 6 घंटे में चलाएं

नोड प्रकार: शेड्यूल ट्रिगर

सेटिंग्स:

  • अंतराल फ़ील्ड: hours
  • अंतराल मूल्य: 6
Schedule Trigger

यह नोड सुनिश्चित करता है कि आपका वर्कफ़्लो हर 6 घंटे में स्वचालित रूप से चलता है बिना मैन्युअल इनपुट के।


2. Scrapeless क्रॉलर: नौकरी की सूचियाँ स्क्रैप करें

नोड प्रकार: Scrapeless नोड

सेटिंग्स:

  • संसाधन: crawler
  • ऑपरेशन: crawl
  • URL: https://www.ycombinator.com/jobs
  • सीमित क्रॉल पृष्ठ: 2
  • प्रमाणीकरण: आपका Scrapeless API Key
Scrapeless Node

आउटपुट: Markdown प्रारूप में समृद्ध नौकरी डेटा वाले वस्तुओं का एक सरणी।


3. मार्कडाउन सामग्री निकालें

नोड प्रकार: जावास्क्रिप्ट कोड नोड

उद्देश्य: कच्चे क्रॉल परिणामों से केवल markdown फ़ील्ड निकालें।

Copy
const raw = items[0].json;
const output = raw.map(obj => ({
  json: {
    markdown: obj.markdown,
  }
}));
return output;
Extract Markdown Content

4. मार्कडाउन पार्स करें: परिचय और नौकरी की सूची निकालें

नोड प्रकार: जावास्क्रिप्ट कोड नोड

उद्देश्य: मार्कडाउन को एक परिचय और नौकरी के शीर्षकों और लिंक की संरचित सूची में विभाजित करना।

Copy
return items.map(item => {
  const md = item.json.markdown;
  const splitRegex = /^#{1,3}\s*.+jobs added recently\s*$/im;
  const parts = md.split(splitRegex);
  const introSectionRaw = parts[0] || '';
  const jobsSectionRaw = parts.slice(1).join('') || '';
  const intro = introSectionRaw.replace(/^#+\s*/gm, '').trim();

  const jobs = [];
  const re = /\-\s*\[(?!\!)([^\]]+)\]\((https?:\/\/[^\)]+)\)/g;
  let match;
  while ((match = re.exec(jobsSectionRaw))) {
    jobs.push({
      title: match[1].trim(),
      link: match[2].trim(),
    });
  }

  return {
    json: {
      intro,
      jobs,
    },
  };
});
JavaScript Code Node

5. निर्यात के लिए नौकरियों को समतल करें

नोड प्रकार: जावास्क्रिप्ट कोड नोड

उद्देश्य: प्रत्येक नौकरी को आसान निर्यात के लिए अलग-अलग पंक्तियों में परिवर्तित करना।

Copy
const output = [];
items.forEach(item => {
  const intro = item.json.intro;
  const jobs = item.json.jobs || [];
  jobs.forEach(job => {
    output.push({
      json: {
        intro,
        jobTitle: job.title,
        jobLink: job.link,
      },
    });
  });
});
return output;
JavaScript Code Node

6. Google Sheets में जोड़ें

नोड प्रकार: Google Sheets नोड

सेटिंग्स:

  • ऑपरेशन: append
  • दस्तावेज़ URL: आप सीधे उस Google Sheets का नाम भी चुन सकते हैं जो आपने बनाया (सिफारिश की गई विधि)
  • शीट नाम: Links (टैब ID: gid=0)
  • कॉलम मैपिंग:
    • title{{ $json.jobTitle }}
    • link{{ $json.jobLink }}
  • प्रकार रूपांतरित करें: false
  • OAuth: अपने Google Sheets खाते को कनेक्ट करें

अंतिम डेटा स्वचालित रूप से आपके शीट में जोड़ दिया जाता है ताकि आप इसका ट्रैक रख सकें या आगे विश्लेषण कर सकें।

Append to Google Sheets

7. परिणाम का उदाहरण

Output result example

कार्यप्रवाह आरेख

कार्यप्रवाह आरेख
स्क्रेपलेस और गूगल शीट्स के साथ एक स्वचालित नौकरी खोजक एजेंट कैसे बनाएं

प्रत्येक नोड मॉड्यूलर और अनुकूलनशील है। आवश्यकता अनुसार आप वेबसाइट, स्क्रैपिंग आवृत्ति, या डेटा प्रारूपण लॉजिक को बदल सकते हैं।


अनुकूलन विचार

  • अधिक साइटों को स्क्रैप करें: लिंक्डइन, एंजेललिस्ट, या अन्य नौकरी बोर्ड के साथ URL को बदलें।
  • सूचनाएँ जोड़ें: नौकरी अपडेट्स को स्लैक, डिस्कॉर्ड, या ईमेल पर भेजें।
  • AI के साथ बढ़ाएं: नौकरी के सारांश या कीवर्ड टैग उत्पन्न करने के लिए GPT नोड्स का उपयोग करें।

लागू व्यवसाय उपयोग मामले

यह स्वचालित नौकरी खोजक एजेंट विभिन्न व्यावसायिक परिदृश्यों में लागू किया जा सकता है, जिसमें शामिल हैं:

  • भर्ती एजेंसियाँ: अपने प्रतिभा पूल के लिए नए अवसर खोजने के लिए विशिष्ट नौकरी बोर्ड और कंपनी करियर पृष्ठों की निरंतर निगरानी करें।
  • स्टार्टअप इंक्यूबेटर और एक्सलेरेटर: पोर्टफोलियो कंपनियों (जैसे Y Combinator स्टार्टअप) की भर्ती गतिविधियों पर नज़र रखें और बाजार की मांग के बारे में सूचित रहें।
  • HR और प्रतिभा टीमें: प्रतिकूल कंपनियों या उद्योग के नेताओं से नौकरी पोस्टिंग को ट्रैक करके प्रतिस्पर्धात्मक बुद्धिमत्ता को स्वचालित करें।
  • नौकरी एग्रीगेटर प्लेटफ़ॉर्म: कई स्रोतों से नौकरियों को एकत्रित करें और मैनुअल स्क्रैपिंग के बिना अपने प्लेटफ़ॉर्म पर प्रकाशन को सुव्यवस्थित करें।
  • फ्रीलांस और दूरस्थ कार्य समुदाय: विशेष दर्शकों के लिए न्यूज़लेटर्स, सामुदायिक फ़ोरम, या नौकरी बोर्ड के लिए ताज़ा नौकरी लिस्टिंग का चयन करें।
  • मुद्रा अनुसंधान टीमें: विभिन्न उद्योगों में भर्ती रुझानों का विश्लेषण करें ताकि बाजार वृद्धि, मांग में तकनीकी स्टैक्स, या उभरती भूमिकाओं के बारे में जानकारी प्राप्त हो सके।

यह कार्यप्रवाह विशेष रूप से उन कंपनियों के लिए उपयोगी है जिन्हें नियमित, संरचित और स्केलेबल नौकरी बाजार की बुद्धिमत्ता की आवश्यकता होती है, जो अनगिनत घंटों की मैन्युअल प्रयासों को बचाती है और डेटा की सटीकता सुनिश्चित करती है।


स्वचालित नौकरी खोजक एजेंट कार्यप्रवाह

स्वचालित नौकरी खोजक एजेंट कार्यप्रवाह
n8n_workflow.json
• 37 KB
Scrapeless

निष्कर्ष

स्क्रेपलेस, n8n, और गूगल शीट्स के साथ, आप आसानी से एक पूरी तरह से स्वचालित नौकरी खोजक एजेंट बना सकते हैं जो नौकरी की सूची को स्क्रैप करता है, डेटा को साफ करता है, और उसे एक स्प्रेडशीट में सहेजता है। यह सेटअप लचीला, लागत-कुशल है, और उन व्यक्तियों, भर्तीकर्ताओं, या टीमों के लिए आदर्श है जो बिना मैन्युअल प्रयास के वास्तविक समय की नौकरी निगरानी करना चाहते हैं।

स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।

सबसे लोकप्रिय लेख

सूची