🎯 कस्टमाइज़ करने योग्य, डिटेक्शन-प्रतिरोधी क्लाउड ब्राउज़र जो स्व-विकसित Chromium द्वारा संचालित है, वेब क्रॉलर और एआई एजेंट्स के लिए डिज़ाइन किया गया। 👉अभी आज़माएं
वापस ब्लॉग पर

वाटिर (रूबी) के साथ प्रॉक्सी को सेट अप और घुमाने का तरीका

Michael Lee
Michael Lee

Expert Network Defense Engineer

16-Dec-2025
एक त्वरित नज़र डालें

सुनिश्चित करें कि आपका Watir-आधारित वेब स्क्रैपिंग बाधा-मुक्त और स्केलेबल है Scrapeless के विश्वसनीय प्रॉक्सी समाधानों के साथ।

प्रमुख निष्कर्ष

  • Watir (Ruby में वेब एप्लिकेशन परीक्षण) वेब ऑटोमेशन और स्क्रैपिंग के लिए एक शक्तिशाली उपकरण है।
  • प्रॉक्सी Watir में आपके IP पते को छिपाने और एंटी-बॉट सिस्टमों से आपके स्क्रैपर को रोकने के लिए आवश्यक हैं।
  • आप Watir::Browser उदाहरण को प्रारंभ करते समय सीधे एक प्रॉक्सी कॉन्फ़िगर कर सकते हैं।
  • Ruby में एक सरल रैंडम प्रॉक्सी रोटेटर लागू करना आवश्यक है ताकि बिना प्रतिबंधित हुए कई अनुरोध किए जा सकें।
  • बड़े पैमाने पर, विश्वसनीय स्क्रैपिंग के लिए Scrapeless Proxy जैसी प्रीमियम सेवा की सिफारिश की जाती है जो स्वत: जटिल रोटेशन और IP स्वास्थ्य जांच को संभालती है।

Watir (Ruby) के साथ प्रॉक्सी सेट अप और घुमाने का तरीका

Watir (Ruby में वेब एप्लिकेशन परीक्षण) Ruby लाइब्रेरी का एक ओपन-सोर्स परिवार है जो Selenium WebDriver [1] के शीर्ष पर बनाया गया है, जिसे वेब ब्राउज़र का ऑटोमेशन करने के लिए डिज़ाइन किया गया है। यह Ruby में वेब स्क्रैपिंग के लिए एक अत्यधिक प्रभावी उपकरण है, लेकिन किसी भी ऑटोमेशन उपकरण की तरह, यह एंटी-बॉट उपायों का उपयोग करने वाली वेबसाइटों द्वारा अभी भी ब्लॉक किया जा सकता है।

इस ट्यूटोरियल में, आप यह सीखेंगे कि प्रॉक्सी सेट अप करने के आवश्यक चरण क्या हैं ताकि पता न चलने और प्रतिबंधों से बच सकें, यह सुनिश्चित करते हुए कि आपके वेब स्क्रैपिंग संचालन निर्बाध रूप से चलते रहें।

Watir के साथ एकल प्रॉक्सी सेट अप करें

शुरू करने के लिए, आपको Watir जेम स्थापित करना होगा:

bash Copy
gem install watir

इसके बाद, आइए हम एक बुनियादी स्क्रिप्ट बनाते हैं। हम हेडलेस मोड में एक नया क्रोम ब्राउज़र उदाहरण प्रारंभ करेंगे और HTTPBin [2] पर जाएँ, जो ग्राहक का IP पता लौटाता है।

scraper.rb

ruby Copy
require 'watir'

# ब्राउज़र प्रारंभ करें
browser = Watir::Browser.new :chrome, headless: true

# URL पर जाएँ
url = 'https://httpbin.io/ip'
browser.goto(url)

# पृष्ठ की सामग्री प्राप्त करें
page_content = browser.text
puts page_content

# ब्राउज़र बंद करें
browser.close

इस स्क्रिप्ट को चलाने पर आपके मशीन का वास्तविक IP पता दिखाई देगा, जो वेब स्क्रैपिंग के लिए एक खराब प्रथा है क्योंकि इससे आप तत्काल प्रतिबंधों के लिए उजागर होते हैं। आपके अनुरोध को छिपाने के लिए, हमें एक प्रॉक्सी को एकीकृत करना होगा।

प्रॉक्सी को एकीकृत करना

प्रॉक्सी का उपयोग करने के लिए, आपको प्रॉक्सी सेटिंग्स को परिभाषित करना होगा और उन्हें ब्राउज़र प्रारंभ करने के दौरान पास करना होगा। आप एक प्रॉक्सी एक सूची से प्राप्त कर सकते हैं सर्वश्रेष्ठ प्रॉक्सी प्रदाताओं

प्रॉक्सी सेटिंग्स को परिभाषित करें (उदाहरण IP और पोर्ट को अपने खुद के से बदलें):

scraper.rb

ruby Copy
# ...
# प्रॉक्सी परिभाषित करें
proxy = {
   http: '8.219.97.248:80',
   ssl: '8.219.97.248:80'
}

# प्रॉक्सी सेटिंग्स के साथ ब्राउज़र प्रारंभ करें
browser = Watir::Browser.new :chrome, headless: true, proxy: proxy
# ...

एकल प्रॉक्सी का उपयोग करने के लिए पूरा कोड इस प्रकार है:

scraper.rb

ruby Copy
require 'watir'

# प्रॉक्सी परिभाषित करें
proxy = {
   http: '8.219.97.248:80',
   ssl: '8.219.97.248:80'
}

# ब्राउज़र प्रारंभ करें
browser = Watir::Browser.new :chrome, headless: true, proxy: proxy

# URL पर जाएँ
url = 'http://httpbin.io/ip'
browser.goto(url)

# पृष्ठ की सामग्री प्राप्त करें
page_content = browser.text
puts page_content

# ब्राउज़र बंद करें
browser.close

आउटपुट अब प्रॉक्सी सर्वर के IP पते को दर्शाएगा, सफलतापूर्वक आपके मूल IP को छिपाते हुए।

Watir में घुमते हुए प्रॉक्सी जोड़ें

एकल प्रॉक्सी का उपयोग करना केवल एक अस्थायी समाधान है। यदि आप उस एक IP से कई अनुरोध करते हैं, तो आपकी गतिविधि अभी भी पहचानी जाएगी और अवरुद्ध की जाएगी। घुमते हुए प्रॉक्सी आवश्यक हैं ताकि आप कई IP पतों के माध्यम से अपने अनुरोधों को वितरित कर सकें, जिससे आपका स्क्रैपर अधिक मजबूत हो जाए।

आइए एक सरल रोटेटर बनाएं जो प्रत्येक ब्राउज़िंग सत्र के लिए एक पूर्वनिर्धारित सूची में से प्रॉक्सी को यादृच्छिक रूप से चुनता है।

पहले, अपनी प्रॉक्सी की सूची परिभाषित करें और लॉग शोर को कम करने के लिए Selenium WebDriver लॉगर को कॉन्फ़िगर करें:

scraper.rb

ruby Copy
require 'watir'
require 'logger'

# प्रॉक्सियों की सूची (अपनी खुद की सूची से बदलें)
proxies = [
  { http: '8.219.97.248:80', ssl: '8.219.97.248:80' },
  { http: '20.235.159.154:80', ssl: '20.235.159.154:80' },
  { http: '18.188.32.159:3128', ssl: '18.188.32.159:3128' },
]

# Selenium WebDriver लॉगर को कॉन्फ़िगर करें
logger = Selenium::WebDriver.logger
logger.ignore(:jwp_caps, :logger_info)

अगला, सूची में से यादृच्छिक रूप से प्रॉक्सी चुनने के लिए एक फ़ंक्शन परिभाषित करें:

scraper.rb

ruby Copy
# ...
# प्रॉक्सी घुमाने के लिए फ़ंक्शन

Here’s the translation of the provided text into Hindi:

ruby Copy
def get_rotating_proxy(proxies)
  proxies.sample
end
# ...

अंत में, अपने स्क्रिप्ट में रोटेशन लॉजिक को एक begin/rescue/ensure ब्लॉक का उपयोग करते हुए इंटीग्रेट करें ताकि मजबूत त्रुटि हैंडलिंग और सफाई की जा सके:

scraper.rb

ruby Copy
# ...
begin
  # यादृच्छिक रूप से चयनित प्रॉक्सी के साथ ब्राउज़र को प्रारंभ करें
  proxy = get_rotating_proxy(proxies)
  logger.info("प्रॉक्सी का उपयोग कर रहे हैं: #{proxy}")
  browser = Watir::Browser.new :chrome, headless: true, proxy: proxy

  # URL पर जाएं
  url = 'https://httpbin.io/ip'
  browser.goto(url)

  # पृष्ठ की सामग्री प्राप्त करें
  page_content = browser.text
  puts page_content

rescue => e
  # त्रुटि संभालें
  logger.error("एक त्रुटि हुई: #{e.message}")
ensure
  # ब्राउज़र बंद करें
  browser.close
end

इस संरचना में अपने कोड को लपेटने से, आप यह सुनिश्चित करते हैं कि प्रत्येक रन के लिए एक अलग प्रॉक्सी का उपयोग किया जाता है, और ब्राउज़र हमेशा बंद होता है, भले ही कोई त्रुटि हुई हो। यह एक विश्वसनीय स्क्रैपर बनाने की दिशा में एक मौलिक कदम है।

Scrapeless प्रॉक्सी के साथ स्वचालित प्रॉक्सी रोटेशन

फ्री प्रॉक्सीज़ की एक सूची के साथ मैनुअल रोटेशन शुरू करने के लिए एक अच्छे शुरुआत है, लेकिन यह पेशेवर या बड़े पैमाने पर वेब स्क्रैपिंग के लिए एक व्यवहार्य समाधान नहीं है। फ्री प्रॉक्सीज़ बदनाम रूप से धीमे, अविश्वसनीय होते हैं, और जल्दी बेकार हो जाते हैं। उच्च मात्रा के कार्यों के लिए, जैसे कि इंस्टाग्राम फॉलोवर डेटा को स्क्रैप करना या एक B2B लीड जनरेशन वर्कफ़्लो चलाना, आपको एक प्रीमियम सेवा की आवश्यकता होती है जो स्वचालित रूप से प्रॉक्सी प्रबंधन की जटिलता को संभालती है।

Scrapeless प्रॉक्सी एक उच्च-प्रदर्शन, स्वचालित समाधान प्रदान करता है जो Watir स्वचालन के लिए पूरी तरह से उपयुक्त है। एकल, प्रमाणित Scrapeless एंडपॉइंट के माध्यम से अपने सभी अनुरोधों को रूट करने के बजाय, आप केवल एक सूची का प्रबंधन करते हैं। यह सेवा स्वचालित रूप से रोटेशन, रिट्राईज़, और IP स्वास्थ्य जांच को संभालती है, यह सुनिश्चित करते हुए कि एक लगभग परफेक्ट सफलता दर हो।

यह तरीका आपको आपके Watir स्वचालन लॉजिक पर ध्यान केंद्रित करने की अनुमति देता है, यह जानते हुए कि आधारभूत प्रॉक्सी अवसंरचना मजबूत और विश्वसनीय है।

Scrapeless Watir के लिए आदर्श प्रॉक्सी क्यों है

  • स्वचालित रोटेशन: Scrapeless सभी IP रोटेशन को संभालता है, ऊपर दिखाए गए मैनुअल रूबी लॉजिक की आवश्यकता को समाप्त करता है।
  • उच्च सफलता दर: 90M+ रेजिडेंशियल IP का एक विशाल पूल का लाभ उठाते हुए, Scrapeless यह सुनिश्चित करता है कि आपके अनुरोध ब्लॉकों को बायपास करें।
  • सरलीकृत एकीकरण: अपने Watir स्क्रिप्ट के साथ एकल, प्रमाणित एंडपॉइंट का उपयोग करके एकीकृत करें, जिससे आपका कोड साफ और अधिक मजबूत हो।
  • डेटा पर ध्यान केंद्रित करें: आप डेटा निकालने के बजाय प्रॉक्सी मुद्दों को डिबग करने में अपना समय समर्पित कर सकते हैं।

Scrapeless रेजिडेंशियल नेटवर्क की विश्वसनीयता और गति का परीक्षण करने के लिए, आप आज ही एक निःशुल्क ट्रायल शुरू कर सकते हैं:

Watir के साथ Scrapeless की एकीकरण

जब आप Scrapeless जैसी प्रीमियम सेवा का उपयोग करते हैं, तो आपको प्रमाणीकरण विवरण शामिल करने की आवश्यकता होगी। यह प्रॉक्सी स्ट्रिंग के भीतर क्रेडेंशियल्स को पास करके किया जाता है।

ruby Copy
# अपने वास्तविक Scrapeless क्रेडेंशियल्स के साथ बदलें
PROXY_HOST = 'gate.scrapeless.com'
PROXY_PORT = 8000
PROXY_USER = 'your_username'
PROXY_PASS = 'your_password'

# प्रमाणित प्रॉक्सी स्ट्रिंग को परिभाषित करें
auth_proxy = "#{PROXY_USER}:#{PROXY_PASS}@#{PROXY_HOST}:#{PROXY_PORT}"

# प्रॉक्सी सेटिंग्स को परिभाषित करें
proxy = {
   http: auth_proxy,
   ssl: auth_proxy
}

# प्रमाणित प्रॉक्सी के साथ ब्राउज़र को प्रारंभ करें
browser = Watir::Browser.new :chrome, headless: true, proxy: proxy
# ... आपका Watir स्वचालन कोड

एक प्रीमियम प्रदाता का उपयोग करके, आप विश्वसनीय, उच्च-गुणवत्ता वाली प्रॉक्सीज़ तक पहुँच प्राप्त करते हैं जो रोटेशन और स्वास्थ्य जांच को स्वचालित रूप से संभालते हैं, जिससे आपके Watir स्क्रैपर को बाधा के बिना बड़े पैमाने पर चलाने की अनुमति मिलती है। यह किसी भी सफल डेटा निकालने वाली वेब स्क्रैपिंग सेवा के लिए एक मुख्य घटक है।

निष्कर्ष

एक प्रॉक्सी सेट करना वाटिर के साथ एक सीधी प्रक्रिया है जो एंटी-बॉट उपायों को बाइपास करने के लिए आवश्यक है। जबकि मैनुअल रोटेशन संभव है, गंभीर वेब स्क्रैपिंग के लिए सबसे मजबूत और स्केलेबल समाधान Scrapeless Proxy जैसे स्वचालित, प्रीमियम प्रॉक्सी सेवा का लाभ उठाना है। यह आपके वाटिर स्क्रिप्ट्स को घूमने वाले, उच्च गुणवत्ता वाले आईपी के एक विशाल पूल से लाभ उठाने की अनुमति देता है, जिससे उच्च सफलता दर सुनिश्चित होती है और आप डेटा निकालने के मूल कार्य पर ध्यान केंद्रित कर सकते हैं।

अक्सर पूछे जाने वाले सवाल (FAQ)

वाटिर क्या है?

वाटिर, जिसका पूरा नाम Web Application Testing in Ruby है, एक ओपन-सोर्स रूबी लाइब्रेरी का परिवार है जिसका उपयोग वेब ब्राउज़र्स को स्वचालित करने के लिए किया जाता है। यह आपको स्क्रिप्ट लिखने की अनुमति देता है जो उपयोगकर्ता की तरह वेब पृष्ठों के साथ इंटरैक्ट करती हैं, जिससे यह परीक्षण और वेब स्क्रैपिंग दोनों के लिए लोकप्रिय है।

मुझे वाटिर स्क्रैपिंग के लिए प्रॉक्सी की आवश्यकता क्यों है?

आपको अपने कंप्यूटर के असली आईपी पते को छिपाने के लिए प्रॉक्सी की आवश्यकता है। जब एक वाटिर स्क्रिप्ट बड़े पैमाने पर अनुरोध भेजती है, तो लक्षित वेबसाइट का एंटी-बॉट सिस्टम एकल आईपी से असामान्य ट्रैफ़िक पैटर्न का पता लगाएगा और इसे ब्लॉक कर देगा। एक प्रॉक्सी, विशेषकर घूमने वाला, इसे रोकता है क्योंकि यह अनुरोधों को कई विभिन्न उपयोगकर्ताओं से आने वाले दिखाता है।

क्या मैं वाटिर के साथ एक मुफ्त प्रॉक्सी का उपयोग कर सकता हूँ?

आप कर सकते हैं, लेकिन किसी भी गंभीर प्रोजेक्ट के लिए यह अत्यधिक निराशाजनक है। मुफ्त प्रॉक्सी आमतौर पर धीमे, अस्थिर होते हैं, उनकी सीमित अपटाइम होती है, और अक्सर प्रमुख वेबसाइटों द्वारा पहले ही ब्लैकलिस्ट किए जाते हैं। वे केवल बुनियादी परीक्षण या सीखने के उद्देश्यों के लिए उपयुक्त होते हैं। उत्पादन के लिए, आपको Scrapeless जैसी प्रीमियम सेवा का उपयोग करना चाहिए।

क्या वाटिर प्रॉक्सी प्रमाणीकरण का समर्थन करता है?

हाँ, वाटिर प्रॉक्सी प्रमाणीकरण का समर्थन करता है। एकीकरण उदाहरण में दिखाए अनुसार, आप Watir::Browser उदाहरण के लिए प्रॉक्सी सेटिंग्स को परिभाषित करते समय प्रॉक्सी स्ट्रिंग में सीधे उपयोगकर्ता नाम और पासवर्ड शामिल कर सकते हैं।

क्या वाटिर रूबी के लिए सेलेनियम से बेहतर है?

वाटिर सेलेनियम वेबड्राइवर के शीर्ष पर बनाया गया है और अक्सर इसे इसकी स्वच्छ, स्पष्ट API के कारण "रूबी-फ्रेंडली" माना जाता है। जो उपयोगकर्ता पहले से ही रूबी पारिस्थितिकी तंत्र में काम कर रहे हैं, उनके लिए, वाटिर ब्राउज़र के साथ इंटरैक्ट करने का एक अधिक प्रथागत और पठनीय तरीका प्रदान करता है, जबकि कच्चे सेलेनियम बाइंडिंग का उपयोग करने की तुलना में।


संदर्भ

[1] सेलेनियम वेबड्राइवर दस्तावेज
[2] HTTPBin सेवा
[3] ऑफिशियल रूबी प्रोग्रामिंग लैंग्वेज वेबसाइट
[4] वाटिर आधिकारिक वेबसाइट
[5] W3C HTTP प्रॉक्सी स्पेसिफिकेशन

स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।

सबसे लोकप्रिय लेख

सूची