🥳हमारे शक्तिशाली वेब स्क्रैपिंग टूलकिट तक पहुंचने के लिए स्क्रैपलेस समुदाय में शामिल हों और अपने निःशुल्क परीक्षण का दावा करें!
ब्लॉग पर वापस जाएँ

CAPTCHA कैसे काम करता है?

Ethan Brown
Ethan Brown

Advanced Bot Mitigation Engineer

25-Sep-2024

मशीन को यह प्रमाणित करने के लिए कि वे इंसान हैं, किसी ऐसे व्यक्ति को खोजना मुश्किल होगा जिसने कभी ऐसा नहीं किया होगा। जागरूकता के प्रमाण के रूप में अजीब पहेलियों को हल करने के लिए फायर हाइड्रेंट का उपयोग करना अजीब लग सकता है। इस निबंध को पढ़ने के बाद, यह इतना अजीब नहीं लगेगा। आप जल्द ही सीखने जा रहे हैं कि CAPTCHA कैसे काम करते हैं और आप उन्हें हल करके AI प्रशिक्षण में महत्वपूर्ण योगदान कैसे देते हैं। इसके अतिरिक्त, आप सीखेंगे कि reCAPTCHAs कैसे काम करते हैं।

CAPTCHA की आवश्यकता क्यों है?

कंप्यूटर और मनुष्यों को अलग करने के लिए पूरी तरह से स्वचालित सार्वजनिक ट्यूरिंग टेस्ट को इसके संक्षिप्त नाम CAPTCHA से जाना जाता है। इसे कभी-कभी मानव संपर्क प्रमाण (HIP) के रूप में भी जाना जाता है। CAPTCHA परीक्षण का उद्देश्य मनुष्यों और बॉट के बीच अंतर करना है। पारंपरिक CAPTCHA उपयोगकर्ताओं को अक्षरों, अंकों और अन्य वर्णों को फैलाकर और विकृत करके पाठ को पहचानने के लिए चुनौती देते हैं। जबकि यह कार्य मनुष्यों के लिए सरल प्रतीत हो सकता है, रोबोटों के लिए इसे पूरा करना मुश्किल हो सकता है।

आधुनिक कंप्यूटर के संस्थापक माने जाने वाले एलन ट्यूरिंग ने 1950 में ट्यूरिंग टेस्ट का अनावरण किया। इस मूल्यांकन का उद्देश्य यह प्रदर्शित करना था कि रोबोट मानव विचार प्रक्रियाओं की नकल कर सकते हैं या नहीं। एक पूछताछकर्ता परीक्षण के दौरान दो प्रतिभागियों से सवालों की एक श्रृंखला पूछता है। दो प्रतिभागी हैं: एक व्यक्ति और एक मशीन। पूछताछकर्ता को केवल अपनी प्रतिक्रियाओं के आधार पर धारणाएँ बनानी चाहिए क्योंकि उन्हें अनिश्चित है कि कौन है। यदि पूछताछकर्ता प्रतिभागियों की पहचान करने में असमर्थ है तो सिस्टम परीक्षण पास करता है।

जैसा कि नाम से पता चलता है, पारंपरिक CAPTCHA ट्यूरिंग परीक्षण पर आधारित है।

CAPTCHA कैसे संचालित होते हैं?

बॉट से लोगों की पहचान करना CAPTCHA का उद्देश्य है। CAPTCHA परीक्षण यह विभिन्न उपयोगकर्ताओं को अलग-अलग ग्राफिक्स दिखाकर करता है। यथासंभव कई अलग-अलग संस्करण प्रदान करने के लिए, CAPTCHA का एक विशाल डेटाबेस बनाए रखा जाता है। यदि समाधान हमेशा समान था या यदि इसे छवि की जानकारी में छिपाया गया था, तो एक मशीन CAPTCHA कोड को कुछ ही समय में तोड़ सकती है।

भले ही CAPTCHA केवल मनुष्यों द्वारा पूरा करने के लिए अभिप्रेत हैं, लेकिन हर कोई अपने पहले प्रयास में एक को पूरा नहीं कर सकता है। विशेषज्ञों का अनुमान है कि 80% CAPTCHA मनुष्यों द्वारा हल किए जा सकते हैं, जबकि 0.01% कंप्यूटर द्वारा पूरा किया जा सकता है।

चूँकि कंप्यूटर दृश्य डेटा का विश्लेषण करने में मनुष्यों जितने कुशल नहीं हैं, इसलिए अधिकांश पारंपरिक CAPTCHA परीक्षण दृश्य धारणा पर निर्भर करते हैं। अधिकांश लोग पैटर्न देखने और असंबंधित विषयों के बीच संबंध बनाने में काफी अच्छे होते हैं। पैरेडोलिया पैटर्न को पहचानने की क्षमता है जो पहले पहचाने जा चुके हैं जब वे नहीं होते हैं। उदाहरण के लिए, जब हमारे दिमाग जानकारी को पैटर्न से जोड़ने का प्रयास करते हैं, तो हम बादलों में पहचानने योग्य रूपों को पहचान सकते हैं।

दृष्टिबाधित व्यक्तियों के लिए, CAPTCHA ऑडियो प्रारूप में प्रदान किए जाते हैं। इन परीक्षणों को पास करने से बॉट को रोकने के लिए, ऑडियो में आमतौर पर कुछ पृष्ठभूमि शोर होता है।

CAPTCHA प्रकार

सामग्री के प्रकार के आधार पर, तीन प्रकार के CAPTCHA हैं: पाठ-आधारित, चित्र-आधारित और ध्वनि-आधारित।

पाठ-आधारित CAPTCHA

सबसे लोकप्रिय प्रकार कई औचित्य या अभिव्यक्तियों, वर्णों और संख्याओं को जोड़ता है।

वर्णों में बनावट वाली पृष्ठभूमि और प्रस्तुति के अजीब, विकृत तरीके हो सकते हैं, जिससे गैर-मनुष्यों के लिए पढ़ना अधिक चुनौतीपूर्ण हो जाता है।

पाठ CAPTCHA

चित्र-आधारित CAPTCHA

आमतौर पर सामान्य वस्तुओं को दर्शाते हुए वर्ग चित्रों का एक ग्रिड होता है। उपयोगकर्ता को आवश्यक तत्वों वाली तस्वीरों का चयन करना होगा। Google अक्सर स्ट्रीट व्यू से सामान्य चीजों जैसे क्रॉसवॉक और कुछ प्रकार के वाहनों को पहचानने के लिए कहता है। अधिकांश आगंतुक चित्र CAPTCHA को काफी तेजी से पूरा करते हैं। हालांकि, किसी वस्तु की पहचान करने के लिए, एक बॉट को एक लंबी तुलना विधि करनी होगी, जो उसके इच्छित लक्ष्य की ओर प्रगति में बाधा डालेगी। इमेजरी-आधारित परीक्षा की जटिलता के कारण, टेक्स्ट CAPTCHA की तुलना में चित्र CAPTCHA एक अधिक पसंदीदा एंटी-बॉट रणनीति है।

चित्र CAPTCHA

ऑडियो CAPTCHA

टेक्स्ट- और चित्र-आधारित CAPTCHA का उपयोग अक्सर ऑडियो CAPTCHA के साथ संयोजन में किया जाता है। साउंडट्रैक में पृष्ठभूमि शोर और प्रतीकों को वर्तनी करते हुए आवाज रिकॉर्डिंग शामिल है। शोर, जो आमतौर पर स्थैतिक जैसे विभिन्न तकनीकी शोर होते हैं, एक बाधा के रूप में कार्य करते हैं। बॉट ऑडियो CAPTCHA में पृष्ठभूमि शोर से हाइलाइट किए गए प्रतीकों को अलग नहीं कर सकते हैं।

ऑडियो CAPTCHA

reCAPTCHA: यह क्या है?

Google एक ऐसा उपकरण प्रदान करता है जिसे ReCAPTCHA कहा जाता है जो मानक CAPTCHA के समान उद्देश्य पूरा करता है। यह वेबसाइटों के लिए एक सामान्य मुफ्त वेब सुरक्षा समाधान है। आपने reCAPTCHAs के बारे में देखा होगा जहाँ उपयोगकर्ताओं को समस्या को हल करने के बजाय एक बॉक्स को चेक करने के लिए कहा जाता है। हम इन्हें "noCAPTCHA reCAPTCHA" के रूप में संदर्भित करते हैं। यदि उपयोगकर्ता बॉक्स को चेक करता है और सिस्टम अभी भी अनिश्चित है, तो उन्हें मानव के रूप में पहचान प्रदान करने के लिए कहा जाएगा।

reCAPTCHA

हम reCAPTCHAs का उपयोग कैसे करते हैं?

शुरू में, पुस्तकों को डिजिटल किया गया था, सड़क के नाम की तस्वीरों का उपयोग किया गया था, अखबार के पाठ के अंश लिए गए थे, और उपयोगकर्ताओं को शब्दों या शब्द संयोजनों को डिकोड करने के लिए कहा गया था। एक व्यक्ति आसानी से किसी चित्र से शब्दों की व्याख्या कर सकता है, लेकिन एक बॉट के लिए ऐसा करना मुश्किल होता है।

जैसे-जैसे कंप्यूटर अधिक उन्नत होते जाते हैं, reCAPTCHAs भी अधिक जटिल होते जाते हैं। समय के साथ, अन्य reCAPTCHA प्रकार बनाए गए हैं; इनमें चेकबॉक्स, चित्र पहचान और सामान्य उपयोगकर्ता व्यवहार आकलन शामिल हैं जिन्हें उपयोगकर्ता इनपुट की आवश्यकता नहीं होती है।

reCAPTCHA V2 और V3 की तुलना

यह सच होने के बावजूद, reCAPTCHA v3 केवल reCAPTCHA v2 का एक अधिक उन्नत संस्करण नहीं है। दोनों समाधान वास्तव में विभिन्न आवश्यकताओं को पूरा करते हैं और एक दूसरे से बहुत अलग हैं।

reCAPTCHA v2 को "मैं रोबोट नहीं हूँ" लेबल वाले बॉक्स को चेक करने के रूप में परिभाषित किया गया है। ज्यादातर मामलों में, यह परीक्षा के समापन को चिह्नित करता है; लेकिन, दुर्लभ अवसरों पर, किसी उपयोगकर्ता को अपनी पहचान सत्यापित करने के लिए एक अतिरिक्त परीक्षा देने की आवश्यकता हो सकती है।

क्योंकि reCAPTCHA v3 उन्नत जोखिम विश्लेषण और मशीन लर्निंग का उपयोग करके पृष्ठभूमि में काम करता है, आप यह भी नहीं जान सकते हैं कि यह मौजूद है। एक वेबमास्टर को reCAPTCHA v3 से उपयोगकर्ताओं के व्यवहार के आधार पर एक स्कोर प्राप्त होता है। आपको अपने स्कोर के आधार पर या तो बॉट या मानव के रूप में वर्गीकृत किया जाता है। स्कोर के साथ मानव होने की संभावना बढ़ जाती है। एक वेबमास्टर यह अंतिम निर्णय लेता है कि ब्लॉक करना है, परीक्षण जारी रखना है या पारित होने देना है।

V3 और V2 का उपयोग केवल विशिष्ट परिस्थितियों में किया जाता है। reCAPTCHA v2 छोटी वेबसाइटों के लिए उपयुक्त है जो स्वचालित आगंतुकों को प्रतिबंधित करना चाहती हैं। एक वेबसाइट में केवल दो लाइन HTML कोड के साथ v2 जोड़ा जा सकता है।

कृत्रिम बुद्धिमत्ता और CAPTCHAs

कृत्रिम बुद्धिमत्ता (AI) प्रशिक्षण को CAPTCHAs और reCAPTCHAs द्वारा पूरी तरह से उदाहरणित किया गया है। जैसा कि पहले कहा गया है, एल्गोरिथम यह निर्धारित करता है कि कोई उत्तर सही है या नहीं, अन्य उपयोगकर्ताओं की प्रतिक्रियाओं के आधार पर जब वह पूछता है, उदाहरण के लिए, तस्वीरों में प्रत्येक बिल्ली पर क्लिक करने के लिए।
इसके अतिरिक्त, यह डेटा AI को खिलाता है, जिससे कंप्यूटर तस्वीरों को अधिक सटीक रूप से पहचानने में सक्षम होते हैं।

कंप्यूटर के लिए छवियों को पहचानना मुश्किल होता है। उदाहरण के लिए, जब किसी तस्वीर को एक अलग दृष्टिकोण से कैप्चर किया जाता है, तो रोबोट मानव आंखों की तरह समान संघ नहीं बना सकते हैं। लेकिन आज की सबसे उन्नत तकनीक के साथ, कंप्यूटर अधिक जटिल होते जा रहे हैं, और मशीन लर्निंग के कारण रोबोट तेजी से बुद्धिमान होते जा रहे हैं।

क्या कोई CAPTCHA को बायपास कर सकता है?

CAPTCHAs को दरकिनार करके, इन परीक्षणों को बेहतर बनाया जा सकता है, और किसी समाधान को बेहतर बनाने का पहला कदम यह पता लगाना है कि यह कहाँ खराब है। हर बार जब कोई बॉट CAPTCHA पूरा करता है, तो वह बेहतर परीक्षा विकसित करने के करीब होता है। फिर भी, CAPTCHAs को दरकिनार करना एक कठिन चुनौती है।

ब्लैकलिस्ट में आना या CAPTCHA प्राप्त करना ऑनलाइन स्क्रैपिंग के साथ सामना की जाने वाली दो सबसे आम समस्याएं हैं। ये कठिनाइयाँ बड़े पैमाने पर सार्वजनिक डेटा संग्रह प्रयासों को बाधित कर सकती हैं। कुछ व्यवसाय जैसे स्क्रैपलेस ने पहले ही CAPTCHAs को दरकिनार करने के तरीके खोज लिए हैं।

क्या आप CAPTCHAs और निरंतर वेब स्क्रैपिंग ब्लॉक से थक गए हैं?

स्क्रैपलेस: उपलब्ध सबसे अच्छा ऑल-इन-वन ऑनलाइन स्क्रैपिंग समाधान!

अपने डेटा निष्कर्षण की पूरी क्षमता को उजागर करने के लिए हमारे शक्तिशाली टूलकिट का उपयोग करें:

सर्वश्रेष्ठ CAPTCHA सॉल्वर

जटिल CAPTCHAs का स्वचालित समाधान निरंतर और सुचारू स्क्रैपिंग सुनिश्चित करता है।

इसे मुफ्त में आज़माएं!

संक्षेप में

वेबसाइटों को स्पैम और दुरुपयोग से CAPTCHAs के माध्यम से बचाया जाता है। मानव उपयोगकर्ताओं और स्वचालित कार्यक्रमों के बीच अंतर करने के लिए, एक CAPTCHA एक ऐसा परीक्षण पेश करना चाहता है जिसे केवल लोगों द्वारा ही पूरा किया जाना चाहिए। ट्यूरिंग टेस्ट ने CAPTCHA के लिए प्रेरणा का काम किया।

Google ReCAPTCHAs नामक CAPTCHA समाधान प्रदान करता है। reCAPTCHA विभिन्न रूपों में आता है, और उनमें से कुछ को मानव भागीदारी की भी आवश्यकता नहीं होती है। reCAPTCHAs का सटीक कारण अज्ञात है, हालांकि संभावित कारणों में ब्राउज़र इतिहास, कुकी ट्रैकिंग और वास्तविक समय की वेबसाइट की व्यस्तता शामिल है।

चूँकि CAPTCHA का मुख्य उद्देश्य बॉट के लिए हल करना कठिन होना है, इसलिए कंप्यूटर पर इसे दरकिनार करना मुश्किल है। दूसरी ओर, कुछ समाधान- जैसे वेब स्क्रैपर एपीआई- आईपी प्रतिबंध या CAPTCHA के बिना वेब स्क्रैपिंग की अनुमति देते हैं।

स्क्रैपलेस में, हम लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से पालन करते हुए केवल सार्वजनिक रूप से उपलब्ध डेटा तक पहुंचते हैं। इस ब्लॉग की सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई भी अवैध या उल्लंघनकारी गतिविधियां शामिल नहीं हैं। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए कोई गारंटी नहीं देते हैं और सभी दायित्व से इनकार करते हैं। किसी भी स्क्रैपिंग गतिविधियों में शामिल होने से पहले, अपने कानूनी सलाहकार से परामर्श लें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।

सर्वाधिक लोकप्रिय लेख

सूची