स्क्रेपलेस LLM चैट स्क्रैपर
Expert Network Defense Engineer
जैसे-जैसे एआई खोज पारंपरिक खोज इंजनों को प्रतिस्थापित करती है, अधिक उपयोगकर्ता प्रश्न, सामग्री और निर्णय-निर्माण मदों के अंदर मॉडल जैसे ChatGPT, Perplexity, Copilot, Gemini, और Google AI Overviews में होते हैं। ब्रांडों और टीमों को इन एआई इंजनों से वास्तविक-समय अंतर्दृष्टियों को एकत्र करने, विश्लेषण करने और मॉनिटर करने का एक तरीका चाहिए—जिसमें प्रम्प्ट, उत्तर, उद्धरण, रैंकिंग, रुझान और प्रतिस्पर्धियों का उल्लेख शामिल है।
LLM Chat Scraper API बिल्कुल इसी उद्देश्य के लिए बनाया गया है।
यह सभी प्रमुख एआई मॉडलों से संरचित, वास्तविक-समय डेटा निकालने के लिए एक एकीकृत स्क्रैपिंग इंटरफेस प्रदान करता है—जिससे आप परिणामों का उपयोग GEO (जनरेटिव इंजन ऑप्टिमाइज़ेशन), प्रतिस्पर्धी निगरानी, सामग्री रणनीति ऑप्टिमाइज़ेशन और खोज बुद्धिमत्ता के लिए कर सकते हैं।
शुरू करने के लिए
LLM Chat Scraper API का उपयोग दो सरल चरणों में होता है:
चरण 1: एक कार्य बनाएं
स्क्रैपिंग कार्य बनाने के लिए एक POST अनुरोध भेजें। यदि webhook.url निर्दिष्ट किया गया है, तो परिणाम स्वचालित रूप से कार्य पूर्ण होने पर भेजा जाएगा।
अनुरोध उदाहरण
bash
curl '{api_host}/api/v2/scraper/request' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}' \
--data '{
"actor": "scraper.chatgpt",
"input": {
"prompt": "डेटा निष्कर्षण के लिए सबसे विश्वसनीय प्रॉक्सी सेवा",
"country": "US",
"web_search": true
},
"webhook": {
"url": "http://www.youwebhook.com"
}
}'
चरण 2: परिणाम प्राप्त करें
परिणाम 5 मिनट के लिए संग्रहीत किए जाते हैं। सुनिश्चित करें कि आप उन्हें शीघ्रता से प्राप्त करें।
अनुरोध उदाहरण
bash
curl --request GET '{api_host}/api/v2/scraper/result/{task_id}' \
--header 'Content-Type: application/json' \
--header 'x-api-token: {you_api_key}'
सामान्य पैरामीटर
| पैरामीटर | प्रकार | आवश्यक | विवरण |
|---|---|---|---|
| actor | string | सही | स्क्रैपर प्रकार (जैसे, scraper.chatgpt) |
| webhook | object | गलत | वेबहुक कॉन्फ़िगरेशन |
| webhook.url | string | गलत | कार्य परिणाम भेजने के लिए URL |
| input | object | सही | कार्य-विशिष्ट इनपुट फ़ील्ड |
परिणाम डेटा संरचना
| फ़ील्ड | प्रकार | आवश्यक | विवरण |
|---|---|---|---|
| status | string | सही | कार्य स्थिति: लंबित / चल रहा / सफल / विफल |
| message | string | गलत | त्रुटि संदेश (यदि कोई हो) |
| task_result | object | गलत | अंतिम परिणाम फ़ील्ड (प्रकार के अनुसार भिन्न) |
वेबहुक पुश प्रारूप
यदि webhook.url निर्दिष्ट किया गया है, तो एपीआई परिणाम को POST के माध्यम से भेजता है।
| फ़ील्ड | प्रकार | आवश्यक | विवरण |
|---|---|---|---|
| task_id | string | सही | अद्वितीय कार्य ID |
| status | string | सही | सफल या विफल |
| input | string | सही | ओरिजिनल अनुरोध पैरामीटर JSON स्ट्रिंग के रूप में |
| task_result | object | गलत | परिणाम डेटा |
HTTP स्थिति कोड
| स्थिति कोड | विवरण |
|---|---|
| 200 | सफलतापूर्वक परिणाम प्राप्त हुआ |
| 201 | कार्य सफलतापूर्वक बनाया गया |
| 202 | कार्य अभी भी चल रहा है |
| 400 | खराब अनुरोध |
| 410 | कार्य समाप्त (12 घंटे के लिए संग्रहीत) |
| 429 | बहुत अधिक अनुरोध |
स्क्रैपर्स अवलोकन
नीचे समर्थित एआई मॉडल स्क्रैपर्स और उनके डेटा प्रारूप दिए गए हैं।
1. ChatGPT स्क्रैपर
शरीर पैरामीटर
| पैरामीटर | प्रकार | आवश्यक | विवरण |
|---|---|---|---|
| prompt | string | सही | उपयोगकर्ता प्रम्प्ट |
| country | string | सही | देश/क्षेत्र |
| web_search | boolean | गलत | अंतर्निहित ब्राउज़र खोज सक्षम करें |
उत्तर फ़ील्ड
| फ़ील्ड | विवरण |
|---|---|
| prompt | मूल प्रम्प्ट |
| result_text | मार्कडाउन-फॉर्मेटेड प्रतिक्रिया |
| model | उपयोग किया गया मॉडल (जैसे, gpt-5-1) |
| web_search | क्या खोज सक्षम थी |
| links | निकाले गए लिंक |
| search_result | वेब खोज परिणाम |
| content_references | स्रोत उद्धरण |
2. Perplexity स्क्रैपर
मुख्य उत्तर फ़ील्ड
- prompt
- result_text
- संबंधित_प्रम्प्ट (संबंधित प्रश्न)
- web_results (शीर्षक, URL, स्निपेट)
- media_items (वीडियोज़, मानचित्र, चित्र)
- स्थान (lat/lng, विवरण, श्रेणियाँ, पता)
समर्थन करता है यात्रा, स्थानीय जानकारी, समाचार, और ट्रेंडिंग टॉपिक्स के लिए समृद्ध संरचित डेटा।
3. को-पायलट स्क्रैपर
कई मोड का समर्थन करता है:
खोज, स्मार्ट, चैट, युक्ति, अध्ययन
शरीर पैरामीटर
| पैरामीटर | विवरण |
|---|---|
| प्रॉम्प्ट | इनपुट प्रॉम्प्ट |
| देश | JP और TW समर्थित नहीं |
| मोड | खोज / स्मार्ट / चैट / युक्ति / अध्ययन |
उत्तर क्षेत्र
- परिणाम_पाठ
- प्रॉम्प्ट
- मोड
- लिंक
- उद्धरण
4. जेमिनी स्क्रैपर
उत्तर क्षेत्र
- परिणाम_पाठ
- प्रॉम्प्ट
- उद्धरण (फेविकॉन, हाइलाइट्स, स्निपेट, वेबसाइट_नाम)
गूगल जेमिनी उत्तरों के समान समृद्ध उद्धरण संरचनाओं का समर्थन करता है।
5. गूगल AI मोड स्क्रैपर
गूगल AI अवलोकन / AIO उत्तर को स्क्रैप करने के लिए उपयोग किया जाता है।
उत्तर क्षेत्र
| क्षेत्र | विवरण |
|---|---|
| परिणाम_पाठ | मुख्य AI उत्तर |
| परिणाम_एचटीएमएल | कच्चा एचटीएमएल |
| कच्चा_URL | स्रोत URL |
| उद्धरण | थंबनेल के साथ उद्धरण डेटा |
| खोज_परिणाम | पारंपरिक खोज परिणाम (यदि उपलब्ध हो) |
मदद और सामान्य प्रश्न
बिलिंग
यदि परिणाम उत्पन्न होता है लेकिन 5 मिनट के भीतर प्राप्त नहीं होता है, तो अनुरोध को फिर भी चार्ज किया जाएगा।
बचत करने के लिए:
- तुरंत परिणाम प्राप्त करें, या
- परिणामों को ऑटो-प्राप्त करने के लिए एक वेबहुक कॉन्फ़िगर करें
डेटा स्रोत
हम केवल सार्वजनिक, लॉगिन-मुक्त सुलभ डेटा को स्क्रैप करते हैं, यह सुनिश्चित करते हुए कि अनुपालन और गोपनीयता सुरक्षा है।
समर्थित देश / क्षेत्र
(आंशिक सूची नीचे)
| देश / क्षेत्र | कोड |
|---|---|
| ऑस्ट्रिया | AT |
| ऑस्ट्रेलिया | AU |
| बेल्जियम | BE |
| जापान | JP |
| सिंगापुर | SG |
| ताइवान | TW |
| संयुक्त राज्य | US |
| … | … |
195+ देशों की पूर्ण सूची अनुरोध पर उपलब्ध है।
निष्कर्ष
LLM चैट स्क्रैपर API टीमों को यह क्षमता प्रदान करता है:
- सभी AI चैट प्लेटफार्मों पर ब्रांड उल्लेखों की निगरानी करना
- AI उत्तरों में प्रतिस्पर्धियों की उपस्थिति और रैंकिंग को ट्रैक करना
- मॉडल आउटपुट, उद्धरण, और रुझानों का विश्लेषण करना
- GEO (जनरेटिव इंजन ऑप्टिमाइजेशन) रणनीतियाँ बनाना
- रीयल-टाइम इंटेलीजेंस पाइपलाइनों को स्वचालित करना
- पूरे AI खोज पारिस्थितिकी तंत्र से संरचित डेटा तक पहुँच प्राप्त करना
यह केवल एक स्क्रैपर नहीं है—यह AI सर्च युग के लिए एक डेटा इन्फ्रास्ट्रक्चर परत है।
हमसे संपर्क करें पूर्ण GEO डेटा समाधान को अनलॉक करने के लिए —
ताकि हर सामग्री का टुकड़ा डेटा द्वारा समर्थित हो, एल्गोरिदम व्यवहार के साथ संरेखित हो, और मापनीय वृद्धि के लिए स्थित हो।
स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।



