ग्रोक स्क्रैपर एपीआई के साथ ग्रोक उत्तर कैसे स्क्रैप करें
Specialist in Anti-Bot Strategies
TL;DR
- एक ग्रोक स्क्रेपर एपीआई xAI का उत्तर दोनों स्रोत पैनलों के साथ डेटा के रूप में लौटाता है।
scraper.grokकार्यकर्ता पर एक POST पूर्ण उत्तर के साथ-साथweb_search_resultsऔरx_search_results- खुली वेब पृष्ठों और X (Twitter) पोस्ट - को अलग-अलग ऐरे के रूप में कैप्चर करता है। - तीन इनपुट, जिनमें से एक असामान्य है।
promptप्रश्न लेकर आता है,countryआवासीय स्थान को अंकित करता है, और एक आवश्यक तर्कmode-MODEL_MODE_FAST,MODEL_MODE_EXPERT, याMODEL_MODE_AUTO- यह नियंत्रित करता है कि ग्रोक उत्तर देने से पहले कितनी मेहनत करता है। - X संदर्भ भिन्नता है। ग्रोक लाइव वेब खोज के साथ X के रीयल-टाइम फ़ीड को मिश्रित करता है; केवल उत्तर टेक्स्ट कैप्चर करने से डेटा का आधा हिस्सा फेंक दिया जाता है जो यह बताता है कि इसे किस चीज़ का श्रेय दिया गया।
- लिफाफा अन्य LLM कार्यकर्ताओं से मेल खाता है।
{ status, task_id, task_result }, एकx-api-token, वही एंडपॉइंट - एक ChatGPT कैप्चर क्लाइंट ग्रोक को कार्यकर्ता के नाम को बदलकर औरmodeजोड़कर विस्तारित करता है। - चलने के दौरान मेटाडेटा मुफ्त आता है। फॉलो-अप सुझाव, फुटनोट, टोकन गिनती, और चलाने की बातचीत के पहचानकर्ता उसी लोड में आते हैं, ऑडिट ट्रेल्स के लिए तैयार।
- शुरू करने के लिए मुफ्त। नए Scrapeless खाते मुफ्त परीक्षण क्रेडिट के साथ आते हैं - app.scrapeless.com पर साइन अप करें।
परिचय: सामाजिक फ़ीड के साथ उत्तर इंजन
ग्रोक प्रश्नों का उत्तर देने के लिए दो स्रोत प्रकारों को मिलाता है जो कोई अन्य प्रमुख सहायक नहीं मिलाता: लाइव वेब खोज और X से सीधे खींचे गए पोस्ट। इसे पूछें कि कौन सा उपकरण खरीदें, कौन सा एपीआई मजबूत है, कौन सा ब्रांड विश्वसनीय है, और उत्तर वेब पृष्ठों और X पोस्ट को एक उद्धृत उत्तर में समेटा जाता है। जो कोई भी देख रहा है कि एक ब्रांड AI के उत्तरों में कैसे प्रस्तुत होता है, उसके लिए ग्रोक एक विशिष्ट सतह बनाता है - संदर्भों में सामाजिक बातचीत शामिल होती है, केवल अनुक्रमित वेब नहीं।
इन उत्तरों को हाथ से कैप्चर करना आम कहानी है: एक लॉगिन-गेटेड इंटरफेस, स्ट्रीमिंग आउटपुट, भू-संवेदनशील उत्तर और एक DOM जिसे कभी भी पार्स करने के लिए नहीं meant था। और ग्रोक अपने खुद के मोड़ को जोड़ता है - तर्क मोड उत्तर को बदल देता है, इसलिए एक कैप्चर पाइपलाइन को इसे स्पष्ट रूप से नियंत्रित करना होगा।
scraper.grok कार्यकर्ता सब कुछ एक HTTP अनुरोध में बदल देता है: प्रांप्ट, देश और मोड अंदर; संरचित उत्तर और दोनों संदर्भ पैनल बाहर। यह गाइड अनुरोध स्वरूप, उत्तर स्कीमा, एक कार्यशील पायथन क्लाइंट और उन साथी कार्यकर्ताओं को कवर करती है जो AI-उत्तर परिदृश्य के शेष को कवर करते हैं। श्रेणी का रैंकिंग दृश्य देखने के लिए, सर्वश्रेष्ठ LLM स्क्रेपर्स गाइड देखें।
इसके साथ आप क्या कर सकते हैं
- दो पैनलों में संदर्भ-आधार ट्रैकिंग। समय के साथ एक निश्चित प्रांप्ट सेट के लिए
web_search_resultsमें कौन से डोमेन प्रकट होते हैं औरx_search_resultsमें कौन से खाते प्रकट होते हैं, उनकी गिनती करें। - ब्रांड निगरानी जहाँ X कथा को आकार देती है। उन श्रेणियों के लिए जहाँ भावना सबसे पहले X पर बनती है, ग्रोक के संदर्भ दिखाते हैं कि कौन से पोस्ट मॉडल के उत्तरों को आकार दे रहे हैं।
- तर्क-प्रकार की तुलना।
FAST,EXPERT, औरAUTOके तहत एक ही प्रांप्ट को कैप्चर करें और मापें कि गहराई उत्तर और स्रोतों को कैसे बदलती है। - मल्टी-मार्केट कैप्चर। देशों के अनुसार रन पिन करें और तुलना करें कि ग्रोक एक ही प्रश्न के बारे में विभिन्न बाजारों को क्या बता रहा है।
- प्रतिस्पर्धी उत्तर विश्लेषण। ट्रैक करें कि ग्रोक कब किसी उत्पाद की सिफारिश शुरू या बंद करता है, और इसके पीछे के संदर्भों में बदलाव को ट्रेस करें।
- डेटासेट निर्माण। प्रांप्ट-उत्तर-पैनल त्रिकोन को साफ JSON के रूप में संग्रहीत करें ताकि दीर्घकालिक विश्लेषण किया जा सके।
क्यों Scrapeless ग्रोक स्क्रेपर
scraper.grok कार्यकर्ता Scrapeless LLM चैट स्क्रेपर परिवार का हिस्सा है जो यूनिवर्सल स्क्रेपिंग API लाइन के अंदर है:
- दोनों संदर्भ पैनल अलग-अलग ऐरे के रूप में। ओपन-वेब स्रोत और X पोस्ट अलग-अलग आते हैं - एक संदर्भ-आधार रिपोर्ट प्रत्येक पैनल को सीधे पढ़ती है, कोई पुनः-पार्सिंग नहीं।
- तर्क मोड एक प्रथम श्रेणी का इनपुट है। आप तय करते हैं कि ग्रोक प्रति रन कितना सोचना चाहता है, जो एक अनुसूचित श्रृंखला को विधिवादिक रूप से सुसंगत बनाए रखता है।
- देश-पिन आवासीय निकास। रन 195+ देशों में आवासीय प्रॉक्सियों के माध्यम से रूट होते हैं, ताकि स्थानीय-विशिष्ट उत्तरों को पुन: उत्पादित किया जा सके।
- एक ही समझौता विभिन्न प्लेटफार्मों में। वही एंडपॉइंट, हेडर, और
{ status, task_id, task_result }लिफाफा ChatGPT, जेमिनी, पेर्प्लेक्सिटी, और कोपाइलट कार्यकर्ताओं को कवर करता है।
पैरामीटर संदर्भ LLM चैट स्क्रेपर दस्तावेज़ों में मौजूद है।
आवश्यकताएँ
- एक Scrapeless खाता और API कुंजी - app.scrapeless.com पर साइन अप करें।
- त्वरित परीक्षण के लिए
curl, या नीचे दिए गए क्लाइंट के लिए Python 3.10+। - HTTP और JSON के साथ बेसिक परिचितता।
अपने कुंजी को पर्यावरण में स्टोर करें ताकि यह कभी भी कोड में न पहुंचे:
bash
export SCRAPELESS_API_KEY=आपका_api_token_यहां
ग्रोक स्क्रैपर कैसे काम करता है
- एंडपॉइंट:
POST https://api.scrapeless.com/api/v2/scraper/execute - एक्टर:
scraper.grok - अथ header:
x-api-token: $SCRAPELESS_API_KEY
अनुरोध पैरामीटर
| इनपुट फ़ील्ड | आवश्यक | विवरण |
|---|---|---|
prompt |
हां | ग्रोक को भेजने के लिए प्रश्न |
country |
हां | रन के आवासीय निकासी के लिए दो-अक्षरीय देश कोड (जैसे US; JP और TW अनुपलब्ध हैं) |
mode |
हां | तर्क गहराई: MODEL_MODE_FAST, MODEL_MODE_EXPERT, या MODEL_MODE_AUTO |
त्वरित कैप्चर curl के साथ
bash
curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
-H "Content-Type: application/json" \
-H "x-api-token: ${SCRAPELESS_API_KEY}" \
-d '{
"actor": "scraper.grok",
"input": {
"prompt": "कौन सा वेब स्क्रैपिंग API जावास्क्रिप्ट-भारी साइटों को संभालता है?",
"country": "US",
"mode": "MODEL_MODE_EXPERT"
}
}'
प्रतिक्रिया लिफाफा
json
// उदाहरणात्मक नमूना — एक सक्रिय scraper.grok रन से स्कीमा; मानों को संक्षिप्त किया गया है
{
"status": "success",
"task_id": "52fc9c96-…",
"task_result": {
"user_query": "कौन सा वेब स्क्रैपिंग API जावास्क्रिप्ट-भारी साइटों को संभालता है?",
"full_response": "जावास्क्रिप्ट-भारी साइटों के लिए, जो विकल्प उपलब्ध हैं वे हैं…",
"web_search_results": [
{ "title": "…", "url": "https://…", "preview": "…", "description": "…", "favicon": "…", "image": "…" }
],
"x_search_results": [],
"follow_up_suggestions": [ "…" ],
"footnotes": [],
"tool_usages": [ "…" ],
"token_count": 1024,
"user_model": "…",
"response_id": "…",
"conversation": { "conversation_id": "…", "title": "…", "create_time": "…" }
}
}
प्रत्येक फ़ील्ड के लिए:
| फ़ील्ड | प्रकार | इसमें क्या है |
|---|---|---|
task_result.user_query |
स्ट्रिंग | ग्रोक की ओर से प्राप्त किए गए प्रॉम्प्ट के रूप में |
task_result.full_response |
स्ट्रिंग | ग्रोक का पूरा उत्तर पाठ |
task_result.web_search_results[] |
ऐरे | ओपन-विभाजन — title, url, preview, साथ में description, favicon, और image जब मौजूद हो |
task_result.x_search_results[] |
ऐरे | ग्रोक द्वारा उद्धृत एक्स पोस्ट; जब प्रॉम्प्ट सामाजिक स्रोतों को नहीं खींचता है तो खाली |
task_result.follow_up_suggestions[] |
ऐरे | उत्तर के बाद ग्रोक द्वारा पेश किए गए फॉलो-अप प्रश्न |
task_result.footnotes[] |
ऐरे | फुटनोट प्रविष्टियाँ, जब उत्तर में वे होते हैं |
task_result.tool_usages[] |
ऐरे | रन द्वारा उपयोग किए गए उपकरण (खोज, ब्राउज़) |
task_result.token_count |
संख्या | रन का टोकन उपयोग |
task_result.conversation |
वस्तु | रन पहचानकर्ता — conversation_id, title, टाइमस्टैम्प — ऑडिट कुंजी के रूप में उपयोगी |
अपने API कुंजी को मुफ्त योजना पर प्राप्त करें: app.scrapeless.com
पाइथन में API को एकीकृत करना
एक पूर्ण क्लाइंट: प्रॉम्प्ट भेजें, लिफाफा जांचें, और दोनों उद्धरण पैनल प्रिंट करें।
python
import os
import requests
ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"
def ask_grok(prompt: str, country: str = "US", mode: str = "MODEL_MODE_EXPERT") -> dict:
resp = requests.post(
ENDPOINT,
headers={
"Content-Type": "application/json",
"x-api-token": os.environ["SCRAPELESS_API_KEY"],
},
json={
"actor": "scraper.grok",
"input": {"prompt": prompt, "country": country, "mode": mode},
},
timeout=300,
)
resp.raise_for_status()
return resp.json()
if __name__ == "__main__":
data = ask_grok("कौन सा वेब स्क्रैपिंग API जावास्क्रिप्ट-भारी साइटों को संभालता है?")
result = data.get("task_result", {})
web = result.get("web_search_results") or []
x = result.get("x_search_results") or []
print(f"status={data.get('status')} web_sources={len(web)} x_sources={len(x)}")
for i, src in enumerate(web[:5], 1):
print(f" [वेब {i}] {src.get('title', '')[:60]} → {src.get('url', '')[:60]}")
for i, post in enumerate(x[:5], 1):
print(f" [x {i}] {str(post)[:80]}")
उद्धरण कार्य के लिए, web_search_results URLs को डोमेन द्वारा और x_search_results को खाते द्वारा समूहित करें, और प्रति प्रॉम्प्ट की गणना करें — दोनों पैनल स्वतंत्र संकेत हैं और अलग से चार्ट करने के लायक हैं।
तर्क मोड का चयन करना
आवश्यक mode वह इनपुट है जिसका कोई ChatGPT समकक्ष नहीं है, और यह देरी और आउटपुट दोनों को बदलता है:
MODEL_MODE_FAST— सबसे तेज उत्तर; उच्च मात्रा के स्वीप के लिए उपयुक्त जहां चौड़ाई गहराई से बेहतर है।MODEL_MODE_EXPERT— अधिक गहरा तर्क और आमतौर पर समृद्ध स्रोत; उन प्रॉम्प्ट के लिए उपयुक्त जो आप समय के साथ चार्ट करते हैं। लंबे रन की अनुमति दें।MODEL_MODE_AUTO— ग्रोक प्रॉम्प्ट के अनुसार चुनता है; इंटरैक्टिव रूप से सुविधाजनक, लेकिन अनुशासित श्रृंखला को समझना आसान है जब मोड स्थिर रखा जाता है।
आप जो भी चुनें, उसे प्रत्येक कैप्चर के साथ स्टोर करें - एक EXPERT रन की तुलना FAST रन से करना दो विभिन्न प्रक्रियाओं की तुलना करना है।
AI-उत्तर परिदृश्य के लिए साथी अभिनेता
एंडपॉइंट, हेडर और लिफाफा परिवार भर में समान रहते हैं - केवल अभिनेता का नाम और प्लेटफ़ॉर्म-विशिष्ट इनपुट बदलते हैं:
scraper.chatgpt—prompt+ वैकल्पिकcountry;result_textके साथcontent_referencesउद्धरण लौटाता है।scraper.gemini— वही दो-क्षेत्र इनपुट;result_textके साथ एकcitationsऐरे लौटाता है।scraper.perplexity— आवश्यकcountryऔर एकweb_searchध्वज;web_results,media_items, और संबंधित प्रॉम्प्ट लौटाता है।scraper.copilot— उसी अनुबंध के तहत Copilot उत्तर सतह।scraper.overview/scraper.aimode— गूगल का AI अवलोकन ब्लॉक और AI मोड टैब; AI अवलोकन गाइड में संपूर्ण रूप से कवर किया गया है।
इस पंक्ति के लिए मूल्य निर्धारण उपयोग के आधार पर है और साइनअप पर मुफ्त ट्रायल क्रेडिट हैं - वर्तमान स्तर प्राइसिंग पृष्ठ पर हैं।
सामान्य समस्याओं से बचें
- खाली
x_search_resultsकई प्रॉम्प्ट के लिए सामान्य है। तकनीकी और उत्पाद प्रश्न अक्सर पूरी तरह से ओपन वेब से हल हो जाते हैं। लोगों, घटनाओं, और भावना के बारे में प्रॉम्प्ट वे होते हैं जो X पोस्ट खींचते हैं - जब X पैनल बिंदु हो तो उचित रूप से वाक्यांश लें। - पैनल आकार रन से रन में बदलते हैं। एक ही प्रॉम्प्ट एक रन में 35 वेब स्रोतों का हवाला दे सकता है और अगले में 20। प्रत्येक कैप्चर को इसके
conversation_idके साथ स्टोर करें और श्रृंखला को पढ़ें, न कि एक ही रन को। - एक श्रृंखला में मोड स्थिर रखें। मोड तर्क प्रक्रिया को बदलता है; एक ट्रैक किए गए प्रॉम्प्ट सेट में मोड को मिलाना प्रवृत्ति रेखाओं को अप्रभावी बना देता है।
- फील्ड को नल योग्य मानें।
footnotesअक्सर खाली होता है, वेब-स्रोत प्रविष्टियाँ केवल कभी-कभीdescription/imageले जाती हैं, औरx_search_results[]हो सकते हैं - जो मौजूद है उसे पढ़ें। - देश की सूची का ध्यान रखें।
countryआवश्यक है और JP/TW उपलब्ध नहीं हैं; उन बाजारों का चयन करें जिनकी आप रिपोर्ट करते हैं और उन्हें श्रृंखला के अनुसार स्थिर रखें।
निष्कर्ष: दोनों पैनल, एक अनुरोध
Grok को कैप्चर करना एक कॉल में घटित होता है: POST { actor: "scraper.grok", input: { prompt, country, mode } } अपने x-api-token के साथ, उत्तर के लिए full_response पढ़ें, और web_search_results और x_search_results को अलग उद्धरण संकेतों के रूप में चार्ट करें। मोड को स्थिर रखें, देश को निश्चित करें, conversation_id को स्टोर करें, और वही ग्राहक एक प्रॉम्प्ट से एक शेड्यूल मल्टी-मार्केट मॉनिटरिंग प्रोग्राम से स्केल करता है।
सामान्य प्रश्न
प्रश्न: क्या Grok उत्तरों को स्क्रैप करना कानूनी है?
अभिनेता सार्वजनिक रूप से प्रस्तुत उत्तर सामग्री को कैप्चर करता है। नियम न्याय юरिस्डिक्शन और प्लेटफॉर्म की सेवा की शर्तों के अनुसार भिन्न होते हैं - अपने उपयोग के मामले के लिए प्रासंगिक TOC की समीक्षा करें और सलाह के लिए परामर्श करें, विशेष रूप से कैप्चर का पुनर्वितरण करने से पहले। GDPR या CCPA के तहत संरक्षित व्यक्तिगत डेटा कभी न इकट्ठा करें।
प्रश्न: मैं कैसे प्रमाणित करूं?
हर अनुरोध में x-api-token: <आपकी कुंजी> होती है। एक खाता कुंजी scraper.grok और अन्य सभी Scrapeless अभिनेताओं को कवर करती है। मुफ्त योजना पर एक कुंजी बनाएं at app.scrapeless.com।
प्रश्न: क्या मुझे एक प्रॉक्सी की आवश्यकता है?
नहीं। आवासीय ईग्रस और जियो-रूटिंग अभिनेता में निर्मित हैं; आवश्यक country इनपुट पूरी कॉन्फ़िगरेशन है।
प्रश्न: mode आवश्यक क्यों है?
Grok की तर्क की गहराई उत्तर को मौलिक रूप से बदल देती है, इसलिए अभिनेता इसे स्पष्ट बनाता है न कि चुपचाप डिफ़ॉल्ट होता है। कोड में मान API enums हैं - MODEL_MODE_FAST, MODEL_MODE_EXPERT, MODEL_MODE_AUTO।
प्रश्न: मैं एक्स उद्धरणों से वेब उद्धरणों को कैसे अलग करूं?
वे पहले से ही अलग आते हैं: web_search_results खुले वेब पृष्ठों को रखता है, x_search_results X पोस्ट रखता है। प्रत्येक ऐरे को सीधे पढ़ें।
प्रश्न: क्या मैं इसके बिना SDK या AI एजेंट चला सकता हूं?
हाँ। यह साधारण HTTP है - कर्ल, पायथन requests, नोड fetch, या कोई भी HTTP क्लाइंट POST /api/v2/scraper/execute के खिलाफ सीधे काम करता है।
प्रश्न: क्या मेरा ChatGPT कैप्चर कोड Grok के लिए काम करता है?
अधिकार, एंडपॉइंट, और लिफाफा समान हैं। अभिनेता का नाम बदलें, आवश्यक mode और country जोड़ें, और task_result कुंजी को मैप करें (full_response के बजाय result_text, content_references के बजाय दो पैनल)।
क्या आप अपने AI-उत्तर डेटा पाइपलाइन का निर्माण करने के लिए तैयार हैं?
हमारे समुदाय से जुड़ें और डेवलपर्स के साथ जुड़ें जो AI-उत्तर पाइपलाइनों का निर्माण कर रहे हैं: Discord · Telegram।
फ्री ट्रायल क्रेडिट के लिए app.scrapeless.com पर साइन अप करें, और scraper.grok अभिनेता को उन प्रॉम्प्ट, मोड और बाजारों पर इंगित करें जिनकी आपकी मॉनिटरिंग प्रोग्राम को आवश्यकता है।
स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।



