माइक्रोसॉफ्ट को-पायलट स्क्रैपर एपीआई: उत्तरों और उद्धरणों को कैद करें
Lead Scraping Automation Engineer
संक्षेप:
- एक Copilot स्क्रैपर्स API, Microsoft Copilot के उत्तर को संरचित JSON में बदलता है।
scraper.copilotअभिनेता पर एक POST प्रतिक्रिया पाठ, उसके पीछे के उद्धरण और उसकी पाई गई कच्ची लिंक लौटाता है - एक स्क्रीनशॉट के बजाय, फ़ील्ड के रूप में। - तीन इनपुट सब कुछ चलाते हैं।
promptप्रश्न को ले जाता है, एक वैकल्पिकcountryउस बाजार में आवासीय निकासी के लिए रन को पिन करता है, और एक वैकल्पिकmodeCopilot के उत्तर की शैली का चयन करता है। - उद्धरण चार्ट बनाने के लिए तैयार आते हैं।
citationsहर उद्धृत स्रोत को{ title, url }के रूप में सूचीबद्ध करता है - बिना किसी पार्सिंग चरण के उद्धरण की हिस्सेदारी ट्रैकिंग के लिए कच्चा सामग्री। - एनवलप कभी नहीं बदलती। हर कॉल
{ status, task_id, task_result }वापस करता है, जो अन्य Scrapeless LLM अभिनेताओं के समान आकार में है, इसलिए Copilot के लिए लिखा गया एक रैपर ChatGPT, Grok, Gemini और Perplexity के लिए बिना बदले विस्तारित होता है। - बच्चे को देखभाल करने के लिए कोई ब्राउज़र नहीं। रेंडरिंग, सत्र हैंडलिंग और प्रॉक्सी रोटेशन सर्वर-साइड पर चलती हैं; आप एक
x-api-tokenहेडर के साथ एक अंत बिंदु कॉल करते हैं और JSON वापस पढ़ते हैं। - शुरू करने के लिए मुफ्त। नए Scrapeless खातों में मुफ्त ट्रायल क्रेडिट शामिल हैं - app.scrapeless.com पर साइन अप करें।
परिचय: Copilot उस स्थान पर उत्तर देता है जहाँ खरीदार पहले से काम करते हैं
Microsoft Copilot Windows, Edge, Microsoft 365, और Bing के अंदर बैठता है - इसलिए व्यापार उपयोगकर्ताओं के बड़े हिस्से के लिए, Copilot वह सहायक है जिसे वे पहले पूछते हैं। जब वह उपयोगकर्ता सबसे अच्छे CRM, सबसे अच्छे प्रॉक्सी प्रदाता, या सबसे अच्छे हेल्प-डेस्क उपकरण के बारे में पूछता है, तो Copilot एक संक्षिप्त संश्लेषित उत्तर लौटाता है जिसमें कुछ उद्धृत स्रोत होते हैं। उस उत्तर में या तो कोई ब्रांड नामित होता है, या वह उस खरीदार के लिए अदृश्य होता है।
हाथ से उस उत्तर को ट्रैक करना नहीं बढ़ता: प्रतिक्रिया हर बार ताज़ा उत्पन्न होती है, उद्धृत स्रोत बदलते रहते हैं, और शब्दावली रन से रन में बदलती है। इसे डेटा के रूप में मॉनिटर करने के लिए, आपको उत्तर और इसके उद्धरणों को संरचित फ़ील्ड के रूप में चाहिए।
यह गाइड Scrapeless स्क्रैपर API पर scraper.copilot अभिनेता के माध्यम से चलती है - एक एकल प्रमाणीकरण POST जो Copilot के उत्तर पाठ, इसके उद्धरण, और इसके लिंक को JSON के रूप में लौटाता है, Scrapeless LLM-उत्तर रेखा के बाकी हिस्सों के समान एनवलप पर।
आप इसके साथ क्या कर सकते हैं
- Copilot में ब्रांड दृश्यता ट्रैक करें। खरीदने की इरादे वाले निश्चित सेट के संकेतों को चलाएँ और जांचें कि क्या आपका ब्रांड उत्तर पाठ और उद्धरण सूची में दिखाई देता है।
- उद्धरण की हिस्सेदारी मापें।
citationsURLs को डोमेन के द्वारा समूहित करें ताकि यह देखा जा सके कि Copilot किसी विषय के लिए किन स्रोतों पर निर्भर करता है, और आप उनके खिलाफ कहां रैंक करते हैं। - Copilot की तुलना अन्य इंजनों से करें। एक ही संकेत को
scraper.copilot,scraper.chatgpt,scraper.gemini, औरscraper.perplexityपर भेजें और उत्तर और स्रोतों की तुलना करें। - उत्तर भिन्नता की निगरानी करें। एक कार्यक्रम पर एक ही संकेत कैप्चर करें और चार्ट करें कि कैसे उत्तर और इसके उद्धरण सप्ताहों में बदलते हैं।
- डाउनस्ट्रीम पाइपलाइनों को फीड करें। संरचित
result_textऔरcitationsसीधे एक डेटाबेस, एक डैशबोर्ड, या एक LLM-मूल्यांकन सेट में गिरती हैं।
क्यों Scrapeless Copilot स्क्रैपर
Copilot एक जावास्क्रिप्ट एप्लिकेशन है जो Microsoft प्रमाणीकरण और एंटी-स्वचालन सुरक्षा के पीछे है; एक कच्चा HTTP अनुरोध कुछ भी उपयोगी वापस नहीं लौटाता है, और एक असली ब्राउज़र सत्र को संचालित करना स्वयं का अर्थ रेंडरिंग, साइन-इन, और प्रॉक्सी रोटेशन बनाए रखने का होता है। Scrapeless Copilot स्क्रैपर - यूनिवर्सल स्क्रैपिंग API का हिस्सा - उस सतह को सर्वर-साइड पर चलाता है और स्वच्छ JSON वापस करता है। विशेष रूप से Copilot के लिए, यह लाता है:
- 195+ देशों में आवासीय निकासी, इसलिए एक
countryमूल्य उस बाजार में एक वास्तविक उपयोगकर्ता द्वारा देखे गए उत्तर को कैप्चर करता है। - क्लाउड-साइड रेंडरिंग और सत्र हैंडलिंग - कोई ब्राउज़र चलाने, साइन-इन करने या जीवित रखने की आवश्यकता नहीं।
- एक स्थिर उत्तर एनवलप जो हर अन्य Scrapeless LLM अभिनेता के साथ साझा किया जाता है, इसलिए एक क्लाइंट पूरे रेखा को कवर करता है।
- उद्धरण पहले दर्जे के फ़ील्ड के रूप में - प्रति स्रोत
{ title, url }, समूहित और गिनने के लिए तैयार।
अपने मुफ्त प्लान पर API कुंजी प्राप्त करें app.scrapeless.com पर।
पूर्वापेक्षाएँ
- एक Scrapeless खाता और एक API कुंजी (मुफ्त योजना में परीक्षण क्रेडिट शामिल हैं) - app.scrapeless.com।
- कुंजी को एक वातावरण चर के रूप में एक्सपोर्ट करें ताकि यह स्रोत में कभी न पड़े:
bash
export SCRAPELESS_API_KEY="your_api_token_here"
curlप्रारंभिक कैप्चर के लिए, और नीचे दिए गए कामकाजी क्लाइंट के लिए Python 3 के साथrequests।
कोपायलट स्क्रैपर कैसे काम करता है
आप अभिनेता का नाम लेते हैं, उसे एक इनपुट देते हैं, और एक हेडर में अपनी कुंजी भेजते हैं।
- एंडपॉइंट:
POST https://api.scrapeless.com/api/v2/scraper/execute - अभिनेता:
scraper.copilot - प्रमाण पत्र हेडर:
x-api-token: $SCRAPELESS_API_KEY
अनुरोध पैरामीटर
| इनपुट फ़ील्ड | आवश्यक | वर्णन |
|---|---|---|
prompt |
हां | कोपायलट को भेजा जाने वाला प्रश्न |
country |
नहीं | दो-लिपि वाला देश कोड जो रन के निवास स्थान को चिह्नित करता है (जैसे US) |
mode |
नहीं | कोपायलट उत्तर शैली; हाल के कैप्चर में डिफ़ॉल्ट smart है |
curl के साथ त्वरित कैप्चर
bash
curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
-H "Content-Type: application/json" \
-H "x-api-token: ${SCRAPELESS_API_KEY}" \
-d '{
"actor": "scraper.copilot",
"input": { "prompt": "2026 में सबसे अच्छे प्रॉक्सी प्रदाता कौन हैं?", "country": "US", "mode": "smart" }
}'
उत्तर लिफाफा
json
// उदाहरणात्मक नमूना - एक सक्रिय scraper.copilot रन से स्कीमा; मान संक्षिप्त
{
"status": "success",
"task_id": "…",
"task_result": {
"prompt": "2026 में सबसे अच्छे प्रॉक्सी प्रदाता कौन हैं?",
"mode": "smart",
"result_text": "सर्वश्रेष्ठ प्रदाता आपके उपयोग के मामले पर निर्भर करता है… [1]",
"citations": [
{ "title": "2026 के लिए 10 सर्वश्रेष्ठ प्रॉक्सी प्रदाता: परीक्षण किया और रैंक किया", "url": "https://…" }
],
"links": [
"https://…"
]
}
}
फ़ील्ड दर फ़ील्ड:
| फ़ील्ड | प्रकार | यह क्या रखता है |
|---|---|---|
status |
स्ट्रिंग | पूर्ण रन पर success |
task_id |
स्ट्रिंग | रन की पहचान, आपके अपने भंडार में ऑडिट कुंजी के रूप में उपयोगी |
task_result.prompt |
स्ट्रिंग | वह प्रॉम्प्ट जैसा कि कोपायलट ने इसे प्राप्त किया |
task_result.mode |
स्ट्रिंग | उत्तर मोड जिसने प्रतिक्रिया उत्पन्न की (जैसे smart) |
task_result.result_text |
स्ट्रिंग | पूर्ण उत्तर जैसा कि मार्कडाउन में है, इनलाइन उद्धरण मार्कर संरक्षित हैं |
task_result.citations[] |
एरे | प्रत्येक उद्धृत स्रोत { title, url } के रूप में |
task_result.links[] |
एरे | उत्तर के साथ प्रस्तुत शुद्ध लिंक, जब उपलब्ध हो |
अपने निशुल्क योजना पर अपना API कुंजी प्राप्त करें: app.scrapeless.com
Python में API का एकीकरण
एक पूर्ण क्लाइंट: प्रॉम्प्ट भेजें, लिफाफा जांचें, और उद्धरण तालिका प्रिंट करें।
python
import os
import requests
ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"
def ask_copilot(prompt: str, country: str = "US", mode: str = "smart") -> dict:
resp = requests.post(
ENDPOINT,
headers={
"Content-Type": "application/json",
"x-api-token": os.environ["SCRAPELESS_API_KEY"],
},
json={"actor": "scraper.copilot", "input": {"prompt": prompt, "country": country, "mode": mode}},
timeout=180,
)
resp.raise_for_status()
return resp.json()
if __name__ == "__main__":
data = ask_copilot("2026 में सबसे अच्छे प्रॉक्सी प्रदाता कौन हैं?")
result = data.get("task_result", {})
citations = result.get("citations") or []
print(f"status={data.get('status')} mode={result.get('mode')} citations={len(citations)}")
for i, c in enumerate(citations, 1):
print(f" [{i}] {c.get('title', '')[:60]} → {c.get('url', '')[:60]}")
उत्तर का शरीर result.get("result_text") में मार्कडाउन के रूप में रहता है; उद्धरण का कार्य करने के लिए ऊपर की लूप आमतौर पर पूरा काम होता है - प्रिंट किए गए URL को डोमेन द्वारा समूहित करें और गिनें।
AI-उत्तर परिदृश्य के बाकी के लिए साथी अभिनेता
समान एंडपॉइंट, हेडर, और लिफाफा पड़ोसी प्लेटफार्मों को कवर करते हैं - केवल अभिनेता के नाम और एक या दो प्लेटफ़ॉर्म-विशिष्ट फ़ील्ड में परिवर्तन होता है:
scraper.chatgpt— समान प्रॉम्प्ट/देश इनपुट;result_textके साथ एकcontent_referencesउद्धरण एरे औरsearch_resultपैनल लौटाता है।scraper.grok— एक आवश्यक तर्कmodeजोड़ता है और अलग-अलगweb_search_resultsऔरx_search_resultsउद्धरण पैनल लौटाता है।scraper.gemini— चैटजीपीटी के रूप में समान दो-क्षेत्र इनपुट;result_textके साथ एकcitationsएरे लौटाता है।scraper.perplexity— एक आवश्यकcountryऔर एकweb_searchध्वज लेता है;web_results,media_items, और संबंधित प्रॉम्प्ट लौटाता है।scraper.overview/scraper.aimode— Google का AI ओवरव्यू ब्लॉक और AI मोड टैब; AI ओवरव्यू गाइड उस जोड़ी को अंत से अंत तक कवर करता है।
लाइन की कीमत उपयोग-आधारित है और साइनअप पर मुफ्त परीक्षण क्रेडिट उपलब्ध हैं - वर्तमान स्तर प्राइसिंग पृष्ठ पर हैं।
सामान्य समस्याओं से बचने का तरीका
- कुछ प्रॉम्प्ट पर
उद्धरणखाली हैं। Copilot हर उत्तर के लिए स्रोत का हवाला नहीं देता - राय से भरे या पूरी तरह से जनरेटिव प्रॉम्प्ट citation-free हो सकते हैं। उद्धरण ट्रैकिंग के लिए, प्रॉम्प्ट को ऐसे वाक्यांश करें जैसे एक शोध करने वाला खरीदार ("Y के लिए सबसे अच्छा X") करेगा, जो विश्वसनीय रूप से वेब-आधारित उत्तरों को ट्रिगर करता है। - प्रत्युत्तर अलग-अलग चलते हैं। समान प्रॉम्प्ट कुछ मिनटों के भीतर अलग-अलग उत्तर और उद्धरण सेट उत्पन्न कर सकता है - वह अस्थिरता ही वह घटना है जिसे आप माप रहे हैं। हर कैप्चर को उसके
task_idऔर टाइमस्टैम्प के साथ संग्रहीत करें और श्रृंखला को सिग्नल के रूप में मानें, न कि किसी एकल रन को। - हर फ़ील्ड को nullable के रूप में मानें।
linksअक्सर खाली होता है और उद्धरण की गिनती विभिन्न रन के बीच बदलती है। जो कुछ भी है उसे पढ़ें, न कि एक निश्चित आकार का दावा करें। - देश को जानबूझकर पिन करें। एक बिना पिन किया गया रन एक उत्तर कैप्चर करता है; एक पिन किया गया रन उस बाजार के लिए उत्तर कैप्चर करता है जो आपके लिए महत्वपूर्ण है। अपने संग्रहीत रिकॉर्ड में
countryमान रखें ताकि श्रृंखलाएँ तुलना योग्य बनी रहें।
निष्कर्ष: Copilot उत्तर एक-संभाविता निर्भरता के रूप में
Copilot Windows, Edge, और Microsoft 365 उपयोगकर्ताओं के एक बड़े आधार के लिए पहला सहायक है, और जो उत्तर यह देता है वह तय करता है कि आपका ब्रांड कैसे देखा जाता है। scraper.copilot अभिनेता उस उत्तर को एक संरचित रिकॉर्ड में बदलता है - पाठ, उद्धरण, लिंक - हर दूसरे Scrapeless LLM अभिनेता के समान पैकेज में, इसलिए Copilot की निगरानी एक पाइपलाइन में एक-पंक्ति का योगदान है जिसे आप पहले से ChatGPT या Gemini के लिए चला सकते हैं।
क्या आप अपने AI-उत्तर डेटा पाइपलाइन बनाने के लिए तैयार हैं?
हमारे समुदाय से जुड़ें, एक मुफ्त योजना का दावा करें और उन डेवलपर्स से जुड़ें जो AI-उत्तर पाइपलाइनों का निर्माण कर रहे हैं: डिस्कॉर्ड · टेलीग्राम。
app.scrapeless.com पर मुफ्त परीक्षण क्रेडिट के लिए साइन अप करें, और अपने निगरानी कार्यक्रम की जरूरतों के लिए प्रॉम्प्ट, बाजार और शेड्यूल पर scraper.copilot अभिनेता को पॉइंट करें।
सामान्य प्रश्न
प्रश्न: क्या Microsoft Copilot उत्तरों को स्क्रैप करना कानूनी है?
उत्तर: यह अभिनेता सार्वजनिक रूप से उपलब्ध उत्तर सामग्री को पढ़ता है, जिसे एक आगंतुक देखता है। किसी भी स्क्रैपिंग की तरह, उपयोग को सार्वजनिक डेटा तक सीमित करें, प्लेटफ़ॉर्म की शर्तों का सम्मान करें, व्यक्तिगत डेटा एकत्र करने से बचें, और यदि उपयोग का मामला स्पष्ट नहीं है तो एक वकील से परामर्श करें।
प्रश्न: क्या मुझे Microsoft खाता चाहिए या साइन-इन संभालना है?
उत्तर: नहीं। प्रमाणीकरण, सत्र प्रबंधन, और रेंडरिंग सर्वर-साइड पर चलते हैं; आप एक प्रॉम्प्ट भेजते हैं और JSON पढ़ते हैं।
प्रश्न: जब मैं वही प्रॉम्प्ट चलाई तो उद्धरण हर बार अलग क्यों होते हैं?
उत्तर: Copilot उत्तरों को गतिशील रूप से उत्पन्न करता है और प्रत्येक रन के लिए स्रोतों का फिर से चयन करता है, इसलिए उद्धरण सेट बदलता है। वह रन-से-रन विविधता ही सिग्नल है जिसे एक निगरानी श्रृंखला ट्रैक करने के लिए बनाई गई है - प्रत्येक कैप्चर को उसके task_id और टाइमस्टैम्प के साथ संग्रहीत करें।
प्रश्न: क्या मैं एक विशेष देश के लिए उत्तर कैप्चर कर सकता हूँ?
उत्तर: हां। इनपुट में दो-हरफ country कोड पास करें ताकि देश के उस बाजार में आवासीय निकासी के लिए रन को पिन करने के लिए, ताकि आप उस उत्तर को कैप्चर करें जो एक स्थानीय उपयोगकर्ता देखेगा।
प्रश्न: यह ChatGPT या Gemini स्क्रैपर से कैसे अलग है?
उत्तर: केवल अभिनेता का नाम और एक या दो फ़ील्ड। scraper.copilot अपने उद्धरण citations के तहत लौटाता है; पैकेज { status, task_id, task_result } समान है, इसलिए एक क्लाइंट पूरे LLM-उत्तर लाइन को कवर करता है।
स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।



