🎯 कस्टमाइज़ करने योग्य, डिटेक्शन-प्रतिरोधी क्लाउड ब्राउज़र जो स्व-विकसित Chromium द्वारा संचालित है, वेब क्रॉलर और एआई एजेंट्स के लिए डिज़ाइन किया गया। 👉अभी आज़माएं
वापस ब्लॉग पर

माइक्रोसॉफ्ट को-पायलट स्क्रैपर एपीआई: उत्तरों और उद्धरणों को कैद करें

Daniel Kim
Daniel Kim

Lead Scraping Automation Engineer

29-Jun-2026

संक्षेप:

  • एक Copilot स्क्रैपर्स API, Microsoft Copilot के उत्तर को संरचित JSON में बदलता है। scraper.copilot अभिनेता पर एक POST प्रतिक्रिया पाठ, उसके पीछे के उद्धरण और उसकी पाई गई कच्ची लिंक लौटाता है - एक स्क्रीनशॉट के बजाय, फ़ील्ड के रूप में।
  • तीन इनपुट सब कुछ चलाते हैं। prompt प्रश्न को ले जाता है, एक वैकल्पिक country उस बाजार में आवासीय निकासी के लिए रन को पिन करता है, और एक वैकल्पिक mode Copilot के उत्तर की शैली का चयन करता है।
  • उद्धरण चार्ट बनाने के लिए तैयार आते हैं। citations हर उद्धृत स्रोत को { title, url } के रूप में सूचीबद्ध करता है - बिना किसी पार्सिंग चरण के उद्धरण की हिस्सेदारी ट्रैकिंग के लिए कच्चा सामग्री।
  • एनवलप कभी नहीं बदलती। हर कॉल { status, task_id, task_result } वापस करता है, जो अन्य Scrapeless LLM अभिनेताओं के समान आकार में है, इसलिए Copilot के लिए लिखा गया एक रैपर ChatGPT, Grok, Gemini और Perplexity के लिए बिना बदले विस्तारित होता है।
  • बच्चे को देखभाल करने के लिए कोई ब्राउज़र नहीं। रेंडरिंग, सत्र हैंडलिंग और प्रॉक्सी रोटेशन सर्वर-साइड पर चलती हैं; आप एक x-api-token हेडर के साथ एक अंत बिंदु कॉल करते हैं और JSON वापस पढ़ते हैं।
  • शुरू करने के लिए मुफ्त। नए Scrapeless खातों में मुफ्त ट्रायल क्रेडिट शामिल हैं - app.scrapeless.com पर साइन अप करें।

परिचय: Copilot उस स्थान पर उत्तर देता है जहाँ खरीदार पहले से काम करते हैं

Microsoft Copilot Windows, Edge, Microsoft 365, और Bing के अंदर बैठता है - इसलिए व्यापार उपयोगकर्ताओं के बड़े हिस्से के लिए, Copilot वह सहायक है जिसे वे पहले पूछते हैं। जब वह उपयोगकर्ता सबसे अच्छे CRM, सबसे अच्छे प्रॉक्सी प्रदाता, या सबसे अच्छे हेल्प-डेस्क उपकरण के बारे में पूछता है, तो Copilot एक संक्षिप्त संश्लेषित उत्तर लौटाता है जिसमें कुछ उद्धृत स्रोत होते हैं। उस उत्तर में या तो कोई ब्रांड नामित होता है, या वह उस खरीदार के लिए अदृश्य होता है।

हाथ से उस उत्तर को ट्रैक करना नहीं बढ़ता: प्रतिक्रिया हर बार ताज़ा उत्पन्न होती है, उद्धृत स्रोत बदलते रहते हैं, और शब्दावली रन से रन में बदलती है। इसे डेटा के रूप में मॉनिटर करने के लिए, आपको उत्तर और इसके उद्धरणों को संरचित फ़ील्ड के रूप में चाहिए।

यह गाइड Scrapeless स्क्रैपर API पर scraper.copilot अभिनेता के माध्यम से चलती है - एक एकल प्रमाणीकरण POST जो Copilot के उत्तर पाठ, इसके उद्धरण, और इसके लिंक को JSON के रूप में लौटाता है, Scrapeless LLM-उत्तर रेखा के बाकी हिस्सों के समान एनवलप पर।


आप इसके साथ क्या कर सकते हैं

  • Copilot में ब्रांड दृश्यता ट्रैक करें। खरीदने की इरादे वाले निश्चित सेट के संकेतों को चलाएँ और जांचें कि क्या आपका ब्रांड उत्तर पाठ और उद्धरण सूची में दिखाई देता है।
  • उद्धरण की हिस्सेदारी मापें। citations URLs को डोमेन के द्वारा समूहित करें ताकि यह देखा जा सके कि Copilot किसी विषय के लिए किन स्रोतों पर निर्भर करता है, और आप उनके खिलाफ कहां रैंक करते हैं।
  • Copilot की तुलना अन्य इंजनों से करें। एक ही संकेत को scraper.copilot, scraper.chatgpt, scraper.gemini, और scraper.perplexity पर भेजें और उत्तर और स्रोतों की तुलना करें।
  • उत्तर भिन्नता की निगरानी करें। एक कार्यक्रम पर एक ही संकेत कैप्चर करें और चार्ट करें कि कैसे उत्तर और इसके उद्धरण सप्ताहों में बदलते हैं।
  • डाउनस्ट्रीम पाइपलाइनों को फीड करें। संरचित result_text और citations सीधे एक डेटाबेस, एक डैशबोर्ड, या एक LLM-मूल्यांकन सेट में गिरती हैं।

क्यों Scrapeless Copilot स्क्रैपर

Copilot एक जावास्क्रिप्ट एप्लिकेशन है जो Microsoft प्रमाणीकरण और एंटी-स्वचालन सुरक्षा के पीछे है; एक कच्चा HTTP अनुरोध कुछ भी उपयोगी वापस नहीं लौटाता है, और एक असली ब्राउज़र सत्र को संचालित करना स्वयं का अर्थ रेंडरिंग, साइन-इन, और प्रॉक्सी रोटेशन बनाए रखने का होता है। Scrapeless Copilot स्क्रैपर - यूनिवर्सल स्क्रैपिंग API का हिस्सा - उस सतह को सर्वर-साइड पर चलाता है और स्वच्छ JSON वापस करता है। विशेष रूप से Copilot के लिए, यह लाता है:

  • 195+ देशों में आवासीय निकासी, इसलिए एक country मूल्य उस बाजार में एक वास्तविक उपयोगकर्ता द्वारा देखे गए उत्तर को कैप्चर करता है।
  • क्लाउड-साइड रेंडरिंग और सत्र हैंडलिंग - कोई ब्राउज़र चलाने, साइन-इन करने या जीवित रखने की आवश्यकता नहीं।
  • एक स्थिर उत्तर एनवलप जो हर अन्य Scrapeless LLM अभिनेता के साथ साझा किया जाता है, इसलिए एक क्लाइंट पूरे रेखा को कवर करता है।
  • उद्धरण पहले दर्जे के फ़ील्ड के रूप में - प्रति स्रोत { title, url }, समूहित और गिनने के लिए तैयार।

अपने मुफ्त प्लान पर API कुंजी प्राप्त करें app.scrapeless.com पर।


पूर्वापेक्षाएँ

  • एक Scrapeless खाता और एक API कुंजी (मुफ्त योजना में परीक्षण क्रेडिट शामिल हैं) - app.scrapeless.com
  • कुंजी को एक वातावरण चर के रूप में एक्सपोर्ट करें ताकि यह स्रोत में कभी न पड़े:
bash Copy
export SCRAPELESS_API_KEY="your_api_token_here"
  • curl प्रारंभिक कैप्चर के लिए, और नीचे दिए गए कामकाजी क्लाइंट के लिए Python 3 के साथ requests

कोपायलट स्क्रैपर कैसे काम करता है

आप अभिनेता का नाम लेते हैं, उसे एक इनपुट देते हैं, और एक हेडर में अपनी कुंजी भेजते हैं।

  • एंडपॉइंट: POST https://api.scrapeless.com/api/v2/scraper/execute
  • अभिनेता: scraper.copilot
  • प्रमाण पत्र हेडर: x-api-token: $SCRAPELESS_API_KEY

अनुरोध पैरामीटर

इनपुट फ़ील्ड आवश्यक वर्णन
prompt हां कोपायलट को भेजा जाने वाला प्रश्न
country नहीं दो-लिपि वाला देश कोड जो रन के निवास स्थान को चिह्नित करता है (जैसे US)
mode नहीं कोपायलट उत्तर शैली; हाल के कैप्चर में डिफ़ॉल्ट smart है

curl के साथ त्वरित कैप्चर

bash Copy
curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
  -H "Content-Type: application/json" \
  -H "x-api-token: ${SCRAPELESS_API_KEY}" \
  -d '{
    "actor": "scraper.copilot",
    "input": { "prompt": "2026 में सबसे अच्छे प्रॉक्सी प्रदाता कौन हैं?", "country": "US", "mode": "smart" }
  }'

उत्तर लिफाफा

json Copy
// उदाहरणात्मक नमूना - एक सक्रिय scraper.copilot रन से स्कीमा; मान संक्षिप्त
{
  "status": "success",
  "task_id": "…",
  "task_result": {
    "prompt": "2026 में सबसे अच्छे प्रॉक्सी प्रदाता कौन हैं?",
    "mode": "smart",
    "result_text": "सर्वश्रेष्ठ प्रदाता आपके उपयोग के मामले पर निर्भर करता है… [1]",
    "citations": [
      { "title": "2026 के लिए 10 सर्वश्रेष्ठ प्रॉक्सी प्रदाता: परीक्षण किया और रैंक किया", "url": "https://…" }
    ],
    "links": [
      "https://…"
    ]
  }
}

फ़ील्ड दर फ़ील्ड:

फ़ील्ड प्रकार यह क्या रखता है
status स्ट्रिंग पूर्ण रन पर success
task_id स्ट्रिंग रन की पहचान, आपके अपने भंडार में ऑडिट कुंजी के रूप में उपयोगी
task_result.prompt स्ट्रिंग वह प्रॉम्प्ट जैसा कि कोपायलट ने इसे प्राप्त किया
task_result.mode स्ट्रिंग उत्तर मोड जिसने प्रतिक्रिया उत्पन्न की (जैसे smart)
task_result.result_text स्ट्रिंग पूर्ण उत्तर जैसा कि मार्कडाउन में है, इनलाइन उद्धरण मार्कर संरक्षित हैं
task_result.citations[] एरे प्रत्येक उद्धृत स्रोत { title, url } के रूप में
task_result.links[] एरे उत्तर के साथ प्रस्तुत शुद्ध लिंक, जब उपलब्ध हो

अपने निशुल्क योजना पर अपना API कुंजी प्राप्त करें: app.scrapeless.com


Python में API का एकीकरण

एक पूर्ण क्लाइंट: प्रॉम्प्ट भेजें, लिफाफा जांचें, और उद्धरण तालिका प्रिंट करें।

python Copy
import os
import requests

ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"


def ask_copilot(prompt: str, country: str = "US", mode: str = "smart") -> dict:
    resp = requests.post(
        ENDPOINT,
        headers={
            "Content-Type": "application/json",
            "x-api-token": os.environ["SCRAPELESS_API_KEY"],
        },
        json={"actor": "scraper.copilot", "input": {"prompt": prompt, "country": country, "mode": mode}},
        timeout=180,
    )
    resp.raise_for_status()
    return resp.json()


if __name__ == "__main__":
    data = ask_copilot("2026 में सबसे अच्छे प्रॉक्सी प्रदाता कौन हैं?")
    result = data.get("task_result", {})
    citations = result.get("citations") or []
    print(f"status={data.get('status')} mode={result.get('mode')} citations={len(citations)}")
    for i, c in enumerate(citations, 1):
        print(f"  [{i}] {c.get('title', '')[:60]} → {c.get('url', '')[:60]}")

उत्तर का शरीर result.get("result_text") में मार्कडाउन के रूप में रहता है; उद्धरण का कार्य करने के लिए ऊपर की लूप आमतौर पर पूरा काम होता है - प्रिंट किए गए URL को डोमेन द्वारा समूहित करें और गिनें।


AI-उत्तर परिदृश्य के बाकी के लिए साथी अभिनेता

समान एंडपॉइंट, हेडर, और लिफाफा पड़ोसी प्लेटफार्मों को कवर करते हैं - केवल अभिनेता के नाम और एक या दो प्लेटफ़ॉर्म-विशिष्ट फ़ील्ड में परिवर्तन होता है:

  • scraper.chatgpt — समान प्रॉम्प्ट/देश इनपुट; result_text के साथ एक content_references उद्धरण एरे और search_result पैनल लौटाता है।
  • scraper.grok — एक आवश्यक तर्क mode जोड़ता है और अलग-अलग web_search_results और x_search_results उद्धरण पैनल लौटाता है।
  • scraper.gemini — चैटजीपीटी के रूप में समान दो-क्षेत्र इनपुट; result_text के साथ एक citations एरे लौटाता है।
  • scraper.perplexity — एक आवश्यक country और एक web_search ध्वज लेता है; web_results, media_items, और संबंधित प्रॉम्प्ट लौटाता है।
  • scraper.overview / scraper.aimode — Google का AI ओवरव्यू ब्लॉक और AI मोड टैब; AI ओवरव्यू गाइड उस जोड़ी को अंत से अंत तक कवर करता है।

लाइन की कीमत उपयोग-आधारित है और साइनअप पर मुफ्त परीक्षण क्रेडिट उपलब्ध हैं - वर्तमान स्तर प्राइसिंग पृष्ठ पर हैं।


सामान्य समस्याओं से बचने का तरीका

  • कुछ प्रॉम्प्ट पर उद्धरण खाली हैं। Copilot हर उत्तर के लिए स्रोत का हवाला नहीं देता - राय से भरे या पूरी तरह से जनरेटिव प्रॉम्प्ट citation-free हो सकते हैं। उद्धरण ट्रैकिंग के लिए, प्रॉम्प्ट को ऐसे वाक्यांश करें जैसे एक शोध करने वाला खरीदार ("Y के लिए सबसे अच्छा X") करेगा, जो विश्वसनीय रूप से वेब-आधारित उत्तरों को ट्रिगर करता है।
  • प्रत्युत्तर अलग-अलग चलते हैं। समान प्रॉम्प्ट कुछ मिनटों के भीतर अलग-अलग उत्तर और उद्धरण सेट उत्पन्न कर सकता है - वह अस्थिरता ही वह घटना है जिसे आप माप रहे हैं। हर कैप्चर को उसके task_id और टाइमस्टैम्प के साथ संग्रहीत करें और श्रृंखला को सिग्नल के रूप में मानें, न कि किसी एकल रन को।
  • हर फ़ील्ड को nullable के रूप में मानें। links अक्सर खाली होता है और उद्धरण की गिनती विभिन्न रन के बीच बदलती है। जो कुछ भी है उसे पढ़ें, न कि एक निश्चित आकार का दावा करें।
  • देश को जानबूझकर पिन करें। एक बिना पिन किया गया रन एक उत्तर कैप्चर करता है; एक पिन किया गया रन उस बाजार के लिए उत्तर कैप्चर करता है जो आपके लिए महत्वपूर्ण है। अपने संग्रहीत रिकॉर्ड में country मान रखें ताकि श्रृंखलाएँ तुलना योग्य बनी रहें।

निष्कर्ष: Copilot उत्तर एक-संभाविता निर्भरता के रूप में

Copilot Windows, Edge, और Microsoft 365 उपयोगकर्ताओं के एक बड़े आधार के लिए पहला सहायक है, और जो उत्तर यह देता है वह तय करता है कि आपका ब्रांड कैसे देखा जाता है। scraper.copilot अभिनेता उस उत्तर को एक संरचित रिकॉर्ड में बदलता है - पाठ, उद्धरण, लिंक - हर दूसरे Scrapeless LLM अभिनेता के समान पैकेज में, इसलिए Copilot की निगरानी एक पाइपलाइन में एक-पंक्ति का योगदान है जिसे आप पहले से ChatGPT या Gemini के लिए चला सकते हैं।

क्या आप अपने AI-उत्तर डेटा पाइपलाइन बनाने के लिए तैयार हैं?

हमारे समुदाय से जुड़ें, एक मुफ्त योजना का दावा करें और उन डेवलपर्स से जुड़ें जो AI-उत्तर पाइपलाइनों का निर्माण कर रहे हैं: डिस्कॉर्ड · टेलीग्राम

app.scrapeless.com पर मुफ्त परीक्षण क्रेडिट के लिए साइन अप करें, और अपने निगरानी कार्यक्रम की जरूरतों के लिए प्रॉम्प्ट, बाजार और शेड्यूल पर scraper.copilot अभिनेता को पॉइंट करें।

सामान्य प्रश्न

प्रश्न: क्या Microsoft Copilot उत्तरों को स्क्रैप करना कानूनी है?

उत्तर: यह अभिनेता सार्वजनिक रूप से उपलब्ध उत्तर सामग्री को पढ़ता है, जिसे एक आगंतुक देखता है। किसी भी स्क्रैपिंग की तरह, उपयोग को सार्वजनिक डेटा तक सीमित करें, प्लेटफ़ॉर्म की शर्तों का सम्मान करें, व्यक्तिगत डेटा एकत्र करने से बचें, और यदि उपयोग का मामला स्पष्ट नहीं है तो एक वकील से परामर्श करें।

प्रश्न: क्या मुझे Microsoft खाता चाहिए या साइन-इन संभालना है?

उत्तर: नहीं। प्रमाणीकरण, सत्र प्रबंधन, और रेंडरिंग सर्वर-साइड पर चलते हैं; आप एक प्रॉम्प्ट भेजते हैं और JSON पढ़ते हैं।

प्रश्न: जब मैं वही प्रॉम्प्ट चलाई तो उद्धरण हर बार अलग क्यों होते हैं?

उत्तर: Copilot उत्तरों को गतिशील रूप से उत्पन्न करता है और प्रत्येक रन के लिए स्रोतों का फिर से चयन करता है, इसलिए उद्धरण सेट बदलता है। वह रन-से-रन विविधता ही सिग्नल है जिसे एक निगरानी श्रृंखला ट्रैक करने के लिए बनाई गई है - प्रत्येक कैप्चर को उसके task_id और टाइमस्टैम्प के साथ संग्रहीत करें।

प्रश्न: क्या मैं एक विशेष देश के लिए उत्तर कैप्चर कर सकता हूँ?

उत्तर: हां। इनपुट में दो-हरफ country कोड पास करें ताकि देश के उस बाजार में आवासीय निकासी के लिए रन को पिन करने के लिए, ताकि आप उस उत्तर को कैप्चर करें जो एक स्थानीय उपयोगकर्ता देखेगा।

प्रश्न: यह ChatGPT या Gemini स्क्रैपर से कैसे अलग है?

उत्तर: केवल अभिनेता का नाम और एक या दो फ़ील्ड। scraper.copilot अपने उद्धरण citations के तहत लौटाता है; पैकेज { status, task_id, task_result } समान है, इसलिए एक क्लाइंट पूरे LLM-उत्तर लाइन को कवर करता है।

स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।

सबसे लोकप्रिय लेख

सूची