🎯 Um navegador em nuvem personalizável e anti-detecção alimentado por Chromium desenvolvido internamente, projetado para rastreadores web e agentes de IA. 👉Experimente agora
De volta ao blog

API do Scraper do Microsoft Copilot: Capturar Respostas e Citações

Daniel Kim
Daniel Kim

Lead Scraping Automation Engineer

29-Jun-2026

TL;DR:

  • Uma API de scraper Copilot transforma a resposta do Microsoft Copilot em JSON estruturado. Um POST para o ator scraper.copilot retorna o texto da resposta, as citações por trás dela e os links exibidos — em forma de campos, não como uma captura de tela.
  • Três entradas executam todo o processo. prompt carrega a pergunta, um country opcional delimita a execução para a saída residencial nesse mercado, e um mode opcional seleciona o estilo de resposta do Copilot.
  • As citações chegam prontas para gráficos. citations lista cada fonte citada como { title, url } — o material bruto para o rastreamento da citação sem uma etapa de análise.
  • O envelope nunca muda. Cada chamada retorna { status, task_id, task_result }, a mesma estrutura que os outros atores LLM do Scrapeless, assim um wrapper escrito para o Copilot se estende ao ChatGPT, Grok, Gemini e Perplexity sem alterações.
  • Sem navegador para cuidar. Renderização, gerenciamento de sessão e rotação de proxy são feitos no lado do servidor; você chama um endpoint com um cabeçalho x-api-token e lê o JSON de volta.
  • Gratuito para começar. Novas contas Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.

Introdução: Respostas do Copilot onde o comprador já trabalha

O Microsoft Copilot está dentro do Windows, Edge, Microsoft 365 e Bing — portanto, para uma grande parte dos usuários de negócios, o Copilot é o assistente que eles consultam primeiro. Quando esse usuário pede o melhor CRM, o melhor fornecedor de proxy ou a melhor ferramenta de help desk, o Copilot retorna uma resposta sintetizada curta com uma mão cheia de fontes citadas. Uma marca é mencionada nessa resposta ou é invisível para aquele comprador.

Rastrear essa resposta manualmente não escala: a resposta é gerada nova a cada vez, as fontes citadas rodam e a redação muda de execução para execução. Para monitorar como dados, você precisa da resposta e suas citações como campos estruturados.

Este guia percorre o ator scraper.copilot na API Scrapeless Scraper — um único POST autenticado que retorna o texto da resposta do Copilot, suas citações e seus links como JSON, no mesmo envelope que o resto da linha de respostas LLM do Scrapeless.


O Que Você Pode Fazer Com Isso

  • Rastrear a visibilidade da marca no Copilot. Execute um conjunto fixo de prompts de intenção de compra e verifique se sua marca aparece no texto da resposta e na lista de citações.
  • Medir a participação na citação. Agrupe os URLs de citations por domínio para ver quais fontes o Copilot utiliza para um tópico e onde você se classifica em relação a elas.
  • Comparar o Copilot com os outros mecanismos. Envie o mesmo prompt para scraper.copilot, scraper.chatgpt, scraper.gemini e scraper.perplexity e compare as respostas e fontes lado a lado.
  • Monitorar a deriva da resposta. Capture o mesmo prompt em um cronograma e monitore como a resposta e suas citações mudam ao longo das semanas.
  • Alimentar pipelines a montante. O result_text estruturado e as citations caem diretamente em um banco de dados, um painel ou um conjunto de avaliação de LLM.

Por Que o Scraper Copilot Scrapeless

O Copilot é uma aplicação JavaScript por trás da autenticação do Microsoft e defesas contra automação; uma requisição HTTP bruta não retorna nada útil, e dirigir uma sessão de navegador real você mesmo significa renderização, login e rotação de proxy a serem mantidos. O Scraper Copilot Scrapeless — parte da API de Scraping Universal — executa essa superfície no lado do servidor e retorna JSON limpo. Para o Copilot especificamente, ele traz:

  • Saída residencial em mais de 195 países, portanto, um valor country captura a resposta que um usuário real nesse mercado veria.
  • Renderização e gerenciamento de sessão do lado da nuvem — sem navegador para executar, fazer login ou manter vivo.
  • Um envelope de resposta estável compartilhado com todos os outros atores LLM do Scrapeless, então um cliente cobre toda a linha.
  • Citações como campos de primeira classe{ title, url } por fonte, prontas para agrupar e contar.

Obtenha sua chave de API no plano gratuito em app.scrapeless.com.


Pré-requisitos

  • Uma conta Scrapeless e uma chave de API (o plano gratuito inclui créditos de teste) — app.scrapeless.com.
  • A chave exportada como uma variável de ambiente para que nunca apareça no código-fonte:
bash Copy
export SCRAPELESS_API_KEY="seu_token_api_aqui"
  • curl para uma primeira captura, e Python 3 com requests para o cliente trabalhado abaixo.

Como o Copilot Scraper funciona

Você nomeia o ator, fornece um input e envia sua chave em um cabeçalho.

  • Endpoint: POST https://api.scrapeless.com/api/v2/scraper/execute
  • Ator: scraper.copilot
  • Cabeçalho de autenticação: x-api-token: $SCRAPELESS_API_KEY

Parâmetros da solicitação

campo de entrada obrigatório descrição
prompt sim a pergunta a ser enviada ao Copilot
country não código do país de duas letras que define a saída residencial da execução (ex: US)
mode não estilo de resposta do Copilot; smart é o padrão em captures recentes

Captura rápida com curl

bash Copy
curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
  -H "Content-Type: application/json" \
  -H "x-api-token: ${SCRAPELESS_API_KEY}" \
  -d '{
    "actor": "scraper.copilot",
    "input": { "prompt": "Quais são os melhores provedores de proxy em 2026?", "country": "US", "mode": "smart" }
  }'

Envelope de resposta

json Copy
// amostra ilustrativa — esquema de uma execução live do scraper.copilot; valores resumidos
{
  "status": "sucesso",
  "task_id": "…",
  "task_result": {
    "prompt": "Quais são os melhores provedores de proxy em 2026?",
    "mode": "smart",
    "result_text": "O melhor provedor depende do seu caso de uso… [1]",
    "citations": [
      { "title": "10 Melhores Provedores de Proxy para 2026: Testados e Classificados", "url": "https://…" }
    ],
    "links": [
      "https://…"
    ]
  }
}

Campo por campo:

campo tipo o que contém
status string sucesso em uma execução completa
task_id string o identificador da execução, útil como uma chave de auditoria em seu próprio armazenamento
task_result.prompt string o prompt conforme recebido pelo Copilot
task_result.mode string o modo de resposta que produziu a resposta (ex: smart)
task_result.result_text string a resposta completa em markdown, marcadores de citação embutidos preservados
task_result.citations[] array cada fonte citada como { title, url }
task_result.links[] array links diretos apresentados ao lado da resposta, quando presentes

Obtenha sua chave de API no plano gratuito: app.scrapeless.com


Integrando a API em Python

Um cliente completo: envie o prompt, verifique o envelope e imprima a tabela de citações.

python Copy
import os
import requests

ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"


def ask_copilot(prompt: str, country: str = "US", mode: str = "smart") -> dict:
    resp = requests.post(
        ENDPOINT,
        headers={
            "Content-Type": "application/json",
            "x-api-token": os.environ["SCRAPELESS_API_KEY"],
        },
        json={"actor": "scraper.copilot", "input": {"prompt": prompt, "country": country, "mode": mode}},
        timeout=180,
    )
    resp.raise_for_status()
    return resp.json()


if __name__ == "__main__":
    data = ask_copilot("Quais são os melhores provedores de proxy em 2026?")
    result = data.get("task_result", {})
    citations = result.get("citations") or []
    print(f"status={data.get('status')} mode={result.get('mode')} citations={len(citations)}")
    for i, c in enumerate(citations, 1):
        print(f"  [{i}] {c.get('title', '')[:60]} → {c.get('url', '')[:60]}")

O corpo da resposta permanece em result.get("result_text") como markdown; para o trabalho de compartilhamento de citações, o loop acima geralmente é todo o trabalho — agrupe os URLs impressos por domínio e conte.


Atores acompanhantes para o restante da paisagem de respostas da IA

O mesmo endpoint, cabeçalho e envelope cobrem as plataformas vizinhas — apenas o nome do ator e um campo ou outro específico da plataforma mudam:

  • scraper.chatgpt — mesma entrada de prompt/país; retorna result_text mais um array de citações content_references e o painel search_result.
  • scraper.grok — adiciona um mode de raciocínio obrigatório e retorna painéis de citações separados web_search_results e x_search_results.
  • scraper.gemini — mesma entrada de dois campos como ChatGPT; retorna result_text mais um array de citations.
  • scraper.perplexity — aceita um country obrigatório e um sinalizador web_search; retorna web_results, media_items e prompts relacionados.
  • scraper.overview / scraper.aimode — bloco de Visão Geral da IA do Google e aba do Modo IA; o guia de Visão Geral da IA cobre esse par do início ao fim.

Os preços para a linha são baseados no uso com créditos de teste gratuito ao se inscrever — os níveis atuais estão na página de preços.


Como evitar problemas comuns

  • Citações citations vazias em alguns prompts. O Copilot não cita fontes para cada resposta — prompts com viés de opinião ou puramente gerativos podem retornar sem citações. Para rastreamento de citações, formule os prompts da maneira que um comprador em pesquisa faria ("melhor X para Y"), o que aciona de forma confiável respostas baseadas na web.
  • As respostas variam de execução para execução. O mesmo prompt pode produzir uma resposta e conjunto de citações diferentes em minutos — essa volatilidade é o fenômeno que você está medindo. Armazene cada captura com seu task_id e timestamp e trate a série, e não uma única execução, como o sinal.
  • Trate cada campo como anulável. links muitas vezes está vazio e as contagens de citações variam entre execuções. Leia o que está presente em vez de afirmar uma forma fixa.
  • Fixe o país deliberadamente. Uma execução não fixada captura uma resposta; uma execução fixada captura a resposta para um mercado que você se importa. Mantenha o valor de country em seus registros armazenados para que as séries permaneçam comparáveis.

Conclusão: Respostas do Copilot como uma dependência em uma linha

O Copilot é um assistente de primeira parada para uma grande base de usuários do Windows, Edge e Microsoft 365, e a resposta que ele retorna decide se sua marca é vista. O ator scraper.copilot transforma essa resposta em um registro estruturado — texto, citações, links — no mesmo envelope que todos os outros atores LLM Scrapeless, assim, monitorar o Copilot é uma adição de uma linha a um pipeline que você pode já estar executando para ChatGPT ou Gemini.

Pronto para Construir Seu Pipeline de Dados de Respostas em IA?

Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores construindo pipelines de respostas em IA: Discord · Telegram.

Inscreva-se em app.scrapeless.com para créditos de teste gratuitos e direcione o ator scraper.copilot aos prompts, mercados e cronogramas que seu programa de monitoramento precisa.

Perguntas Frequentes

P: A raspagem de respostas do Microsoft Copilot é legal?

R: O ator lê conteúdo de resposta disponível publicamente, o mesmo que um visitante vê. Como em qualquer raspagem, restrinja o uso a dados públicos, respeite os termos da plataforma, evite coletar dados pessoais e consulte um advogado se um caso de uso não estiver claro.

P: Preciso de uma conta Microsoft ou gerenciar o login?

R: Não. A autenticação, o gerenciamento de sessões e a renderização são feitos do lado do servidor; você envia um prompt e lê um JSON de volta.

P: Por que as citações são diferentes a cada vez que executo o mesmo prompt?

R: O Copilot gera respostas dinamicamente e re-seleciona fontes por execução, então o conjunto de citações muda. Essa variância de execução para execução é o sinal que uma série de monitoramento foi construída para rastrear — armazene cada captura com seu task_id e timestamp.

P: Posso capturar a resposta para um país específico?

R: Sim. Passe um código de country de duas letras na entrada para fixar a execução na saída residencial naquele mercado, para que você capture a resposta que um usuário local veria.

P: Como isso é diferente do raspador ChatGPT ou Gemini?

R: Apenas o nome do ator e um campo ou dois. O scraper.copilot retorna suas citações sob citations; o envelope { status, task_id, task_result } é idêntico, então um cliente cobre toda a linha de resposta LLM.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Catálogo