API do Scraper do Microsoft Copilot: Capturar Respostas e Citações

Daniel Kim

Lead Scraping Automation Engineer

29-Jun-2026

TL;DR:

Uma API de scraper Copilot transforma a resposta do Microsoft Copilot em JSON estruturado. Um POST para o ator scraper.copilot retorna o texto da resposta, as citações por trás dela e os links exibidos — em forma de campos, não como uma captura de tela.
Três entradas executam todo o processo. prompt carrega a pergunta, um country opcional delimita a execução para a saída residencial nesse mercado, e um mode opcional seleciona o estilo de resposta do Copilot.
As citações chegam prontas para gráficos. citations lista cada fonte citada como { title, url } — o material bruto para o rastreamento da citação sem uma etapa de análise.
O envelope nunca muda. Cada chamada retorna { status, task_id, task_result }, a mesma estrutura que os outros atores LLM do Scrapeless, assim um wrapper escrito para o Copilot se estende ao ChatGPT, Grok, Gemini e Perplexity sem alterações.
Sem navegador para cuidar. Renderização, gerenciamento de sessão e rotação de proxy são feitos no lado do servidor; você chama um endpoint com um cabeçalho x-api-token e lê o JSON de volta.
Gratuito para começar. Novas contas Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.

Introdução: Respostas do Copilot onde o comprador já trabalha

O Microsoft Copilot está dentro do Windows, Edge, Microsoft 365 e Bing — portanto, para uma grande parte dos usuários de negócios, o Copilot é o assistente que eles consultam primeiro. Quando esse usuário pede o melhor CRM, o melhor fornecedor de proxy ou a melhor ferramenta de help desk, o Copilot retorna uma resposta sintetizada curta com uma mão cheia de fontes citadas. Uma marca é mencionada nessa resposta ou é invisível para aquele comprador.

Rastrear essa resposta manualmente não escala: a resposta é gerada nova a cada vez, as fontes citadas rodam e a redação muda de execução para execução. Para monitorar como dados, você precisa da resposta e suas citações como campos estruturados.

Este guia percorre o ator scraper.copilot na API Scrapeless Scraper — um único POST autenticado que retorna o texto da resposta do Copilot, suas citações e seus links como JSON, no mesmo envelope que o resto da linha de respostas LLM do Scrapeless.

O Que Você Pode Fazer Com Isso

Rastrear a visibilidade da marca no Copilot. Execute um conjunto fixo de prompts de intenção de compra e verifique se sua marca aparece no texto da resposta e na lista de citações.
Medir a participação na citação. Agrupe os URLs de citations por domínio para ver quais fontes o Copilot utiliza para um tópico e onde você se classifica em relação a elas.
Comparar o Copilot com os outros mecanismos. Envie o mesmo prompt para scraper.copilot, scraper.chatgpt, scraper.gemini e scraper.perplexity e compare as respostas e fontes lado a lado.
Monitorar a deriva da resposta. Capture o mesmo prompt em um cronograma e monitore como a resposta e suas citações mudam ao longo das semanas.
Alimentar pipelines a montante. O result_text estruturado e as citations caem diretamente em um banco de dados, um painel ou um conjunto de avaliação de LLM.

Por Que o Scraper Copilot Scrapeless

O Copilot é uma aplicação JavaScript por trás da autenticação do Microsoft e defesas contra automação; uma requisição HTTP bruta não retorna nada útil, e dirigir uma sessão de navegador real você mesmo significa renderização, login e rotação de proxy a serem mantidos. O Scraper Copilot Scrapeless — parte da API de Scraping Universal — executa essa superfície no lado do servidor e retorna JSON limpo. Para o Copilot especificamente, ele traz:

Saída residencial em mais de 195 países, portanto, um valor country captura a resposta que um usuário real nesse mercado veria.
Renderização e gerenciamento de sessão do lado da nuvem — sem navegador para executar, fazer login ou manter vivo.
Um envelope de resposta estável compartilhado com todos os outros atores LLM do Scrapeless, então um cliente cobre toda a linha.
Citações como campos de primeira classe — { title, url } por fonte, prontas para agrupar e contar.

Obtenha sua chave de API no plano gratuito em app.scrapeless.com.

Pré-requisitos

Uma conta Scrapeless e uma chave de API (o plano gratuito inclui créditos de teste) — app.scrapeless.com.
A chave exportada como uma variável de ambiente para que nunca apareça no código-fonte:

bash Copy

export SCRAPELESS_API_KEY="seu_token_api_aqui"

curl para uma primeira captura, e Python 3 com requests para o cliente trabalhado abaixo.

Como o Copilot Scraper funciona

Você nomeia o ator, fornece um input e envia sua chave em um cabeçalho.

Endpoint: POST https://api.scrapeless.com/api/v2/scraper/execute
Ator: scraper.copilot
Cabeçalho de autenticação: x-api-token: $SCRAPELESS_API_KEY

Parâmetros da solicitação

campo de entrada	obrigatório	descrição
`prompt`	sim	a pergunta a ser enviada ao Copilot
`country`	não	código do país de duas letras que define a saída residencial da execução (ex: `US`)
`mode`	não	estilo de resposta do Copilot; `smart` é o padrão em captures recentes

Captura rápida com curl

bash Copy

curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
  -H "Content-Type: application/json" \
  -H "x-api-token: ${SCRAPELESS_API_KEY}" \
  -d '{
    "actor": "scraper.copilot",
    "input": { "prompt": "Quais são os melhores provedores de proxy em 2026?", "country": "US", "mode": "smart" }
  }'

Envelope de resposta

json Copy

// amostra ilustrativa — esquema de uma execução live do scraper.copilot; valores resumidos
{
  "status": "sucesso",
  "task_id": "…",
  "task_result": {
    "prompt": "Quais são os melhores provedores de proxy em 2026?",
    "mode": "smart",
    "result_text": "O melhor provedor depende do seu caso de uso… [1]",
    "citations": [
      { "title": "10 Melhores Provedores de Proxy para 2026: Testados e Classificados", "url": "https://…" }
    ],
    "links": [
      "https://…"
    ]
  }
}

Campo por campo:

campo	tipo	o que contém
`status`	string	`sucesso` em uma execução completa
`task_id`	string	o identificador da execução, útil como uma chave de auditoria em seu próprio armazenamento
`task_result.prompt`	string	o prompt conforme recebido pelo Copilot
`task_result.mode`	string	o modo de resposta que produziu a resposta (ex: `smart`)
`task_result.result_text`	string	a resposta completa em markdown, marcadores de citação embutidos preservados
`task_result.citations[]`	array	cada fonte citada como `{ title, url }`
`task_result.links[]`	array	links diretos apresentados ao lado da resposta, quando presentes

Obtenha sua chave de API no plano gratuito: app.scrapeless.com

Integrando a API em Python

Um cliente completo: envie o prompt, verifique o envelope e imprima a tabela de citações.

python Copy

import os
import requests

ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"


def ask_copilot(prompt: str, country: str = "US", mode: str = "smart") -> dict:
    resp = requests.post(
        ENDPOINT,
        headers={
            "Content-Type": "application/json",
            "x-api-token": os.environ["SCRAPELESS_API_KEY"],
        },
        json={"actor": "scraper.copilot", "input": {"prompt": prompt, "country": country, "mode": mode}},
        timeout=180,
    )
    resp.raise_for_status()
    return resp.json()


if __name__ == "__main__":
    data = ask_copilot("Quais são os melhores provedores de proxy em 2026?")
    result = data.get("task_result", {})
    citations = result.get("citations") or []
    print(f"status={data.get('status')} mode={result.get('mode')} citations={len(citations)}")
    for i, c in enumerate(citations, 1):
        print(f"  [{i}] {c.get('title', '')[:60]} → {c.get('url', '')[:60]}")

O corpo da resposta permanece em result.get("result_text") como markdown; para o trabalho de compartilhamento de citações, o loop acima geralmente é todo o trabalho — agrupe os URLs impressos por domínio e conte.

Atores acompanhantes para o restante da paisagem de respostas da IA

O mesmo endpoint, cabeçalho e envelope cobrem as plataformas vizinhas — apenas o nome do ator e um campo ou outro específico da plataforma mudam:

scraper.chatgpt — mesma entrada de prompt/país; retorna result_text mais um array de citações content_references e o painel search_result.
scraper.grok — adiciona um mode de raciocínio obrigatório e retorna painéis de citações separados web_search_results e x_search_results.
scraper.gemini — mesma entrada de dois campos como ChatGPT; retorna result_text mais um array de citations.
scraper.perplexity — aceita um country obrigatório e um sinalizador web_search; retorna web_results, media_items e prompts relacionados.
scraper.overview / scraper.aimode — bloco de Visão Geral da IA do Google e aba do Modo IA; o guia de Visão Geral da IA cobre esse par do início ao fim.

Os preços para a linha são baseados no uso com créditos de teste gratuito ao se inscrever — os níveis atuais estão na página de preços.

Como evitar problemas comuns

Citações citations vazias em alguns prompts. O Copilot não cita fontes para cada resposta — prompts com viés de opinião ou puramente gerativos podem retornar sem citações. Para rastreamento de citações, formule os prompts da maneira que um comprador em pesquisa faria ("melhor X para Y"), o que aciona de forma confiável respostas baseadas na web.
As respostas variam de execução para execução. O mesmo prompt pode produzir uma resposta e conjunto de citações diferentes em minutos — essa volatilidade é o fenômeno que você está medindo. Armazene cada captura com seu task_id e timestamp e trate a série, e não uma única execução, como o sinal.
Trate cada campo como anulável. links muitas vezes está vazio e as contagens de citações variam entre execuções. Leia o que está presente em vez de afirmar uma forma fixa.
Fixe o país deliberadamente. Uma execução não fixada captura uma resposta; uma execução fixada captura a resposta para um mercado que você se importa. Mantenha o valor de country em seus registros armazenados para que as séries permaneçam comparáveis.

Conclusão: Respostas do Copilot como uma dependência em uma linha

O Copilot é um assistente de primeira parada para uma grande base de usuários do Windows, Edge e Microsoft 365, e a resposta que ele retorna decide se sua marca é vista. O ator scraper.copilot transforma essa resposta em um registro estruturado — texto, citações, links — no mesmo envelope que todos os outros atores LLM Scrapeless, assim, monitorar o Copilot é uma adição de uma linha a um pipeline que você pode já estar executando para ChatGPT ou Gemini.

Pronto para Construir Seu Pipeline de Dados de Respostas em IA?

Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores construindo pipelines de respostas em IA: Discord · Telegram.

Inscreva-se em app.scrapeless.com para créditos de teste gratuitos e direcione o ator scraper.copilot aos prompts, mercados e cronogramas que seu programa de monitoramento precisa.

Perguntas Frequentes

P: A raspagem de respostas do Microsoft Copilot é legal?

R: O ator lê conteúdo de resposta disponível publicamente, o mesmo que um visitante vê. Como em qualquer raspagem, restrinja o uso a dados públicos, respeite os termos da plataforma, evite coletar dados pessoais e consulte um advogado se um caso de uso não estiver claro.

R: Não. A autenticação, o gerenciamento de sessões e a renderização são feitos do lado do servidor; você envia um prompt e lê um JSON de volta.

P: Por que as citações são diferentes a cada vez que executo o mesmo prompt?

R: O Copilot gera respostas dinamicamente e re-seleciona fontes por execução, então o conjunto de citações muda. Essa variância de execução para execução é o sinal que uma série de monitoramento foi construída para rastrear — armazene cada captura com seu task_id e timestamp.

P: Posso capturar a resposta para um país específico?

R: Sim. Passe um código de country de duas letras na entrada para fixar a execução na saída residencial naquele mercado, para que você capture a resposta que um usuário local veria.

P: Como isso é diferente do raspador ChatGPT ou Gemini?

R: Apenas o nome do ator e um campo ou dois. O scraper.copilot retorna suas citações sob citations; o envelope { status, task_id, task_result } é idêntico, então um cliente cobre toda a linha de resposta LLM.

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Aprenda a integrar o Crawl4AI com o Scrapeless Cloud Browser para uma raspagem web eficiente e em grande escala. Desbloqueie proxies automáticos, impressões digitais personalizadas, reutilização de sessões e depuração em tempo real.

Sophia Martinez

20-Oct-2025

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Servidor MCP sem resíduos está oficialmente no ar! Construa seu Conector AI-Web definitivo.

Descubra como o Servidor Scrapeless MCP fornece aos LLMs capacidades de navegação e raspagem na web em tempo real. Aprenda a construir agentes de IA que pesquisam, extraem e interagem com conteúdo web dinâmico de forma integrada.

Michael Lee

17-Jul-2025

Guia de Ferramentas USPS Sem Scrap: Extração Eficiente e Conformidade de Dados de Remessa para Sistemas B2B

Aprenda a usar a ferramenta Scrapeless USPS para buscar dados de rastreamento estruturados e em tempo real de forma eficiente e em conformidade para plataformas ERP, OMS e SaaS.

Emily Chen

02-Jul-2025

Guia de Ferramentas USPS Sem Resíduos: Extração de Dados de Envio Eficiente e em Conformidade para Sistemas B2B

Catálogo