API do Scraper do Microsoft Copilot: Capturar Respostas e Citações
Lead Scraping Automation Engineer
TL;DR:
- Uma API de scraper Copilot transforma a resposta do Microsoft Copilot em JSON estruturado. Um POST para o ator
scraper.copilotretorna o texto da resposta, as citações por trás dela e os links exibidos — em forma de campos, não como uma captura de tela. - Três entradas executam todo o processo.
promptcarrega a pergunta, umcountryopcional delimita a execução para a saída residencial nesse mercado, e ummodeopcional seleciona o estilo de resposta do Copilot. - As citações chegam prontas para gráficos.
citationslista cada fonte citada como{ title, url }— o material bruto para o rastreamento da citação sem uma etapa de análise. - O envelope nunca muda. Cada chamada retorna
{ status, task_id, task_result }, a mesma estrutura que os outros atores LLM do Scrapeless, assim um wrapper escrito para o Copilot se estende ao ChatGPT, Grok, Gemini e Perplexity sem alterações. - Sem navegador para cuidar. Renderização, gerenciamento de sessão e rotação de proxy são feitos no lado do servidor; você chama um endpoint com um cabeçalho
x-api-tokene lê o JSON de volta. - Gratuito para começar. Novas contas Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.
Introdução: Respostas do Copilot onde o comprador já trabalha
O Microsoft Copilot está dentro do Windows, Edge, Microsoft 365 e Bing — portanto, para uma grande parte dos usuários de negócios, o Copilot é o assistente que eles consultam primeiro. Quando esse usuário pede o melhor CRM, o melhor fornecedor de proxy ou a melhor ferramenta de help desk, o Copilot retorna uma resposta sintetizada curta com uma mão cheia de fontes citadas. Uma marca é mencionada nessa resposta ou é invisível para aquele comprador.
Rastrear essa resposta manualmente não escala: a resposta é gerada nova a cada vez, as fontes citadas rodam e a redação muda de execução para execução. Para monitorar como dados, você precisa da resposta e suas citações como campos estruturados.
Este guia percorre o ator scraper.copilot na API Scrapeless Scraper — um único POST autenticado que retorna o texto da resposta do Copilot, suas citações e seus links como JSON, no mesmo envelope que o resto da linha de respostas LLM do Scrapeless.
O Que Você Pode Fazer Com Isso
- Rastrear a visibilidade da marca no Copilot. Execute um conjunto fixo de prompts de intenção de compra e verifique se sua marca aparece no texto da resposta e na lista de citações.
- Medir a participação na citação. Agrupe os URLs de
citationspor domínio para ver quais fontes o Copilot utiliza para um tópico e onde você se classifica em relação a elas. - Comparar o Copilot com os outros mecanismos. Envie o mesmo prompt para
scraper.copilot,scraper.chatgpt,scraper.geminiescraper.perplexitye compare as respostas e fontes lado a lado. - Monitorar a deriva da resposta. Capture o mesmo prompt em um cronograma e monitore como a resposta e suas citações mudam ao longo das semanas.
- Alimentar pipelines a montante. O
result_textestruturado e ascitationscaem diretamente em um banco de dados, um painel ou um conjunto de avaliação de LLM.
Por Que o Scraper Copilot Scrapeless
O Copilot é uma aplicação JavaScript por trás da autenticação do Microsoft e defesas contra automação; uma requisição HTTP bruta não retorna nada útil, e dirigir uma sessão de navegador real você mesmo significa renderização, login e rotação de proxy a serem mantidos. O Scraper Copilot Scrapeless — parte da API de Scraping Universal — executa essa superfície no lado do servidor e retorna JSON limpo. Para o Copilot especificamente, ele traz:
- Saída residencial em mais de 195 países, portanto, um valor
countrycaptura a resposta que um usuário real nesse mercado veria. - Renderização e gerenciamento de sessão do lado da nuvem — sem navegador para executar, fazer login ou manter vivo.
- Um envelope de resposta estável compartilhado com todos os outros atores LLM do Scrapeless, então um cliente cobre toda a linha.
- Citações como campos de primeira classe —
{ title, url }por fonte, prontas para agrupar e contar.
Obtenha sua chave de API no plano gratuito em app.scrapeless.com.
Pré-requisitos
- Uma conta Scrapeless e uma chave de API (o plano gratuito inclui créditos de teste) — app.scrapeless.com.
- A chave exportada como uma variável de ambiente para que nunca apareça no código-fonte:
bash
export SCRAPELESS_API_KEY="seu_token_api_aqui"
curlpara uma primeira captura, e Python 3 comrequestspara o cliente trabalhado abaixo.
Como o Copilot Scraper funciona
Você nomeia o ator, fornece um input e envia sua chave em um cabeçalho.
- Endpoint:
POST https://api.scrapeless.com/api/v2/scraper/execute - Ator:
scraper.copilot - Cabeçalho de autenticação:
x-api-token: $SCRAPELESS_API_KEY
Parâmetros da solicitação
| campo de entrada | obrigatório | descrição |
|---|---|---|
prompt |
sim | a pergunta a ser enviada ao Copilot |
country |
não | código do país de duas letras que define a saída residencial da execução (ex: US) |
mode |
não | estilo de resposta do Copilot; smart é o padrão em captures recentes |
Captura rápida com curl
bash
curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
-H "Content-Type: application/json" \
-H "x-api-token: ${SCRAPELESS_API_KEY}" \
-d '{
"actor": "scraper.copilot",
"input": { "prompt": "Quais são os melhores provedores de proxy em 2026?", "country": "US", "mode": "smart" }
}'
Envelope de resposta
json
// amostra ilustrativa — esquema de uma execução live do scraper.copilot; valores resumidos
{
"status": "sucesso",
"task_id": "…",
"task_result": {
"prompt": "Quais são os melhores provedores de proxy em 2026?",
"mode": "smart",
"result_text": "O melhor provedor depende do seu caso de uso… [1]",
"citations": [
{ "title": "10 Melhores Provedores de Proxy para 2026: Testados e Classificados", "url": "https://…" }
],
"links": [
"https://…"
]
}
}
Campo por campo:
| campo | tipo | o que contém |
|---|---|---|
status |
string | sucesso em uma execução completa |
task_id |
string | o identificador da execução, útil como uma chave de auditoria em seu próprio armazenamento |
task_result.prompt |
string | o prompt conforme recebido pelo Copilot |
task_result.mode |
string | o modo de resposta que produziu a resposta (ex: smart) |
task_result.result_text |
string | a resposta completa em markdown, marcadores de citação embutidos preservados |
task_result.citations[] |
array | cada fonte citada como { title, url } |
task_result.links[] |
array | links diretos apresentados ao lado da resposta, quando presentes |
Obtenha sua chave de API no plano gratuito: app.scrapeless.com
Integrando a API em Python
Um cliente completo: envie o prompt, verifique o envelope e imprima a tabela de citações.
python
import os
import requests
ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"
def ask_copilot(prompt: str, country: str = "US", mode: str = "smart") -> dict:
resp = requests.post(
ENDPOINT,
headers={
"Content-Type": "application/json",
"x-api-token": os.environ["SCRAPELESS_API_KEY"],
},
json={"actor": "scraper.copilot", "input": {"prompt": prompt, "country": country, "mode": mode}},
timeout=180,
)
resp.raise_for_status()
return resp.json()
if __name__ == "__main__":
data = ask_copilot("Quais são os melhores provedores de proxy em 2026?")
result = data.get("task_result", {})
citations = result.get("citations") or []
print(f"status={data.get('status')} mode={result.get('mode')} citations={len(citations)}")
for i, c in enumerate(citations, 1):
print(f" [{i}] {c.get('title', '')[:60]} → {c.get('url', '')[:60]}")
O corpo da resposta permanece em result.get("result_text") como markdown; para o trabalho de compartilhamento de citações, o loop acima geralmente é todo o trabalho — agrupe os URLs impressos por domínio e conte.
Atores acompanhantes para o restante da paisagem de respostas da IA
O mesmo endpoint, cabeçalho e envelope cobrem as plataformas vizinhas — apenas o nome do ator e um campo ou outro específico da plataforma mudam:
scraper.chatgpt— mesma entrada de prompt/país; retornaresult_textmais um array de citaçõescontent_referencese o painelsearch_result.scraper.grok— adiciona ummodede raciocínio obrigatório e retorna painéis de citações separadosweb_search_resultsex_search_results.scraper.gemini— mesma entrada de dois campos como ChatGPT; retornaresult_textmais um array decitations.scraper.perplexity— aceita umcountryobrigatório e um sinalizadorweb_search; retornaweb_results,media_itemse prompts relacionados.scraper.overview/scraper.aimode— bloco de Visão Geral da IA do Google e aba do Modo IA; o guia de Visão Geral da IA cobre esse par do início ao fim.
Os preços para a linha são baseados no uso com créditos de teste gratuito ao se inscrever — os níveis atuais estão na página de preços.
Como evitar problemas comuns
- Citações
citationsvazias em alguns prompts. O Copilot não cita fontes para cada resposta — prompts com viés de opinião ou puramente gerativos podem retornar sem citações. Para rastreamento de citações, formule os prompts da maneira que um comprador em pesquisa faria ("melhor X para Y"), o que aciona de forma confiável respostas baseadas na web. - As respostas variam de execução para execução. O mesmo prompt pode produzir uma resposta e conjunto de citações diferentes em minutos — essa volatilidade é o fenômeno que você está medindo. Armazene cada captura com seu
task_ide timestamp e trate a série, e não uma única execução, como o sinal. - Trate cada campo como anulável.
linksmuitas vezes está vazio e as contagens de citações variam entre execuções. Leia o que está presente em vez de afirmar uma forma fixa. - Fixe o país deliberadamente. Uma execução não fixada captura uma resposta; uma execução fixada captura a resposta para um mercado que você se importa. Mantenha o valor de
countryem seus registros armazenados para que as séries permaneçam comparáveis.
Conclusão: Respostas do Copilot como uma dependência em uma linha
O Copilot é um assistente de primeira parada para uma grande base de usuários do Windows, Edge e Microsoft 365, e a resposta que ele retorna decide se sua marca é vista. O ator scraper.copilot transforma essa resposta em um registro estruturado — texto, citações, links — no mesmo envelope que todos os outros atores LLM Scrapeless, assim, monitorar o Copilot é uma adição de uma linha a um pipeline que você pode já estar executando para ChatGPT ou Gemini.
Pronto para Construir Seu Pipeline de Dados de Respostas em IA?
Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores construindo pipelines de respostas em IA: Discord · Telegram.
Inscreva-se em app.scrapeless.com para créditos de teste gratuitos e direcione o ator scraper.copilot aos prompts, mercados e cronogramas que seu programa de monitoramento precisa.
Perguntas Frequentes
P: A raspagem de respostas do Microsoft Copilot é legal?
R: O ator lê conteúdo de resposta disponível publicamente, o mesmo que um visitante vê. Como em qualquer raspagem, restrinja o uso a dados públicos, respeite os termos da plataforma, evite coletar dados pessoais e consulte um advogado se um caso de uso não estiver claro.
P: Preciso de uma conta Microsoft ou gerenciar o login?
R: Não. A autenticação, o gerenciamento de sessões e a renderização são feitos do lado do servidor; você envia um prompt e lê um JSON de volta.
P: Por que as citações são diferentes a cada vez que executo o mesmo prompt?
R: O Copilot gera respostas dinamicamente e re-seleciona fontes por execução, então o conjunto de citações muda. Essa variância de execução para execução é o sinal que uma série de monitoramento foi construída para rastrear — armazene cada captura com seu task_id e timestamp.
P: Posso capturar a resposta para um país específico?
R: Sim. Passe um código de country de duas letras na entrada para fixar a execução na saída residencial naquele mercado, para que você capture a resposta que um usuário local veria.
P: Como isso é diferente do raspador ChatGPT ou Gemini?
R: Apenas o nome do ator e um campo ou dois. O scraper.copilot retorna suas citações sob citations; o envelope { status, task_id, task_result } é idêntico, então um cliente cobre toda a linha de resposta LLM.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.



