Como Rastrear a Classificação da Sua Marca em Listas de Recomendação de IA
Expert Network Defense Engineer
Resumo:
- Assistentes de IA respondem "melhor ferramenta para X" com uma lista classificada, e sua posição nela é um número mensurável. Estar na lista — e onde — decide se um comprador que pergunta algum dia o verá.
- Um prompt, vários mecanismos, um envelope. Os atores LLM Scrapeless (
scraper.chatgpt,scraper.perplexity,scraper.gemini, e outros) compartilham um ponto final e uma forma{ status, task_id, task_result }, portanto, um único loop captura a resposta classificada de cada mecanismo. - A métrica é a classificação da sua marca por mecanismo — estar ausente é um resultado válido e importante. Extraia a lista ordenada da resposta, encontre sua marca e registre sua posição; "não classificado" em um mecanismo é a lacuna a ser preenchida, não um ponto de dados ausente.
- A classificação é independente da parcela de citações. Um mecanismo pode citar sua página, mas deixá-lo fora de sua lista de recomendações; as duas métricas respondem a perguntas diferentes e devem ser rastreadas separadamente.
- Funciona em um cronograma. Recapture o mesmo prompt de intenção de compra ao longo do tempo e observe sua posição mudar conforme seu conteúdo e reputação mudam.
- Gratuito para começar. Novas contas Scrapeless incluem créditos de teste gratuitos — inscreva-se em app.scrapeless.com.
Pipeline em um relance
Quando um comprador pergunta a um assistente de IA pela melhor ferramenta em sua categoria, a resposta é uma lista ordenada — primeira escolha, segunda escolha, e assim por diante. Essa ordenação é o equivalente moderno de um ranking de busca, exceto que não há página dois e nenhuma maneira de rolar para mais. Ou você está na lista, perto do topo, ou é invisível para esse comprador.
Este pipeline transforma essa ordenação em um número que você pode acompanhar. Três estágios em cima do Universal Scraping API:
- Captura — execute um prompt fixo "melhor [categoria]" através dos mecanismos de resposta da IA por meio de seus atores Scrapeless; armazene cada resposta.
- Análise — extraia a lista ordenada da markdown de cada resposta (itens numerados e cabeçalhos classificados).
- Localização — encontre sua marca em cada lista e registre sua posição, ou
ausentequando não estiver lá.
A saída é uma classificação por mecanismo para sua marca. Para a métrica acompanhante — quais fontes os mecanismos citam — consulte o guia do scraper de Visão Geral da IA.
O Que Você Pode Fazer Com Isso
- Saiba se você está na lista. A primeira pergunta é binária: o assistente menciona você quando perguntado sobre o melhor em sua categoria? Acompanhe isso por mecanismo.
- Observe sua posição mudar. Uma vez que você está em uma lista, a classificação é o indicador — capture em cronograma e veja se você sobe ou desce.
- Encontre o mecanismo que te ignora. A classificação muitas vezes difere entre assistentes; aquele que o deixa de fora é onde o trabalho de visibilidade é mais urgente.
- Vincule a classificação ao trabalho de conteúdo. Capture antes e depois de um lançamento ou um envio de documentação e meça se a posição responde.
- Informe a liderança com um número. "Estamos na 4ª posição em um mecanismo e ausentes em dois" é um status mais claro do que uma captura de tela.
Por Que os Atores LLM Scrapeless
Cada assistente de IA é uma aplicação JavaScript por trás de autenticação e defesas anti-automação; capturar a resposta você mesmo significa renderização, login e rotação de proxy por plataforma. Os atores LLM Scrapeless executam esse servidor no lado do servidor e retornam a resposta como um campo. Para rastreamento de classificação especificamente, eles trazem:
- Um envelope compartilhado
{ status, task_id, task_result }entre mecanismos, então um loop e um analisador cobrem todo o conjunto. result_textcomo markdown — a lista numerada permanece intacta, que é o que o analisador lê.- Egress residencial em mais de 195 países, então um
countryfixo captura a classificação que um usuário real naquele mercado vê através de cabeçalhos de proxy encaminhado. - Nenhum navegador para rodar ou manter logado — um ponto final HTTP, um cabeçalho
x-api-token.
Os preços para a linha de atores são baseados em uso com créditos de teste gratuitos ao se inscrever — os níveis atuais estão na página de preços. Obtenha sua chave de API no plano gratuito em app.scrapeless.com.
Pré-requisitos
- Uma conta Scrapeless e uma chave de API (o plano gratuito inclui créditos de teste) — app.scrapeless.com.
- A chave no seu ambiente:
bash
export SCRAPELESS_API_KEY="seu_token_api_aqui"
- Python 3 com
requests. As etapas de análise e localização usam apenas a biblioteca padrão.
Etapa 1 — Capturar as respostas classificadas
Um loop cobre todos os motores, pois os atores compartilham um ponto de extremidade e um envelope. O texto da resposta vai para result_text como markdown, a lista numerada intacta.
python
import json
import os
import time
import requests
ENDPOINT = "https://api.scrapeless.com/api/v2/scraper/execute"
HEADERS = {
"Content-Type": "application/json",
"x-api-token": os.environ["SCRAPELESS_API_KEY"],
}
PROMPT = "Quais são as melhores APIs de web scraping em 2026? Dê uma lista classificada."
COUNTRY = "US"
ENGINES = {
"chatgpt": {"actor": "scraper.chatgpt", "extra": {}},
"perplexity": {"actor": "scraper.perplexity", "extra": {"web_search": True}},
"gemini": {"actor": "scraper.gemini", "extra": {}},
}
with open("answers.jsonl", "w", encoding="utf-8") as out:
for platform, spec in ENGINES.items():
payload = {"actor": spec["actor"], "input": {"prompt": PROMPT, "country": COUNTRY, **spec["extra"]}}
data = requests.post(ENDPOINT, headers=HEADERS, json=payload, timeout=300).json()
result = data.get("task_result") or {}
out.write(json.dumps({
"platform": platform,
"prompt": PROMPT,
"captured_at": int(time.time()),
"status": data.get("status"),
"result_text": result.get("result_text") or "",
}) + "\n")
print(f"{platform}: {data.get('status')}")
Etapas 2 e 3 — Analisar a lista e localizar sua marca
Extraia os itens ordenados de cada resposta, em seguida encontre a posição da sua marca. O script imprime apenas a classificação da sua própria marca — o restante da lista permanece na captura bruta, não no seu relatório.
python
# rank.py — answers.jsonl -> a classificação da sua marca por motor
import json
import re
BRAND = "Scrapeless"
def ranked_items(text):
# itens da lista numerada: "1. Nome", "### 2. Nome", "3) **Nome**"
items = re.findall(r"(?:^|\n)\s*(?:#{2,4}\s*)?(\d{1,2})[.\)]\s*\**([A-Za-z0-9][^\n*:]{1,40})", text)
return [(int(n), name.strip()) for n, name in items]
for line in open("answers.jsonl", encoding="utf-8"):
record = json.loads(line)
items = ranked_items(record["result_text"])
position = next((n for n, name in items if BRAND.lower() in name.lower()), None)
rank = position if position is not None else "ausente"
print(f"{record['platform']:11} list_size={len(items):2} {BRAND}_rank={rank}")
Uma execução ao vivo sobre "melhores APIs de web scraping em 2026" retornou listas ordenadas de todos os três motores — e Scrapeless estava ausente de cada um deles. Isso não é um resultado nulo; é a constatação. Para esta categoria e prompt, um comprador que perguntasse a qualquer um dos três assistentes nunca veria a marca, o que torna "entrar na lista" o objetivo concreto e mensurável — e a classificação a métrica que diz quando o trabalho atinge o alvo.
| Motor | Tamanho da lista | Classificação Scrapeless |
|---|---|---|
| ChatGPT | 11 | ausente |
| Perplexity | 10 | ausente |
| Gemini | 7 | ausente |
Agendando e escalando a série
Execute capture.py e depois rank.py em um cronograma e anexe cada execução chaveada por captured_at. Algumas notas das execuções ao vivo:
- Ausente é um valor rastreado, não uma lacuna nos dados. Registre-o da mesma forma que você grava um número, para que no dia em que se torne uma classificação você possa ver a mudança.
- As respostas se regeneram, então a classificação oscila. Acompanhe a tendência ao longo das execuções, não uma única captura.
- Fixe o
country. Listas de recomendações mudam por mercado; mantenha o valor nos seus registros para que a série permaneça comparável. - Varie o prompt de forma deliberada. "Melhor [categoria]" e "melhor [categoria] para [caso de uso]" podem retornar listas diferentes — rastreie os prompts que correspondem a como seus compradores realmente perguntam.
Conclusão: a classificação é o placar para recomendações de IA
A pesquisa deu uma classificação que você pode medir; assistentes de IA deram uma lista que você, em sua grande maioria, não consegue ver — até capturá-la. Os atores do Scrapeless LLM tornam a lista de recomendações um campo estruturado, então "estamos nela, e onde?" se torna um número que você rastreia ao longo do tempo. E quando a resposta honesta é "ausente", esse é o briefing mais claro que uma equipe de crescimento pode obter.
Pronto para Construir Seu Pipeline de Dados de Respostas de IA?
Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores construindo pipelines de respostas de IA: Discord · Telegram.
Inscreva-se em app.scrapeless.com para créditos de teste gratuitos e direcione o pipeline para os prompts de intenção de compra e os mercados em que sua marca compete.
Perguntas Frequentes
P: Como a classificação é diferente da participação de citação?
R: A participação de citação conta se o motor usou sua página como fonte; a classificação é sua posição na lista de recomendações do motor. Um motor pode citá-lo sem recomendá-lo, ou recomendá-lo sem citar seu próprio domínio — perguntas diferentes, rastreadas separadamente.
P: O que significa "ausente" e é uma falha do scraper?
R: Significa que sua marca não estava na lista ordenada do motor para esse prompt — um resultado real e comum, não um erro do scraper. A captura foi bem-sucedida; a lista simplesmente não incluiu você. Essa ausência é o sinal mais acionável que o pipeline produz.
P: Por que minha classificação muda entre execuções?
R: Cada motor regenera sua resposta, portanto a ordem varia. Acompanhe a tendência entre as execuções em vez de reagir a uma única captura.
P: É legal capturar respostas de IA?
R: Os agentes leem conteúdo de resposta disponível publicamente. Assim como em qualquer scraping, restrinja o uso a dados públicos, respeite os termos de cada plataforma, evite dados pessoais e consulte um advogado se um caso de uso não estiver claro.
P: Posso acompanhar a classificação para um mercado específico?
R: Sim. Passe um código de país de duas letras na entrada para vincular a execução ao acesso residencial naquele mercado, de modo que a classificação reflita o que um comprador local veria.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.



