Amazon ASIN Lookup: Transforme um ASIN em um Registro de Produto com a Scraper API
Web Data Collection Specialist
TL;DR:
- Um ASIN é a chave primária da Amazon para um produto, e a API Amazon Scraper transforma um em um registro completo do produto. Passe uma URL de produto contendo o ASIN e o ator
scraper.amazonretorna campos de título, marca, preço, disponibilidade, avaliações, vendedor e categoria como JSON estruturado. - A consulta passa por um endpoint autenticado:
POST https://api.scrapeless.com/api/v1/scraper/requestcom um cabeçalhox-api-token, umatordescraper.amazone um objetoinputcontendo aurle umtypedeproduct. - A resposta separa dados brutos e analisados em um único payload. Cada chamada retorna três chaves de nível superior —
html(a página renderizada),metadata(o eco da solicitação) eresult(o objeto de produto analisado) — para que você possa ler campos limpos ou voltar ao HTML. - O pinning de país é um campo de solicitação de primeira classe. Um objeto
proxycom umcountrydeUSroteia a consulta através de acesso residencial nos EUA, o que mantém preços, disponibilidade e a Buy Box consistentes com o que um comprador dos EUA vê. - O mesmo ator cobre mais do que consultas de produtos. Alterar o
typeparakeywordstransforma o ator em um leitor de resultados de pesquisa (página, palavra-chave e um arrayresultde listagens), de modo que o enriquecimento e a descoberta de ASIN compartilhem uma única integração. - Grátis para começar. Novas contas Scrapeless incluem créditos gratuitos da API Scraper — inscreva-se em app.scrapeless.com.
Introdução: transforme um ASIN em um registro de produto estruturado
Cada produto na Amazon carrega um ASIN de dez caracteres, e é o único identificador que se mantém constante enquanto o título, preço e vendedor de uma listagem mudam. Equipes de precificação, construtores de catálogos e agentes de IA todos baseiam seus dados nele. A parte difícil é ir na direção oposta: de um ASIN de volta a campos de produto limpos e atuais.
Raspar uma página de produto à mão significa renderizar uma página pesada em JavaScript, sobreviver aos desafios de acesso que a Amazon coloca para o tráfego de datacenter e, em seguida, escrever seletores contra o markup que muda entre layouts e regiões. Os seletores quebram, os preços retornam localizados para o país errado, e o vendedor da Buy Box que você analisou pertence a uma região diferente da que você desejava.
Este guia percorre uma consulta ASIN em cima da API Amazon Scraper da Scrapeless — o ator gerenciado scraper.amazon na linha mais ampla da API de Raspar. Você envia uma URL de produto, o ator renderiza e analisa a página no lado do servidor, e você recebe um objeto de produto estruturado de volta. O walkthrough cobre o endpoint e seus parâmetros, uma solicitação autenticada, o esquema de resposta real e um leitor Python que consome os campos analisados.
O que a API Amazon ASIN Lookup faz
A API Amazon Scraper pega uma URL de produto contendo um ASIN e retorna o registro do produto analisado para aquela listagem. Você dá o caminho do produto canônico — https://www.amazon.com/dp/<ASIN> — e o ator scraper.amazon cuida da renderização, anti-detecção e extração de campos no servidor, e em seguida devolve JSON.
- Resolva um ASIN para campos de produto. Uma única chamada
type: productretorna o título, marca, preço, disponibilidade, classificação, contagem de avaliações, vendedor e caminho de categoria para o ASIN na URL. - Leia tanto o objeto analisado quanto a página bruta. O objeto
resultcontém os campos estruturados; a chavehtmlcontém os bytes da página renderizada para qualquer coisa que o analisador não conseguiu levantar. - Defina a região da loja. Um valor
proxy.countryroteia a consulta através da saída residencial daquele país, assim os preços e a disponibilidade correspondem àquela localidade em vez de uma saída aleatória. - Reutilize a integração para descoberta. O mesmo ator aceita uma URL de pesquisa com
type: keywordse retorna resultados de pesquisa paginados, assim a descoberta de catálogo e o enriquecimento por ASIN são realizados por meio de um único endpoint. - Evite a complexidade do navegador. Sem navegador headless local, sem pool de proxies e sem manutenção de seletores — você lê campos do esquema analisado em vez de ter que manter qualquer um deles.
Endpoints e parâmetros
A consulta ASIN da Amazon é uma chamada síncrona ao endpoint de solicitação da API Scraper.
POST https://api.scrapeless.com/api/v1/scraper/request
O corpo da solicitação contém três campos de nível superior:
| Campo | Tipo | Obrigatório | Descrição |
|---|---|---|---|
ator |
string | sim | O identificador do serviço de scraping — scraper.amazon para Amazon. |
input |
object | sim | Parâmetros da tarefa. Para uma consulta ASIN: url (a URL do produto /dp/<ASIN>) e type (product). |
proxy |
object | não | Configuração de egress. country (por exemplo, US) define a região da loja. |
Dentro de input, a consulta ASIN usa dois campos:
Campo input |
Exemplo | Descrição |
|---|---|---|
url |
https://www.amazon.com/dp/B07ZPKBL9V |
A URL do produto canônica. O ASIN está na parte de caminho /dp/. |
tipo |
produto |
Seleciona o parser de detalhes do produto. Defina como palavras-chave para ler uma URL de resultados de busca em vez disso. |
A autenticação é um único cabeçalho, x-api-token, que transporta sua chave de API Scrapeless. A consulta do produto retorna inline — o corpo JSON volta na mesma resposta HTTP, portanto, não é necessário um passo de polling de resultados para scraper.amazon.
Obtenha sua chave de API no plano gratuito: app.scrapeless.com
Uma consulta ASIN autenticada
Esta solicitação busca um único ASIN e fixa a saída na loja dos EUA. O cabeçalho x-api-token transporta sua chave; mantenha-a em uma variável de ambiente em vez do comando.
bash
# Procure um ASIN (B07ZPKBL9V) e fixe a loja dos EUA.
curl -s -X POST "https://api.scrapeless.com/api/v1/scraper/request" \
-H "Content-Type: application/json" \
-H "x-api-token: ${SCRAPELESS_API_KEY}" \
-d '{
"actor": "scraper.amazon",
"input": {
"url": "https://www.amazon.com/dp/B07ZPKBL9V",
"type": "produto"
},
"proxy": { "country": "US" }
}'
A resposta chega como um único objeto JSON com chaves html, metadata e result. O objeto metadata ecoa a solicitação — o tipo que você pediu e um rawUrl apontando para a página renderizada armazenada:
json
{
"rawUrl": "https://api.scrapeless.com/storage/scrapeless.scraper.amazon/<hash>.html",
"type": "produto"
}
O esquema da resposta
Os dados estruturados do produto analisados estão sob result. Abaixo está a estrutura retornada para o ASIN B07ZPKBL9V, com os nomes dos campos exatamente como o ator os emite e os valores capturados da consulta ao vivo.
json
{
// O esquema reflete exatamente o que o parser de produtos scraper.amazon emite.
// Os valores são uma captura real para o ASIN B07ZPKBL9V; o array de recursos é uma amostra ilustrativa.
"result": {
"asin": "B07ZPKBL9V",
"input_asin": "B07ZPKBL9V",
"parent_asin": "B0GR1S2JM2",
"title": "Apple iPhone 11, 64GB, PRODUCT RED - Desbloqueado (Renovado)",
"brand": "Apple",
"manufacturer": "Apple Computer",
"final_price": "$174.00",
"initial_price": "$174.64",
"discount": "-11%",
"availability": "Apenas 4 em estoque - faça o pedido em breve.",
"is_available": true,
"reviews_count": 60289,
"seller_name": "WirelessSource",
"categories": ["Telefones Celulares & Acessórios", "Telefones Celulares"],
"domain": "https://www.amazon.com",
"url": "https://www.amazon.com/dp/B07ZPKBL9V",
"images_count": 1,
"features": ["...", "...", "..."]
}
}
O objeto do produto contém mais do que os campos acima — o result completo também expõe buybox_seller, number_of_sellers, product_dimensions, item_weight, date_first_available, model_number, variations, product_details, prices_breakdown, e um array images aninhado, entre outros. Campos que não se aplicam a uma determinada listagem retornam vazios em vez de ausentes, portanto, codifique contra presença, não ausência.
Alguns campos merecem uma segunda olhada:
asinvsinput_asinvsparent_asin.input_asiné o ASIN que você enviou;asiné a listagem para a qual a página se resolveu;parent_asiné o grupo de variações ao qual a listagem pertence. Para uma variação filha, os três podem diferir.- Os preços são strings com seu glifo de moeda.
final_priceé"$174.00", não um número — analise o valor numérico você mesmo se precisar de aritmética, e leiaprices_breakdownpara os preços componentes. is_availableé o booleano no qual você deve bifurcar.availabilityé a string legível ("Apenas 4 em estoque");is_availableé a flag de máquina.reviews_counté um inteiro. Ele conta avaliações na listagem no momento da consulta e muda entre as chamadas.
Manipulando a saída estruturada
No código, a consulta é um POST e uma leitura do result. Este leitor Python extrai os campos que a maioria dos catálogos precisa e imprime um registro plano.
python
import os
import requests
API_URL = "https://api.scrapeless.com/api/v1/scraper/request"
def lookup_asin(asin: str, country: str = "US") -> dict:
"""Resolver um único ASIN da Amazon para seu registro de produto analisado."""
payload = {
"actor": "scraper.amazon",
"input": {
"url": f"https://www.amazon.com/dp/{asin}",
"type": "produto",
},
"proxy": {"country": country},
}
headers = {
"Content-Type": "application/json",
"x-api-token": os.environ["SCRAPELESS_API_KEY"],
}
response = requests.post(API_URL, json=payload, headers=headers, timeout=120)
response.raise_for_status()
return response.json()["result"]
if __name__ == "__main__":
product = lookup_asin("B07ZPKBL9V")
record = {
"asin": product.get("asin"),
"title": product.get("title"),
python
"marca": product.get("brand"),
"preço": product.get("final_price"),
"em_estoque": product.get("is_available"),
"contagem_de_avaliações": product.get("reviews_count"),
"vendedor": product.get("seller_name"),
"categoria": " > ".join(product.get("categories") or []),
}
print(record)
O leitor acessa tudo a partir de result e trata campos ausentes como None através de .get(), que corresponde a como o ator retorna campos inaplicáveis vazios. Para enriquecer uma lista de ASINs, faça um loop sobre eles e mantenha a concorrência modesta — alguns trabalhadores por vez são suficientes, e mantém a saída de cada loja limpa.
Para descoberta de catálogo em vez de enriquecimento por ASIN, troque type por keywords e passe uma URL de pesquisa (https://www.amazon.com/s?k=<query>); a mesma chamada retornará então um objeto result com keyword, current_page, total_page e uma matriz result de listagens que você pode alimentar de volta na busca pelo ASIN acima. O mesmo padrão se aplica ao restante de um pipeline de preços competitivos ou catálogo — combine-o com a lista ranqueada no melhores guias de raspadores da Amazon para ver onde um ator gerenciado se encaixa em relação às alternativas, e verifique preços da API de raspagem antes de aumentar o volume de chamadas.
Conclusão: crie um feed de produtos indexado por ASIN
Uma busca de ASIN na Amazon se resume a quatro decisões: envie a URL /dp/<ASIN>, defina type como product, fixe proxy.country na loja que você deseja e leia os campos analisados de result. A API de Raspagem da Amazon gerenciada cuida da renderização, anti-detecção e parsing, então você codifica contra o esquema analisado em vez de um conjunto de seletores que pode quebrar na próxima reformulação.
A partir daqui, o mesmo ator scraper.amazon alimenta um pipeline mais amplo: type: keywords descobre ASINs, type: product enriquece cada um, e uma saída fixada por país mantém preços e disponibilidade honestos por região. A referência completa de solicitações e respostas está na documentação do Scrapeless. Trate preços como strings, faça ramificações em is_available e leia campos vazios como anuláveis em vez de erros.
Pronto para Construir Seu Pipeline de Dados Potencializado por IA?
Junte-se à nossa comunidade para reivindicar um plano gratuito e conectar-se com desenvolvedores que estão construindo pipelines de dados de produtos da Amazon: Discord · Telegram.
Inscreva-se em app.scrapeless.com para créditos gratuitos da API de Raspagem e adapte a busca acima para os ASINs, lojas e regiões que seu catálogo precisa.
FAQ
Q: O que é um ASIN e onde eu o encontro?
Um ASIN é o número de identificação padrão de dez caracteres da Amazon para um produto. Ele aparece na URL do produto após /dp/ (por exemplo, B07ZPKBL9V em amazon.com/dp/B07ZPKBL9V) e na seção "Informações do produto" do anúncio. A API de Raspagem da Amazon lê o ASIN diretamente da url que você passa.
Q: Eu envio o ASIN ou a URL completa?
Você envia a URL completa do produto com o ASIN no segmento /dp/ e define input.type como product. O ator analisa o ASIN do caminho e o devolve para você como input_asin (o que você enviou) e asin (o que a página resolveu).
Q: É legal raspar dados de produtos da Amazon por ASIN?
Os dados de listagem de produtos públicos são geralmente acessíveis, mas a legalidade depende da sua jurisdição, dos dados que você coleta e dos termos de serviço da Amazon. Revise os termos aplicáveis e consulte um advogado para seu caso específico. O Scrapeless acessa apenas dados publicamente disponíveis.
Q: Eu preciso fixar um país de proxy?
Para preços e disponibilidade consistentes, sim. A Amazon localiza preços, o Buy Box e o estoque por região, então defina proxy.country como a loja que você deseja (por exemplo, US para amazon.com). Sem isso, a região de saída pode variar e distorcer os preços que você lê.
Q: Por que alguns campos estão vazios na resposta?
O parser de produtos retorna todos os campos em seu esquema e deixa os que não se aplicam a uma listagem vazios em vez de descartá-los. Um telefone renovado não terá ingredients; um livro não terá item_weight. Trate campos vazios como anuláveis e faça ramificações com base na presença deles no seu código.
Q: Posso procurar muitos ASINs de uma vez?
O endpoint resolve um ASIN por solicitação, então itere sobre sua lista de ASINs e chame por item. Mantenha a concorrência modesta — alguns trabalhadores de cada vez — para manter a saída de cada loja limpa enquanto você enriquece um catálogo.
Q: Como eu encontro ASINs para procurar em primeiro lugar?
Use o mesmo ator com input.type definido como keywords e uma URL de pesquisa (amazon.com/s?k=<query>). Ele retorna um array result paginado de listagens com seus ASINs, que você então alimenta na busca type: product para obter registros completos.
Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.



