Como Raspar Dados de Perfil do Instagram Rapidamente?

Sophia Martinez

Specialist in Anti-Bot Strategies

26-Mar-2025

O Instagram é uma das plataformas de mídia social mais populares, com milhões de usuários em todo o mundo. A extração de dados de perfis do Instagram é benéfica para empresas, desenvolvedores, especialistas em análise de dados para análise de marketing, pesquisa da concorrência ou gerenciamento de dados pessoais.

Neste artigo, mostraremos o processo de extração de dados de perfis do Instagram a fundo. Explicaremos como criar um rastreador de Instagram para extrair dados de perfis e páginas de postagens do Instagram.

É hora de aprender como extrair dados do Instagram rapidamente usando a conveniente API de Raspagem.

#Método 1. Crie seu rastreador de perfil do Instagram em Python
#Método 2. Usando a API de Raspagem, colete dados facilmente

Por que extrair dados de perfis do Instagram?

Os dados públicos do Instagram são enormes e podem fornecer todos os tipos de insights. A extração de dados de perfil pode fornecer informações valiosas sobre usuários populares em todo o mundo, ajudando você a prever tendências, rastrear o conhecimento da marca, entender como melhorar seu desempenho no Instagram ou ajudar empresas a prospectar e alcançar novos clientes conectando-se a perfis populares do Instagram com interesses semelhantes.

Além disso, os dados do Instagram extraídos são um recurso viável para estudos de análise de sentimento. Esses dados podem ser encontrados em postagens e comentários e podem ser usados para coletar a opinião pública sobre tendências e notícias específicas.

Método 1. Rastreador de perfil do Instagram em Python

Vamos começar raspando perfis de usuários do Instagram! A seguir, explicaremos detalhadamente como extrair as informações de perfil da usuária do Instagram ladygaga. Podemos fazer isso seguindo os passos abaixo:

Protegemos firmemente a privacidade do site. Todos os dados neste blog são públicos e são usados apenas como demonstração do processo de rastreamento. Não salvamos nenhuma informação e dados.

Passo 1. Analise a página de destino

Visite o URL de destino: https://www.instagram.com/ladygaga/.
Inspecione o código-fonte da página para localizar os dados JSON incorporados:

O Instagram incorpora informações do usuário em uma tag script com o formato window._sharedData.
Podemos extrair esses dados analisando o HTML.

Passo 2. Instale as bibliotecas necessárias

Certifique-se de que as seguintes bibliotecas Python estejam instaladas:
pip install requests beautifulsoup4

Passo 3. Defina os cabeçalhos da solicitação

Para simular o acesso do navegador, defina os cabeçalhos User-Agent e Referer para evitar ser bloqueado por mecanismos anti-raspagem.

Python Copy

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36",
    "Referer": "https://www.instagram.com/"
}

Passo 4. Analise os dados JSON

Precisamos extrair o conteúdo window._sharedData da tag script no HTML e convertê-lo em um dicionário Python.

Python Copy

soup = BeautifulSoup(response.text, "html.parser")
script_tag = soup.find("script", type="application/ld+json")

if not script_tag:
    print("Error: JSON data not found in the page.")
    return None

# Analise os dados JSON
try:
    data = json.loads(script_tag.string)
except json.JSONDecodeError:
    print("Error: Failed to parse JSON data.")
    return None

Passo 5. Extraia os campos necessários

Recupere o nome de usuário, biografia, contagem de seguidores, contagem de postagens e outras informações relevantes dos dados JSON analisados.

Código completo

Abaixo está o código Python completo, que você pode usar diretamente para extrair as informações do perfil da Lady Gaga:

Python Copy

import requests
from bs4 import BeautifulSoup
import json

def scrape_instagram_profile(username):
    url = f"https://www.instagram.com/ladygaga/"
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36",
        "Referer": "https://www.instagram.com/"
    }
    
    response = requests.get(url, headers=headers)
    if response.status_code != 200:
        print(f"Error: Unable to fetch data for {username}. Status code: {response.status_code}")
        return None
    
    
    soup = BeautifulSoup(response.text, "html.parser")
    script_tag = soup.find("script", type="application/ld+json")
    
    if not script_tag:
        print("Error: JSON data not found in the page.")
        return None
    
    # Analise os dados JSON
    try:
        data = json.loads(script_tag.string)
    except json.JSONDecodeError:
        print("Error: Failed to parse JSON data.")
        return None
    
   
    profile = {
        "username": data["author"]["name"],
        "bio": data["description"],
        "follower_count": data["author"]["interactionStatistic"][0]["userInteractionCount"],
        "post_count": data["author"]["interactionStatistic"][1]["userInteractionCount"]
    }
    
    return profile

# Exemplo de uso
if __name__ == "__main__":
    username = "ladygaga"
    profile_data = scrape_instagram_profile(username)
    if profile_data:
        print("Dados do perfil do Instagram:")
        print(json.dumps(profile_data, indent=4, ensure_ascii=False))

Resultados da Raspagem

Após executar o código, a saída profile_data incluirá os seguintes campos:

JSON Copy

{
    "username": "ladygaga",
    "bio": "Lady Gaga MAYHEM OUT NOW",
    "follower_count": "58.9M",
    "post_count": "3,790"
}

Método 2. API de Raspagem Scrapeless (Recomendado)

Raspar o Instagram é bastante fácil. No entanto, o Instagram é extremamente restritivo em relação ao acesso aos seus dados públicos. Ele permite apenas algumas solicitações por dia para usuários não logados, após o qual ele redireciona as solicitações para a página de login.

Como evitar o bloqueio de rastreadores do Instagram? O Scrapeless é sua ferramenta de rastreamento ideal!

O Scrapeless fornece APIs de rastreamento na web, desbloqueio na web e extração de dados para coleta de dados em larga escala.

Contorno de proteção anti-bot: Evite ser bloqueado ao rastrear a web!
Proxies residenciais rotativos: Evite proibições de IP e bloqueio geográfico.
Renderização JavaScript: Raspe páginas da web dinâmicas por meio de navegadores em nuvem.
SDKs Python e TypeScript, além de integrações Scrapy.

Esta API de Raspagem do Instagram é gratuita?

Sim. O Scrapeless fornece a você um crédito gratuito de US$ 2. Você pode se inscrever diretamente para reivindicar o crédito gratuito. Com o rastreador de perfil do Instagram, você pode coletar facilmente informações de usuários gratuitamente!

Passo 1. Crie sua chave de API

Para começar, você precisará obter sua chave de API no painel do Scrapeless:

Faça login no Painel do Scrapeless.
Navegue até Gerenciamento de chaves de API.
Clique em Criar para gerar sua chave de API exclusiva.
Depois de criada, basta clicar na chave de API para copiá-la.

Considerações finais

Neste tutorial, apresentamos 2 maneiras eficientes de obter dados de perfil do Instagram. Mostramos como lidar com a autenticação, fazer solicitações, lidar com respostas e integrar IPs de proxy para melhor estabilidade e segurança.

Seguindo este guia, você pode começar facilmente a extrair dados de perfil do Instagram para uso pessoal ou comercial, mantendo a privacidade e evitando problemas como limites de taxa.

Para melhorar a eficiência da coleta de dados, recomendamos que você use a API de rastreamento avançada, que requer apenas parâmetros de configuração simples para concluir a extração de dados!

Comece um teste gratuito agora!

Na Scorretless, acessamos apenas dados disponíveis ao público, enquanto cumprem estritamente as leis, regulamentos e políticas de privacidade do site aplicáveis. O conteúdo deste blog é apenas para fins de demonstração e não envolve atividades ilegais ou infratoras. Não temos garantias e negamos toda a responsabilidade pelo uso de informações deste blog ou links de terceiros. Antes de se envolver em qualquer atividade de raspagem, consulte seu consultor jurídico e revise os termos de serviço do site de destino ou obtenha as permissões necessárias.

Artigos mais populares

n8n + LLM Scraper: Capture Respostas de IA em um Fluxo de Trabalho Sem Código

Crie um fluxo de trabalho n8n que capture respostas de LLM em um cronograma com um nó de Solicitação HTTP para o Scrapeless LLM Chat Scraper, sem código e sem navegador.

Alex Johnson

18-Jun-2026

workflow n8n capturando respostas de LLM via um nó de Solicitação HTTP

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Aprenda a integrar o Crawl4AI com o Scrapeless Cloud Browser para uma raspagem web eficiente e em grande escala. Desbloqueie proxies automáticos, impressões digitais personalizadas, reutilização de sessões e depuração em tempo real.

Sophia Martinez

20-Oct-2025

Como aprimorar o Crawl4AI com o Scrapeless Cloud Browser

Servidor MCP sem resíduos está oficialmente no ar! Construa seu Conector AI-Web definitivo.

Descubra como o Servidor Scrapeless MCP fornece aos LLMs capacidades de navegação e raspagem na web em tempo real. Aprenda a construir agentes de IA que pesquisam, extraem e interagem com conteúdo web dinâmico de forma integrada.

Michael Lee

17-Jul-2025

Catálogo