🥳Hãy tham gia Cộng đồng ScrapelessYêu cầu dùng thử miễn phí để truy cập Bộ công cụ quét web mạnh mẽ của chúng tôi!
Quay lại Blog

Cách Scrape Người Bán Trên Amazon: Hướng Dẫn Python 2025

Michael Lee
Michael Lee

Expert Network Defense Engineer

27-Dec-2024

Amazon là trang thương mại điện tử lớn nhất thế giới, với vô số sản phẩm và hàng triệu khách hàng. Không có gì lạ khi các nhà bán lẻ muốn tham gia vào hoạt động này.

Trang cửa hàng Amazon giúp các nhà bán lẻ này thực hiện nghiên cứu thị trường. Nó hiển thị chi tiết về cửa hàng trên Amazon và có thể đóng vai trò là hướng dẫn để hoàn thiện thông tin cửa hàng của riêng bạn. Tuy nhiên, rất khó để theo dõi tất cả các chi tiết trên một trang mua sắm như Amazon.

Đây là nơi các API web scraping là một giải pháp tuyệt vời - loại bỏ tất cả các công việc thủ công có thể. Không còn phải cuộn thủ công và ghi lại giá sản phẩm và thông tin cửa hàng mà bạn nghĩ mình nên nhớ nữa! Sử dụng API Scraping Amazon mạnh mẽ để làm cho việc scraping trở nên dễ dàng!

Trong hướng dẫn này, chúng ta sẽ xem xét cách scraping chi tiết cửa hàng Amazon bằng API với Python.

Hãy bắt đầu thôi!

Tại sao chúng ta lại scrape dữ liệu người bán Amazon?

  1. Tình báo cạnh tranh
  2. Phân tích thị trường và xu hướng
  3. Tối ưu hóa chiến lược giá cả
  4. Nghiên cứu và lựa chọn sản phẩm
  5. Thông tin chi tiết về khách hàng và phân tích tâm lý
  6. Nghiên cứu chuỗi cung ứng và nhà cung cấp
  7. Theo dõi hiệu suất doanh số

Scrapeless là gì và tại sao nên chọn nó để scraping người bán Amazon?

Scrapeless là một công cụ API mạnh mẽ. Nó có thể được tích hợp liền mạch với Python và được thiết kế để đáp ứng nhu cầu của các nhà phát triển và người không phải là nhà phát triển.

Nó đơn giản hóa toàn bộ quá trình thu thập dữ liệu của người bán Amazon, cho phép người dùng dễ dàng và đáng tin cậy trích xuất nhiều thông tin hợp lệ từ nền tảng Amazon.

Cho dù bạn là người mới bắt đầu scraping dữ liệu hay nhà phát triển giàu kinh nghiệm đang tìm kiếm giải pháp scraping hiệu quả, Scrapeless cung cấp các chức năng đơn giản và mạnh mẽ để đáp ứng nhu cầu của bạn.

Ưu điểm của Scrapeless:

🌐 1. Công nghệ luân chuyển IP độc đáo

Khi scraping dữ liệu từ thương mại điện tử các nền tảng như Amazon, các yêu cầu thường xuyên thường dẫn đến việc chặn IP và lỗi scraping. Công nghệ luân chuyển IP tích hợp sẵn của Scrapeless tự động thay đổi địa chỉ IP trên mỗi yêu cầu, ngăn chặn hiệu quả việc bị chặn.

🔒 2. Tự động phát hiện và bỏ qua CAPTCHA

Amazon thường kích hoạt CAPTCHA hoặc các thử thách chống bot, đặc biệt là khi scraping một lượng lớn dữ liệu Amazon. Scrapeless có thể tự động phát hiện và bỏ qua CAPTCHA, giảm bớt sự cần thiết phải can thiệp thủ công. Tính năng này có thể làm tăng đáng kể tỷ lệ thành công của dự án scraping Amazon Python của bạn, với tỷ lệ giải quyết CAPTCHA trên 99%.

3. Tốc độ scraping hiệu quả

Tốc độ là một trong những lợi thế cốt lõi của nó. Với cấu trúc mã được tối ưu hóa và khả năng scraping đồng thời, Scrapeless có thể cải thiện đáng kể hiệu quả scraping dữ liệu khi bạn scrape dữ liệu Amazon, làm cho nó trở thành lựa chọn lý tưởng để sử dụng các công cụ scraping Amazon Python.

🚀 4. Khả năng scraping liên tục

Đối với những người dùng cần thu thập dữ liệu lâu dài và ổn định, Scrapeless cung cấp độ ổn định tuyệt vời. Nó có thể liên tục thu thập hàng nghìn bản ghi mà không gặp sự cố hoặc lỗi phổ biến, đảm bảo rằng trình thu thập dữ liệu Amazon Python của bạn có thể chạy liền mạch trong thời gian dài.

🛠️ 5. API dễ sử dụng và giao diện trực quan

Scrapeless cung cấp một API trực quan cho phép các nhà phát triển nhanh chóng thu thập dữ liệu Amazon và truy xuất các chi tiết sản phẩm cần thiết. Đối với những người dùng không chuyên về kỹ thuật, nó cũng cung cấp giao diện đơn giản và mã mẫu để giảm ngưỡng sử dụng. Hơn 90% người dùng đánh giá cao sự dễ sử dụng của Scrapeless, làm cho nó trở thành lựa chọn lý tưởng cho bất kỳ ai muốn tạo trình thu thập dữ liệu Amazon bằng Python mà không cần lập trình chuyên sâu.

Tham gia nhóm Scrapeless Discord và nhận dùng thử miễn phí!

Cách scrape người bán Amazon bằng API Scrapeless?

scrape người bán Amazon

Hướng dẫn thêm

Theo dữ liệu được trả về bởi chi tiết sản phẩm ở trên, bạn có thể tìm thấy trường seller_url, đây là trường của người bán tương ứng với sản phẩm. Thông qua seller_url, bạn có thể truy cập trực tiếp thông tin chi tiết của người bán tương ứng.

Tất nhiên, nếu bạn biết ID người bán, bạn cũng có thể tự tạo URL, như sau:

Hãy lấy https://www.amazon.com/sp?seller=AESX3141EPI7X làm ví dụ

Bạn chỉ cần thay đổi "AESX3141EPI7X" thành ID người bán mà bạn muốn truy cập.

Bước 1. Nhận khóa API của bạn

Sau khi đăng nhập vào Scrapeless, hệ thống sẽ tự động tạo ApiKey tương ứng cho bạn. Bạn có thể

  • nhấp vào "Quản lý Khóa API"
  • Và sau đó "Xem Khóa API"
Nhận khóa API của bạn

Bước 2. Tích hợp mã của chúng tôi vào dự án của bạn

Chỉ cần 2 thao tác bạn cần làm:

  1. Thay thế bằng url người bán mục tiêu của bạn
  2. Nhập khóa API của bạn
Python Copy
import json
import requests

class Payload:
    def __init__(self, actor, input_data):
        self.actor = actor
        self.input = input_data

def send_request():
    host = "api.scrapeless.com"
    url = f"https://{host}/api/v1/scraper/request"
    token = "" ## nhập mã thông báo API của bạn

    headers = {
        "x-api-token": token
    }

    input_data = {
        "action": "seller",
        "url": "https://www.amazon.com/sp?seller=AESX3141EPI7X" ## thay thế bằng url của người bán mục tiêu của bạn
    }

    payload = Payload("scraper.amazon", input_data)

    json_payload = json.dumps(payload.__dict__)

    response = requests.post(url, headers=headers, data=json_payload)

    if response.status_code != 200:
        print("Error:", response.status_code, response.text)
        return

    print("body", response.text)

if __name__ == "__main__":
    send_request()
  • Bạn có thể tìm thấy nhiều ngôn ngữ hơn trong tài liệu API của chúng tôi. Để làm cho dự án trên cụ thể hơn, mã Python gốc là:
Python Copy
import requests
import json

url = "https://api.scrapeless.com/api/v1/scraper/request"

payload = json.dumps({
   "actor": "scraper.amazon",
   "input": {
      "url": "",
      "action": "seller"
   }
})
headers = {
   'Content-Type': 'application/json'
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

Bước 3. Bắt đầu thu thập và nhận đầu ra

Các chi tiết người bán sau đây được trả về bởi API Scraping Amazon Scrapeless:

JSON Copy
{
  "url": "https://www.amazon.com/sp?seller=AESX3141EPI7X",
  "seller_id": "AESX3141EPI7X",
  "seller_name": "XXX",
  "description": "Về Người bánXXX tự hào mang đến cho bạn những sản phẩm chất lượng tốt nhất với dịch vụ chất lượng tốt nhất. Sự hài lòng của khách hàng là ưu tiên số 1 của chúng tôi! Nếu bạn có bất kỳ câu hỏi hoặc thắc mắc nào về đơn đặt hàng của mình, vui lòng đừng ngần ngại liên hệ với chúng tôi theo số: 1-844-637-1400 Giờ làm việc của bộ phận chăm sóc khách hàng của chúng tôi là từ Thứ Hai đến Thứ Sáu, 10 giờ sáng - 5 giờ chiều giờ miền Đông. Mong sớm nhận được hồi âm từ bạn!",
  "detailed_info": [
    {
      "title": "Tên doanh nghiệp:",
      "value": "ADN GLOBAL LLC"
    },
    {
      "title": "Địa chỉ doanh nghiệp:",
      "value": "502 Jersey Ave,STE A,NEW BRUNSWICK,NJ,08901,US"
    }
  ],
  "feedbacks": [
    {
      "starts": "5 trên 5 sao",
      "text": "tốt",
      "date": "Bởi Yenny albarracin vào ngày 26 tháng 12 năm 2024."
    },
    {
      "starts": "4 trên 5 sao",
      "text": "Aurticulo trong tình trạng tốt và rất hiệu quả trong việc giao hàng",
      "date": "Bởi Juan D. vào ngày 26 tháng 12 năm 2024."
    },
    {
      "starts": "4 trên 5 sao",
      "text": "Trải nghiệm tốt đã nhận được đúng giờ",
      "date": "Bởi Symon Harry vào ngày 25 tháng 12 năm 2024."
    },
    {
      "starts": "5 trên 5 sao",
      "text": "Đó là một món quà",
      "date": "Bởi Patty T. vào ngày 25 tháng 12 năm 2024."
    },
    {
      "starts": "1 trên 5 sao",
      "text": "Thất vọng về dịch vụ. Đặt hàng vào tháng 11 và quà tặng sẽ không đến trước Giáng sinh. Con tôi sẽ rất thất vọng.",
      "date": "Bởi Rosey M. vào ngày 24 tháng 12 năm 2024."
    }
  ],
  "stars": "4.5 trên 5 sao",
  "return_policy": "Để có được thông tin về các chính sách Trả lại và Hoàn tiền có thể áp dụng, vui lòng tham khảo chính sách Trả lại và Hoàn tiền của Amazon. Để bắt đầu trả lại, hãy truy cập Trung tâm Trả lại Trực tuyến của Amazon để yêu cầu ủy quyền trả lại từ người bán. Đối với bất kỳ vấn đề nào với việc trả lại của bạn, nếu sản phẩm được người bán vận chuyển, bạn có thể nhận được sự trợ giúp tại đây.",
  "shipping_policies": "Trừ khi có ghi chú khác trong đường dẫn đặt hàng, XXX vận chuyển tất cả các mặt hàng trong vòng hai ngày kể từ khi nhận được đơn đặt hàng. Bạn sẽ nhận được thông báo về bất kỳ sự chậm trễ hoặc hủy bỏ đơn đặt hàng của bạn.",
  "privacy_security": "Amazon biết rằng bạn quan tâm đến cách thông tin về bạn được sử dụng và chia sẻ, và chúng tôi đánh giá cao sự tin tưởng của bạn rằng chúng tôi sẽ làm điều đó một cách cẩn thận và hợp lý. Bằng cách truy cập Amazon.com, bạn đang chấp nhận các phương thức được mô tả trong Chính sách Bảo mật của Amazon.com. Ngoài ra, chúng tôi muốn bạn biết rằng Amazon.com sẽ cung cấp cho XXX thông tin liên quan đến các giao dịch của bạn liên quan đến sản phẩm của họ (bao gồm, ví dụ, tên, địa chỉ, sản phẩm bạn mua và số tiền giao dịch), và thông tin đó sẽ tuân theo Chính sách Bảo mật của XXX.",
  "privacy_policy": "XXX coi trọng quyền riêng tư của dữ liệu cá nhân của bạn. Để biết thêm thông tin, hãy xem Chính sách Bảo mật của Amazon.com.",
  "tax_info": "Thuế bán hàng không được tính riêng và thu thập liên quan đến các mặt hàng được đặt hàng từ XXX thông qua Trang web Amazon.com trừ khi được chỉ định rõ ràng như vậy trong quá trình đặt hàng. Các mặt hàng được đặt hàng từ XXX có thể phải chịu thuế ở một số tiểu bang, dựa trên tiểu bang mà đơn đặt hàng được vận chuyển đến. Nếu một mặt hàng phải chịu thuế bán hàng, theo luật thuế tiểu bang, thuế thường được tính trên tổng giá bán của từng mặt hàng riêng lẻ, bao gồm phí vận chuyển và xử lý, phí gói quà và các phí dịch vụ khác, trừ bất kỳ khoản giảm giá nào. Nếu thuế được tính riêng và thu thập liên quan đến các mặt hàng được đặt hàng từ XXX thông qua Trang web Amazon.com, số tiền thuế xuất hiện trong quá trình đặt hàng là ước tính - thuế thực tế sẽ được tính vào thẻ tín dụng của bạn sẽ được tính toán tại thời điểm đơn đặt hàng của bạn được xử lý và sẽ xuất hiện trong thông báo xác nhận đơn đặt hàng của bạn.",
  "help_content": "Đối với các câu hỏi về khoản phí đã được tính vào thẻ tín dụng của bạn, vui lòng liên hệ với Amazon. Có câu hỏi về cách đặt hàng? Tìm kiếm Trợ giúp của Amazon.",
  "products_link": "https://www.amazon.com/s?ie=UTF8&marketplaceID=ATVPDKIKX0DER&me=AESX3141EPI7X",
  "business_name__DUPLICATE": "XXX",
  "business_address__DUPLICATE": "XXX",
  "rating_positive": "90% tích cực",
  "brands": "",
  "feedbacks_percentages": {
    "star_1": "7%",
    "star_2": "2%",
    "star_3": "2%",
    "star_4": "11%",
    "star_5": "79%"
  },
  "rating_count_m12": "1.143",
  "rating_count_m3": "276",
  "rating_count_lifetime": "21.128",
  "rating_count_m1": "118",
  "country": "Mỹ",
  "email": "",
  "timestamp": "2024-12-26"
}

Bảng điều khiển Scrapeless: cách dễ nhất để scrape người bán Amazon

Các bước Python ở trên có thể gây khó khăn cho nhiều người. Để giảm bớt gánh nặng của việc thu thập dữ liệu của doanh nghiệp, Bảng điều khiển Scrapeless đã giúp bạn tiết kiệm được quá trình khởi tạo yêu cầu rắc rối. Bạn có thể dễ dàng thu thập thông tin người bán chỉ với một vài cú nhấp chuột và cấu hình đơn giản.

Cứ tiếp tục cuộn xuống!

Bước 1. Đăng nhập vào Scrapeless

Bước 2. Nhấp vào "API Scraping" và chọn "Amazon" để vào trang scraping Amazon.

Trang scraping Amazon

Bước 3. Sao chép url người bán mục tiêu và nhập nó vào hộp. Chuyển "Hành động" thành "Người bán" và sau đó nhấp vào nút "Bắt đầu Scraping".

Bắt đầu Scraping

Trên trang công cụ, bạn có thể chọn loại dữ liệu cần thu thập:

  • Người bán: Thu thập thông tin người bán, bao gồm tên người bán, xếp hạng, thông tin liên hệ, v.v.
  • Sản phẩm: Thu thập chi tiết sản phẩm như tiêu đề, giá cả, xếp hạng, nhận xét, v.v.
  • Từ khóa: Thu thập các từ khóa liên quan đến sản phẩm để giúp bạn phân tích SEO và xu hướng thị trường của sản phẩm.

Bước 4. Sau khi thu thập xong, bạn có thể xem dữ liệu đã thu thập trong bảng điều khiển bên phải. Kết quả sẽ được hiển thị ở định dạng rõ ràng để dễ dàng phân tích.

Dữ liệu đã thu thập

Nếu bạn cần thu thập các sản phẩm khác, hãy nhấp vào Tiếp tục để nhập liên kết Amazon mới và lặp lại các bước trên.

Kết luận

Mặc dù có nhiều cách để scrape các trang người bán Amazon, nhưng việc tự mã hóa nó có thể hơi khó khăn. Bạn cần phải tự thiết lập tự động hóa trình duyệt để làm cho nó hoạt động, cũng như phân tích các trường từ HTML đã truy xuất.

Đã đến lúc giảm nhẹ mọi gánh nặng và scrape dữ liệu một cách dễ dàng! Sử dụng API Scraping Amazon Scrapeless mạnh mẽ để đạt được việc scraping dữ liệu đơn giản, hiệu quả, chính xác, nhanh chóng, ổn định và an toàn.

Đăng nhập ngay và nhận dùng thử miễn phí có thời hạn!

Tại Scrapeless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định hiện hành và chính sách bảo mật của trang web. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm pháp lý đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động thu thập dữ liệu nào, hãy tham khảo ý kiến ​​cố vấn pháp lý của bạn và xem lại các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

Danh mục