🥳Tham gia Cộng đồng Scrapelessnhận thử nghiệm miễn phí của bạn để truy cập Bộ công cụ Web Scraping mạnh mẽ của chúng tôi!

Scrapeless x Activepieces

Tìm hiểu cách tích hợp Scrapeless với Activepieces để xây dựng các quy trình dữ liệu trực quan, tự động, không cần mã.

Không cần thẻ tín dụng
Scrapeless x Activepieces

Activepieces là gì?

Activepieces là một nền tảng tự động hóa doanh nghiệp mã nguồn mở, ưu tiên AI và không cần mã - về cơ bản là một sự thay thế tự lưu trữ cho Zapier với khả năng tự động hóa trình duyệt mạnh mẽ.

Scrapeless với Activepieces

Scrapeless cung cấp các mô-đun sau trong Activepieces:

1. Tìm kiếm Google – Truy cập và lấy dữ liệu tìm kiếm phong phú từ Google.

2. Xu hướng Google - Trích xuất dữ liệu Xu hướng Google để theo dõi sự phổ biến của từ khóa và mối quan tâm tìm kiếm theo thời gian.

3. Ghi lại dữ liệu phổ quát – Truy cập và trích xuất dữ liệu từ các trang web JS-Render thường chặn bot.

4. Ghi lại dữ liệu trang web – Trích xuất thông tin từ một trang web duy nhất.

5. Quét dữ liệu từ tất cả các trang – Quét một trang web và các trang liên kết của nó để trích xuất dữ liệu toàn diện.

scrapeless với Activepieces

Làm thế nào để sử dụng Scrapeless trong Activepieces?

Bước 1. Lấy khóa API Scrapeless của bạn

Lấy khóa API Scrapeless của bạn

Bước 2. Đặt điều kiện kích hoạt và kết nối với Scrapeless

  1. Đặt các điều kiện kích hoạt dựa trên nhu cầu thực tế của bạn.
Đặt điều kiện kích hoạt và kết nối với Scrapeless
  1. Kết nối tài khoản Scrapeless của bạn. Ở đây, chúng tôi chọn Ghi lại dữ liệu phổ quát và sử dụng https://www.amazon.com/LK-Apple-Watch-Screen-Protector/dp/B0DFG31G1P/ làm URL mẫu.
Đặt điều kiện kích hoạt và kết nối với Scrapeless
khóa api scrapeless

Bước 3. Làm sạch dữ liệu

Tiếp theo, chúng ta cần làm sạch dữ liệu HTML đã ghi lại ở bước trước. Đầu tiên, chọn Dữ liệu ghi lại phổ quát trong phần đầu vào. Cấu hình mã như sau:

Làm sạch dữ liệu
Copy
export const code = async (inputs) => {
const html = inputs.SOURCE_DATA

const titleMatch = html.match(/id=['"]productTitle['"][^>]*>([^<]+)</i);
const title = titleMatch ? titleMatch[1].trim() : "";

const priceMatch = html.match(/class=['"]a-offscreen['"][^>]*>\$?([\d.,]+)/i);
const price = priceMatch ? priceMatch[1].trim() : "";

const ratingMatch = html.match(/class=['"]a-icon-alt['"][^>]*>([^<]+)</i);
const rating = ratingMatch ? ratingMatch[1].trim() : "";

return [
  {
    json: {
      title,
      price,
      rating
    },
  },
];
};

Bước 4. Kết nối với Google Sheets

Tiếp theo, bạn có thể chọn xuất dữ liệu đã được làm sạch và cấu trúc sang Google Sheets. Chỉ cần thêm một nút Google Sheets và cấu hình kết nối Google Sheets của bạn.

Lưu ý: Đảm bảo tạo một Google Sheet trước đó.

Kết nối với Google Sheets

Ví dụ về kết quả đầu ra

Ví dụ về kết quả đầu ra

Đó là một hướng dẫn đơn giản về cách thiết lập và sử dụng Scrapeless. Nếu bạn có bất kỳ câu hỏi nào, hãy thoải mái thảo luận trên Scrapeless Discord.

Tại Scrapless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định và chính sách bảo mật trang web hiện hành. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động cạo nào, hãy tham khảo ý kiến ​​cố vấn pháp lý của bạn và xem xét các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Trên trang này