🥳Tham gia Cộng đồng Scrapelessnhận thử nghiệm miễn phí của bạn để truy cập Bộ công cụ Web Scraping mạnh mẽ của chúng tôi!
Quay lại blog

URL phiên họp: Làm thế nào để đảm bảo quyền riêng tư của người dùng trong tương tác giữa người và máy?

Michael Lee
Michael Lee

Expert Network Defense Engineer

27-May-2025

Trình duyệt Scrapeless Scraping giờ đây hoàn toàn hỗ trợ các tác vụ tự động thông qua quy trình làm việc dựa trên phiên. Dù được khởi xướng qua Playground hay API, tất cả các chương trình thực thi đều có thể được theo dõi đồng bộ trong Bảng điều khiển.

  • Mở Chế độ xem trực tiếp để theo dõi trạng thái thời gian thực.
  • Chia sẻ URL trực tiếp cho người dùng tương tác từ xa—như các trang đăng nhập, điền form hoặc hoàn tất thanh toán.
  • Xem lại toàn bộ quy trình thực hiện với Phát lại phiên.

Nhưng có thể bạn sẽ thắc mắc:

Những tính năng phiên này thực sự là gì? Chúng mang lại lợi ích gì cho tôi? Và tôi có thể sử dụng chúng như thế nào?

Trong bài viết này, chúng ta sẽ khám phá sâu về Phiên của Trình duyệt Scrapeless Scraping, bao gồm:

  • Khái niệm và mục đích của Chế độ xem trực tiếp
  • URL trực tiếp là gì
  • Cách sử dụng URL trực tiếp cho tương tác người dùng trực tiếp
  • Tại sao Phát lại phiên lại quan trọng

Chế độ xem trực tiếp: Theo dõi chương trình thời gian thực

Tính năng Chế độ xem trực tiếp trong Trình duyệt Scrapeless Scraping cho phép bạn theo dõi và kiểm soát các phiên trình duyệt trong thời gian thực. Cụ thể, nó cho phép bạn quan sát các cú nhấp chuột, nhập liệu và tất cả các hành động trong trình duyệt, theo dõi các quy trình tự động, sửa lỗi kịch bản thủ công, và kiểm soát trực tiếp phiên nếu cần.

Tạo một phiên trình duyệt

Đầu tiên, bạn cần tạo một phiên. Có hai cách để làm điều này:

Phương pháp 1: Tạo một phiên qua Playground

Tạo một phiên qua Playground

Phương pháp 2: Tạo một phiên qua API

Bạn cũng có thể tạo một phiên bằng cách sử dụng API của chúng tôi. Xin hãy tham khảo tài liệu API: Tài liệu API Trình duyệt Scraping. Tính năng phiên của chúng tôi sẽ giúp bạn quản lý phiên của mình, bao gồm khả năng xem thời gian thực.

JavaScript Copy
const puppeteer =require('puppeteer-core');
 
const token = 'API Key'
 
// dấu vân tay tùy chỉnh
const fingerprint = {
    platform: 'Windows',
}
 
const query = new URLSearchParams({
    session_ttl: 180,
    session_name: 'test_scraping', // tên phiên
    proxy_country: 'ANY',
    token: token,
    fingerprint: encodeURIComponent(JSON.stringify(fingerprint)),
});
 
const connectionURL = `wss://browser.scrapeless.com/browser?${query.toString()}`;
 
(async () => {
    const browser = await puppeteer.connect({browserWSEndpoint: connectionURL});
    const page = await browser.newPage();
 
    await page.goto('https://www.scrapeless.com');
    await new Promise(res => setTimeout(res, 3000));
 
    await page.goto('https://www.google.com');
    await new Promise(res => setTimeout(res, 3000));
 
    await page.goto('https://www.youtube.com');
    await new Promise(res => setTimeout(res, 3000));
 
    await browser.close();
})();

Xem các phiên trực tiếp

Trong giao diện quản lý phiên Scrapeless, bạn có thể dễ dàng xem các phiên trực tiếp:

Phương pháp 1: Xem các phiên trực tiếp trực tiếp trong Bảng điều khiển

Sau khi tạo một phiên trong Playground, bạn sẽ thấy phiên đang chạy trên phía bên phải.

phiên đang chạy

Hoặc, bạn có thể kiểm tra trạng thái phiên trên trang Phiên trực tiếp:

Phiên trực tiếp

Phương pháp 2: Xem phiên qua URL trực tiếp

Một URL trực tiếp được tạo ra cho một phiên đang chạy, cho phép bạn theo dõi quá trình trong thời gian thực trên một trình duyệt.

URL trực tiếp rất hữu ích cho:

  • Gỡ lỗi & Theo dõi: Xem mọi thứ trong thời gian thực hoặc chia sẻ với các thành viên trong nhóm.
  • Tương tác của con người: Kiểm soát hoặc nhập liệu trực tiếp—cho phép người dùng nhập thông tin nhạy cảm như mật khẩu một cách an toàn.

Bạn có thể sao chép URL trực tiếp bằng cách nhấp vào biểu tượng "🔗" trên trang Các phiên trực tiếp. Cả hai phiên được tạo ra qua Playground và API đều hỗ trợ URL trực tiếp.

  1. Lấy URL trực tiếp từ Bảng điều khiển

Xem hướng dẫn của chúng tôi bên dưới:

URL trực tiếp
  1. Lấy URL trực tiếp qua API

Bạn cũng có thể nhận được URL trực tiếp thông qua các cuộc gọi API. Mã mẫu dưới đây lấy tất cả các phiên đang chạy qua API phiên, sau đó sử dụng API URL trực tiếp để lấy chế độ xem trực tiếp cho một phiên cụ thể:

Python Copy
import requests
 
API_CONFIG = {
    "host": "https://api.scrapeless.com",
    "headers": {
        "x-api-token": "API Key",
        "Content-Type": "application/json"
    }
}
 
 
async def fetch_live_url(task_id):
    try:
        live_response = requests.get(f"{API_CONFIG['host']}/browser/{task_id}/live", headers=API_CONFIG["headers"])
 
        if not live_response.ok:
            raise Exception(f"không thể lấy URL trực tiếp: {live_response.status_code} {live_response.reason}")
 
        live_result = live_response.json()
        if live_result and live_result.get("data"):
            print(f"taskId: {task_id}")
            print(f"liveUrl: {live_result['data']}")
        else:
python Copy
print("không có dữ liệu url trực tiếp nào có sẵn cho nhiệm vụ này")
    except Exception as error:
        print(f"lỗi khi lấy url trực tiếp cho nhiệm vụ {task_id}: {str(error)}")
 
 
async def fetch_browser_sessions():
    try:
        session_response = requests.get(f"{API_CONFIG['host']}/browser/running", headers=API_CONFIG["headers"])
 
        if not session_response.ok:
            raise Exception(f"không thể lấy phiên: {session_response.status_code} {session_response.reason}")
 
        session_result = session_response.json()
 
        sessions = session_result.get("data")
        if not sessions or not isinstance(sessions, list) or len(sessions) == 0:
            print("không tìm thấy phiên trình duyệt đang hoạt động")
            return
 
        task_id = sessions[0].get("taskId")
        if not task_id:
            print("không tìm thấy id nhiệm vụ trong dữ liệu phiên")
            return
 
        await fetch_live_url(task_id)
    except Exception as error:
        print(f"lỗi khi lấy phiên trình duyệt: {str(error)}")
 
 
import asyncio
 
asyncio.run(fetch_browser_sessions())
  1. Lấy URL trực tiếp qua lệnh CDP

Để có được URL trực tiếp trong khi mã đang chạy, hãy sử dụng lệnh CDP Agent.liveURL:

Python Copy
import asyncio
 
from pyppeteer import launcher
 
 
async def main():
    try:
        browser = await launcher.connect(
            browserWSEndpoint="wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY"
        )
        page = await browser.newPage()
        await page.goto('https://www.scrapeless.com')
 
        client = await page.target.createCDPSession()
        result = await client.send('Agent.liveURL')
        print(result)
    except Exception as e:
        print(e)
 
 
asyncio.run(main())

Một điểm nổi bật đáng chú ý:

URL trực tiếp không chỉ cho phép giám sát theo thời gian thực, mà còn tương tác giữa người và máy.

Ví dụ: Bạn cần yêu cầu người dùng nhập mật khẩu đăng nhập của họ.

“Ôi không! Bạn đang cố gắng đánh cắp thông tin riêng tư của tôi? Không đời nào!”

Thực tế, người dùng có thể tự nhập dữ liệu trên màn hình — và mọi thứ vẫn hoàn toàn riêng tư. Phương pháp trực tiếp nhưng an toàn này là điều mà URL trực tiếp cho phép — tương tác từ xa.

URL trực tiếp: Cách nó thúc đẩy sự hợp tác và tương tác của người dùng

Hãy lấy việc đăng ký và đăng nhập vào Scrapeless làm ví dụ và hướng dẫn cách tương tác trực tiếp với người dùng.

Dưới đây là mã bạn sẽ cần:

JavaScript Copy
const puppeteer = require("puppeteer-core");

(async () => {
    const fingerprint = {
        // dấu vân tay màn hình tùy chỉnh
        screen: {
            width: 1920,
            height: 1080,
        },
        args: {
            // thiết lập kích thước cửa sổ với giá trị giống như dấu vân tay màn hình
            "--window-size": "1920,1080",
        },
    };

    const query = new URLSearchParams({
        token: "APIKey",
        session_ttl: 600,
        proxy_country: "ANY",
        fingerprint: encodeURIComponent(JSON.stringify(fingerprint)),
    });
    const browserWsEndpoint = `wss://browser.scrapeless.com/browser?${query.toString()}`;

    try {
        const browser = await puppeteer.connect({
            browserWSEndpoint: browserWsEndpoint,
        });

        const page = await browser.newPage();
        await page.setViewport(null);

        await page.goto(`https://app.scrapeless.com/passport/register`, {
            timeout: 120000,
            waitUntil: "domcontentloaded",
        });

        const client = await page.createCDPSession();
        const result = await client.send("Agent.liveURL");

        // bạn có thể chia sẻ url trực tiếp với bất kỳ người dùng nào
        console.log(`${result.liveURL}`);

        // chờ 5 phút để người dùng đăng ký
        await page.waitForSelector("#none-existing-selector", {timeout: 300_000});
    } catch (e) {
        console.log(e);
    }
})()

Chạy đoạn mã trên và chia sẻ URL trực tiếp với người dùng, chẳng hạn: URL Đăng ký Scrapeless.

Mọi bước trước đó như:

  • Điều hướng đến trang web
  • Tham quan trang chủ Scrapeless
  • Nhấp vào đăng nhập và nhập vào trang đăng ký

Tất cả những điều này có thể được thực hiện trực tiếp bằng cách tạo một phiên sử dụng mã ở trên. Bước quan trọng nhất là người dùng cần nhập email và mật khẩu của họ để hoàn tất đăng ký.

Sau khi bạn chia sẻ URL trực tiếp với người dùng, bạn có thể theo dõi quá trình thực thi chương trình từ xa. Chương trình sẽ tự động chạy và nhảy đến trang yêu cầu tương tác của người dùng. Mật khẩu mà bên kia nhập sẽ hoàn toàn bị ẩn, và người dùng không cần lo lắng về việc lộ mật khẩu.

Để phản ánh quá trình hoạt động của người dùng một cách trực quan hơn, xin vui lòng tham khảo các bước tương tác sau:

Quá trình tương tác dưới đây được thực hiện hoàn toàn trong URL trực tiếp

Phát lại phiên: Phát lại quá trình thực thi chương trình để gỡ lỗi mọi thứ

Phát lại phiên là một bản tái tạo giống như video của một phiên người dùng được xây dựng bằng Thư viện Ghi hình. Các bản phát lại được tạo dựa trên các ảnh chụp trạng thái DOM của ứng dụng web (biểu diễn HTML trong bộ nhớ của trình duyệt). Khi bạn phát lại từng ảnh chụp, bạn sẽ thấy một bản ghi về các hành động đã thực hiện trong suốt phiên: bao gồm tất cả các lần tải trang, làm mới và điều hướng đã xảy ra trong chuyến thăm của bạn đến trang web.

Phát lại phiên có thể giúp bạn khắc phục tất cả các khía cạnh của hoạt động chương trình của bạn. Tất cả các thao tác trên trang sẽ được ghi lại và lưu dưới dạng video. Nếu bạn gặp bất kỳ vấn đề nào trong phiên, bạn có thể khắc phục và điều chỉnh chúng thông qua việc phát lại.

  • Đi đến Phiên

  • Nhấp vào Lịch sử phiên

  • Tìm kiếm phiên

  • Trong chi tiết phiên, nhấp vào nút Phát để xem và đánh giá quá trình thực thi:

Những điều cần lưu ý

Trình duyệt Scrapeless Scraping cho phép bạn giám sát theo thời gian thực, tương tác từ xa và phát lại mọi bước.

  • Xem trực tiếp: Quan sát hoạt động của trình duyệt như một luồng trực tiếp. Thấy mọi cú nhấp chuột và nhập liệu!
  • URL trực tiếp: Tạo một liên kết có thể chia sẻ, nơi người dùng có thể nhập dữ liệu của họ trực tiếp. Hoàn toàn riêng tư, hoàn toàn an toàn.
  • Phát lại phiên: Gỡ lỗi như một chuyên gia bằng cách phát lại chính xác những gì đã xảy ra — không cần phải chạy lại chương trình.

Dù bạn là nhà phát triển đang gỡ lỗi, một PM đang thuyết trình, hay hỗ trợ khách hàng hướng dẫn người dùng — Các phiên Scrapeless luôn sẵn sàng hỗ trợ bạn.

Đã đến lúc làm cho tự động hóa thông minh và thân thiện với con người.

Bắt đầu dùng thử miễn phí ngay bây giờ!

Tại Scrapless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định và chính sách bảo mật trang web hiện hành. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động cạo nào, hãy tham khảo ý kiến ​​cố vấn pháp lý của bạn và xem xét các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

Danh mục