Làm thế nào để theo dõi nhiệm vụ với sự tương tác giữa con người và máy tính?

Expert Network Defense Engineer
Trình duyệt Scrapeless Scraping hiện đã hoàn toàn hỗ trợ các tác vụ tự động hóa thông qua các quy trình dựa trên phiên. Dù được khởi tạo qua Playground hay API, tất cả các lần thực thi chương trình đều có thể được theo dõi đồng bộ trong Bảng điều khiển.
- Mở Live View để theo dõi trạng thái chạy trong thời gian thực.
- Chia sẻ URL trực tiếp cho tương tác từ xa—chẳng hạn như các trang đăng nhập, điền biểu mẫu hoặc hoàn tất thanh toán.
- Xem lại toàn bộ quá trình thực thi với Session Replay.
Nhưng bạn có thể tự hỏi:
Những tính năng Session này thực sự là gì? Chúng có lợi ích gì cho tôi? Và làm thế nào để tôi sử dụng chúng?
Trong blog này, chúng ta sẽ tìm hiểu sâu về Session của Trình duyệt Scrapeless Scraping, bao gồm:
- Khái niệm và mục đích của Live View
- Live URL là gì
- Cách sử dụng Live URL để tương tác trực tiếp với người dùng
- Tại sao Session Replay là thiết yếu
Live View: Theo Dõi Chương Trình Thời Gian Thực
Tính năng Live View trong Trình duyệt Scrapeless Scraping cho phép bạn theo dõi và kiểm soát các phiên trình duyệt trong thời gian thực. Cụ thể, nó cho phép bạn quan sát các cú nhấp chuột, đầu vào và tất cả hành động của trình duyệt, theo dõi quy trình tự động hóa, gỡ lỗi các kịch bản một cách thủ công và kiểm soát trực tiếp phiên nếu cần thiết.
Tạo Một Phiên Trình Duyệt
Đầu tiên, bạn cần tạo một phiên. Có hai cách để làm điều này:
Phương pháp 1: Tạo một phiên qua Playground
Phương pháp 2: Tạo một phiên qua API
Bạn cũng có thể tạo một phiên bằng cách sử dụng API của chúng tôi. Vui lòng tham khảo tài liệu API: Tài liệu API Trình duyệt Scraping. Tính năng phiên của chúng tôi sẽ giúp bạn quản lý phiên, bao gồm khả năng xem trong thời gian thực.
Xem Các Phiên Trực Tiếp
Trong giao diện quản lý phiên Scrapeless, bạn có thể dễ dàng xem các phiên trực tiếp:
Phương pháp 1: Xem Các Phiên Trực Tiếp Trong Bảng Điều Khiển
Sau khi tạo một phiên trong Playground, bạn sẽ thấy phiên đang chạy trực tiếp ở bên phải.
Hoặc bạn có thể kiểm tra trạng thái phiên trên trang Live Sessions.
Phương pháp 2: Xem Phiên Qua Live URL
Một Live URL được tạo ra cho một phiên đang chạy, cho phép bạn theo dõi quy trình trực tiếp trong một trình duyệt.
Live URL hữu ích cho:
- Gỡ lỗi & Theo dõi: Theo dõi mọi thứ trong thời gian thực hoặc chia sẻ với đồng đội.
- Tương tác Con Người: Kiểm soát hoặc nhập trực tiếp—cho phép người dùng nhập thông tin nhạy cảm như mật khẩu một cách an toàn.
Bạn có thể sao chép Live URL bằng cách nhấp vào biểu tượng "🔗" trên trang Live Sessions. Cả hai phiên được tạo từ Playground và API đều hỗ trợ Live URL.
-
Lấy Live URL Từ Bảng Điều Khiển
-
Lấy Live URL Qua API
Bạn cũng có thể lấy Live URL thông qua các cuộc gọi API. Mẫu mã dưới đây lấy tất cả các phiên đang chạy qua API phiên, sau đó sử dụng Live URL API để truy xuất chế độ xem trực tiếp cho một phiên cụ thể.
print("không có dữ liệu URL trực tiếp nào cho nhiệm vụ này")
except Exception as error:
print(f"lỗi khi lấy URL trực tiếp cho nhiệm vụ {task_id}: {str(error)}")
async def fetch_browser_sessions():
try:
session_response = requests.get(f"{API_CONFIG['host']}/browser/running", headers=API_CONFIG["headers"])
if not session_response.ok:
raise Exception(f"không thể lấy phiên làm việc: {session_response.status_code} {session_response.reason}")
session_result = session_response.json()
sessions = session_result.get("data")
if not sessions or not isinstance(sessions, list) or len(sessions) == 0:
print("không tìm thấy phiên làm việc trình duyệt nào")
return
task_id = sessions[0].get("taskId")
if not task_id:
print("không tìm thấy mã nhiệm vụ trong dữ liệu phiên")
return
await fetch_live_url(task_id)
except Exception as error:
print(f"lỗi khi lấy các phiên trình duyệt: {str(error)}")
import asyncio
asyncio.run(fetch_browser_sessions())
- Lấy URL trực tiếp qua lệnh CDP
Để có được URL trực tiếp trong khi mã đang chạy, hãy sử dụng lệnh CDP Agent.liveURL
:
Python
import asyncio
from pyppeteer import launcher
async def main():
try:
browser = await launcher.connect(
browserWSEndpoint="wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY"
)
page = await browser.newPage()
await page.goto('https://www.scrapeless.com')
client = await page.target.createCDPSession()
result = await client.send('Agent.liveURL')
print(result)
except Exception as e:
print(e)
asyncio.run(main())
Một điểm đáng chú ý:
URL trực tiếp không chỉ cho phép giám sát theo thời gian thực mà còn giúp tương tác giữa con người và máy móc.
Ví dụ: Bạn cần người dùng nhập mật khẩu đăng nhập của họ.
“Ôi không! Bạn đang cố gắng đánh cắp thông tin riêng tư của tôi? Không thể!”
Thực sự, người dùng có thể tự nhập dữ liệu trên màn hình — và mọi thứ vẫn hoàn toàn riêng tư 100%. Phương pháp trực tiếp nhưng an toàn này chính là điều mà URL trực tiếp cho phép — tương tác từ xa.
URL trực tiếp: Cách nó cho phép hợp tác và tương tác với người dùng
Hãy lấy việc đăng ký và đăng nhập vào Scrapeless làm ví dụ và đi qua cách tương tác trực tiếp với người dùng.
Đây là mã bạn sẽ cần:
JavaScript
const puppeteer = require("puppeteer-core");
(async () => {
const fingerprint = {
// dấu vết màn hình tùy chỉnh
screen: {
width: 1920,
height: 1080,
},
args: {
// đặt kích thước cửa sổ với cùng giá trị với dấu vết màn hình
"--window-size": "1920,1080",
},
};
const query = new URLSearchParams({
token: "APIKey",
session_ttl: 600,
proxy_country: "ANY",
fingerprint: encodeURIComponent(JSON.stringify(fingerprint)),
});
const browserWsEndpoint = `wss://browser.scrapeless.com/browser?${query.toString()}`;
try {
const browser = await puppeteer.connect({
browserWSEndpoint: browserWsEndpoint,
});
const page = await browser.newPage();
await page.setViewport(null);
await page.goto(`https://app.scrapeless.com/passport/register`, {
timeout: 120000,
waitUntil: "domcontentloaded",
});
const client = await page.createCDPSession();
const result = await client.send("Agent.liveURL");
// bạn có thể chia sẻ URL trực tiếp với bất kỳ người dùng nào
console.log(`${result.liveURL}`);
// chờ 5 phút cho người dùng đăng ký
await page.waitForSelector("#none-existing-selector", {timeout: 300_000});
} catch (e) {
console.log(e);
}
})()
Chạy đoạn mã trên và chia sẻ URL trực tiếp với người dùng, chẳng hạn như: URL Đăng Ký Scrapeless.
Tất cả các bước trước như:
- Điều hướng đến trang web
- Thăm trang chủ Scrapeless
- Nhấp vào đăng nhập và vào trang đăng ký
Tất cả những điều này có thể được thực hiện trực tiếp bằng cách tạo một phiên làm việc sử dụng mã ở trên. Bước quan trọng nhất là người dùng cần nhập email và mật khẩu của họ để hoàn tất việc đăng ký.
Sau khi bạn chia sẻ URL trực tiếp với người dùng, bạn có thể theo dõi quá trình thực thi chương trình từ xa. Chương trình sẽ tự động chạy và nhảy đến trang yêu cầu tương tác của người dùng. Mật khẩu mà bên còn lại nhập sẽ hoàn toàn bị ẩn, và người dùng không cần phải lo lắng về việc rò rỉ mật khẩu.
Để phản ánh trực quan hơn về quy trình thao tác của người dùng, vui lòng tham khảo các bước tương tác sau:
Quy trình tương tác sau đây được thực hiện hoàn toàn trong URL trực tiếp
## Phát lại Phiên: Phát lại Thực thi Chương trình để Gỡ lỗi Mọi thứ
Phát lại Phiên là một sự tái tạo như video của một phiên người dùng được xây dựng bằng Thư viện Ghi âm. Các bản phát lại được tạo ra dựa trên các ảnh chụp trạng thái DOM của ứng dụng web (biểu diễn HTML trong bộ nhớ của trình duyệt). Khi bạn phát lại mỗi ảnh chụp, bạn sẽ thấy một bản ghi các hành động đã thực hiện trong suốt phiên: bao gồm tất cả các lần tải trang, làm mới và điều hướng diễn ra trong suốt chuyến thăm của bạn đến trang web.
Phát lại Phiên có thể giúp bạn khắc phục sự cố trong tất cả các khía cạnh của hoạt động chương trình của bạn. Tất cả các thao tác trên trang sẽ được ghi lại và lưu lại dưới dạng video. Nếu bạn phát hiện bất kỳ vấn đề nào trong phiên, bạn có thể khắc phục và điều chỉnh chúng thông qua việc phát lại.
- Đi đến Phiên
- Nhấp vào **Lịch sử Phiên**
- Xác định phiên
- Trong chi tiết phiên, nhấp vào nút Phát để xem và đánh giá thực thi:
## Những Điều Quan Trọng
Trình duyệt Ghi Scraping của Scrapeless cho phép bạn **giám sát theo thời gian thực, tương tác từ xa và phát lại mọi bước.**
- [**Xem Trực Tiếp**](https://docs.scrapeless.com/en/scraping-browser/features/live-session/): Xem hoạt động của trình duyệt như một buổi phát trực tiếp. Thấy mọi cú nhấp chuột và nhập liệu!
- **URL Trực Tiếp**: Tạo một liên kết có thể chia sẻ nơi người dùng có thể nhập dữ liệu của họ trực tiếp. Hoàn toàn riêng tư, hoàn toàn bảo mật.
- [**Phát lại Phiên**](https://docs.scrapeless.com/en/scraping-browser/features/session-replay/): Gỡ lỗi như một chuyên gia bằng cách phát lại chính xác những gì đã xảy ra — không cần phải chạy lại chương trình.
Dù bạn là nhà phát triển đang gỡ lỗi, PM đang làm demo, hay hỗ trợ khách hàng hướng dẫn người dùng — Phiên của Scrapeless sẽ hỗ trợ bạn.
**Đã đến lúc làm cho tự động hóa thông minh và thân thiện với con người.**
[**Bắt đầu dùng thử miễn phí ngay!**](https://app.scrapeless.com/passport/login?utm_source=official&utm_medium=blog&utm_campaign=session-url)
Tại Scrapless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định và chính sách bảo mật trang web hiện hành. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động cạo nào, hãy tham khảo ý kiến cố vấn pháp lý của bạn và xem xét các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.