Hướng dẫn tích hợp MCP: Chrome DevTools MCP, Playwright MCP và Scrapeless Browser MCP

Michael Lee

Expert Network Defense Engineer

04-Nov-2025

Hướng dẫn này giới thiệu ba máy chủ Giao thức Ngữ cảnh Mô hình (MCP) — Chrome DevTools MCP, Playwright MCP và Browser MCP.

Tổng quan: Chọn MCP phù hợp

Loại MCP	Công nghệ	Lợi ích	Hệ sinh thái chính	Tốt nhất cho
Chrome DevTools MCP	Node.js / Puppeteer	Tiêu chuẩn chính thức, công cụ phân tích hiệu suất mạnh mẽ và sâu sắc.	Rộng (Gemini, Copilot, Cursor)	Tự động hóa CI/CD, quy trình làm việc đa IDE và kiểm toán hiệu suất sâu.
Playwright MCP	Node.js / Playwright	Sử dụng cây khả năng tiếp cận thay vì điểm ảnh; chắc chắn và thân thiện với LLM mà không cần nhìn.	Rộng (VS Code, Copilot)	Tự động hóa có cấu trúc, đáng tin cậy, ít bị hỏng do thay đổi giao diện nhỏ.
Scrapeless Browser MCP	Dịch vụ đám mây	Không cần thiết lập địa phương, trình duyệt đám mây có thể mở rộng, xử lý các trang web phức tạp và biện pháp chống bot.	Dựa trên API (Bất kỳ khách hàng nào)	Nhiệm vụ tự động hóa quy mô lớn, song song và tương tác với các trang web có phát hiện bot mạnh mẽ.

Một trình duyệt đám mây, vô vàn tích hợp

Cả ba MCP — Chrome DevTools MCP, Playwright MCP và Scrapeless Browser MCP — đều chia sẻ một nền tảng: tất cả đều kết nối với Scrapeless Cloud Browser.
Khác với tự động hóa trình duyệt địa phương truyền thống, Scrapeless Browser chạy hoàn toàn trên đám mây, cung cấp sự linh hoạt và khả năng mở rộng vô song cho các nhà phát triển và tác nhân AI.
Dưới đây là những điều làm cho nó thực sự mạnh mẽ:

Tích hợp liền mạch: Hoàn toàn tương thích với Puppeteer, Playwright và CDP, cho phép di chuyển dễ dàng từ các dự án hiện có chỉ với một dòng mã.
Phủ sóng IP toàn cầu: Truy cập vào các nhóm IP dân cư, ISP và không giới hạn ở hơn 195 quốc gia, với mức giá minh bạch và hiệu quả ($0.6–1.8/GB). Hoàn hảo cho tự động hóa dữ liệu web quy mô lớn.
Hồ sơ cách ly: Mỗi nhiệm vụ chạy trong một môi trường riêng biệt, đảm bảo cô lập phiên, quản lý nhiều tài khoản và ổn định lâu dài.
Mở rộng đồng thời không giới hạn: Khởi động ngay lập tức 50–1000+ phiên bản trình duyệt với hạ tầng tự động mở rộng — không cần thiết lập máy chủ, không nút thắt hiệu suất.
Các nút biên trên toàn cầu: Triển khai trên nhiều nút toàn cầu để có độ trễ cực thấp và khởi động nhanh hơn 2–3 lần so với các trình duyệt đám mây khác.
Chống phát hiện: Giải pháp tích hợp cho reCAPTCHA, Cloudflare Turnstile và AWS WAF, đảm bảo tự động hóa không bị gián đoạn ngay cả dưới các lớp bảo vệ nghiêm ngặt.
Gỡ lỗi trực quan: Đạt được gỡ lỗi tương tác giữa người và máy và theo dõi lưu lượng proxy theo thời gian thực qua Live View. Phát lại các phiên theo từng trang thông qua Ghi âm Phiên để nhanh chóng xác định sự cố và tối ưu hóa hoạt động.

Chrome DevTools MCP

Chrome DevTools MCP là một máy chủ Giao thức Ngữ cảnh Mô hình (MCP) cho phép các trợ lý lập trình AI — như Gemini, Claude, Cursor, hoặc Copilot — điều khiển và kiểm tra một trình duyệt Chrome trực tiếp để tự động hóa đáng tin cậy, gỡ lỗi nâng cao và phân tích hiệu suất.

Tính năng chính

Nhận thông tin hiệu suất: Sử dụng Chrome DevTools để ghi lại các dấu vết và trích xuất thông tin hiệu suất có thể hành động.
Gỡ lỗi trình duyệt nâng cao: Phân tích các yêu cầu mạng, chụp màn hình và kiểm tra bảng điều khiển trình duyệt.
Tự động hóa đáng tin cậy: Sử dụng Puppeteer để tự động hóa các hành động trong Chrome và tự động chờ kết quả hành động.

Yêu cầu

Node.js v20.19 hoặc phiên bản LTS bảo trì mới nhất.
npm.

Bắt đầu

Đăng nhập vào Scrapeless và lấy API Key của bạn.

Khởi động nhanh

Cấu hình JSON này được sử dụng bởi một khách hàng MCP để kết nối với máy chủ Chrome DevTools MCP và điều khiển phiên bản trình duyệt đám mây Scrapeless từ xa.

Copy

{
  "mcpServers": {
    "chrome-devtools": {
      "command": "npx",
      "args": [
        "chrome-devtools-mcp@latest",
        "--wsEndpoin=wss://browser.scrapeless.com/api/v2/browser?token=scrapeless api key&proxyCountry=US&sessionRecording=true&sessionTTL=900&sessionName=CDPDemo"
      ]
    }
  }
}

Trường hợp sử dụng

Phân tích hiệu suất web: Ghi lại các dấu vết bằng CDP và trích xuất thông tin có thể hành động về thời gian tải trang, yêu cầu mạng và thực thi JavaScript, cho phép các trợ lý AI gợi ý tối ưu hóa hiệu suất.
Gỡ lỗi tự động: Ghi lại nhật ký điều khiển, kiểm tra lưu lượng mạng, chụp ảnh màn hình và tự động phục hồi lỗi để xử lý sự cố nhanh hơn.
Kiểm thử đầu cuối: Tự động hóa các quy trình phức tạp với Puppeteer, xác thực tương tác trang và kiểm tra việc hiển thị nội dung động trong Chrome.
Tự động hóa hỗ trợ AI: Các LLM như Gemini hoặc Copilot có thể điền mẫu, nhấp vào nút, hoặc thu thập dữ liệu có cấu trúc từ các trang Chrome với độ tin cậy và độ chính xác cao.

Playwright MCP

Playwright MCP là một máy chủ Mô hình-Bối cảnh-Giao thức (MCP) cung cấp khả năng tự động hóa trình duyệt dựa trên Playwright. Nó cho phép các mô hình ngôn ngữ lớn (LLMs) hoặc trợ lý lập trình AI tương tác với các trang web.

Các tính năng chính

Nhanh và nhẹ. Sử dụng cây truy cập của Playwright, không dựa vào đầu vào pixel.
Thân thiện với LLM. Không cần mô hình nhận diện hình ảnh, hoạt động hoàn toàn trên dữ liệu có cấu trúc.
Ứng dụng công cụ xác định. Tránh được sự không rõ ràng thường gặp với các phương pháp dựa trên ảnh chụp màn hình.

Yêu cầu

Node.js 18 hoặc mới hơn
VS Code, Cursor, Windsurf, Claude Desktop, Goose hoặc bất kỳ khách hàng MCP nào khác

Bắt đầu

Đăng nhập vào Scrapeless và nhận Mã API của bạn.

Khởi động nhanh

Cấu hình JSON này được sử dụng bởi một khách hàng MCP để kết nối với máy chủ Playwright MCP và điều khiển phiên bản trình duyệt đám mây Scrapeless từ xa.

Copy

{
  "mcpServers": {
    "playwright": {
      "command": "npx",
      "args": [
        "@playwright/mcp@latest",
        "--headless",
        "--cdp-endpoint=wss://browser.scrapeless.com/api/v2/browser?token=Your_Token&proxyCountry=ANY&sessionRecording=true&sessionTTL=900&sessionName=playwrightDemo"
      ]
    }
  }
}

Trình diễn

Các trường hợp sử dụng

Thu thập dữ liệu web và trích xuất dữ liệu: Các LLM được hỗ trợ bởi Playwright MCP có thể duyệt các trang web, trích xuất dữ liệu có cấu trúc và tự động hóa các tác vụ thu thập phức tạp trong một môi trường trình duyệt thực. Điều này hỗ trợ thu thập thông tin quy mô lớn cho nghiên cứu thị trường, tập hợp nội dung và trí tuệ cạnh tranh.
Thực hiện quy trình tự động: Playwright MCP cho phép các đại lý AI thực hiện các quy trình web lặp đi lặp lại như nhập liệu, tạo báo cáo và cập nhật bảng điều khiển. Nó đặc biệt hiệu quả cho tự động hóa quy trình kinh doanh, tuyển dụng HR và các hoạt động tần suất cao khác.
Dịch vụ và hỗ trợ khách hàng cá nhân hóa: Các đại lý AI có thể sử dụng Playwright MCP để tương tác trực tiếp với các cổng thông tin web, lấy dữ liệu cụ thể cho người dùng và thực hiện các hành động khắc phục sự cố. Điều này cho phép trải nghiệm hỗ trợ cá nhân hóa, nhạy cảm với bối cảnh — ví dụ, tự động lấy chi tiết đơn hàng hoặc giải quyết các vấn đề đăng nhập.

Browser MCP

Máy chủ Scrapeless Browser MCP kết nối liền mạch các mô hình như ChatGPT, Claude và các công cụ như Cursor và Windsurf với một loạt khả năng bên ngoài, bao gồm:

Tự động hóa trình duyệt cho việc điều hướng và tương tác ở cấp độ trang
Thu thập dữ liệu từ các trang động, nặng JavaScript—xuất ra dưới dạng HTML, Markdown hoặc ảnh chụp màn hình

Các công cụ MCP được hỗ trợ

Tên	Mô tả
browser_create	Tạo hoặc sử dụng lại một phiên trình duyệt đám mây bằng Scrapeless.
browser_close	Đóng phiên hiện tại bằng cách ngắt kết nối trình duyệt đám mây.
browser_goto	Điều hướng trình duyệt đến một URL cụ thể.
browser_go_back	Quay lại một bước trong lịch sử trình duyệt.
browser_go_forward	Tiến về một bước trong lịch sử trình duyệt.
browser_click	Nhấp vào một phần tử cụ thể trên trang.
browser_type	Gõ văn bản vào một trường nhập cụ thể.
browser_press_key	Mô phỏng một lần nhấn phím.
browser_wait_for	Chờ một phần tử trang cụ thể xuất hiện.
browser_wait	Tạm dừng thực thi trong khoảng thời gian cố định.
browser_screenshot	Chụp một bức ảnh màn hình của trang hiện tại.
browser_get_html	Lấy HTML đầy đủ của trang hiện tại.
browser_get_text	Lấy tất cả văn bản có thể nhìn thấy từ trang hiện tại.
browser_scroll	Cuộn xuống cuối trang.
browser_scroll_to	Cuộn một phần tử cụ thể vào chế độ xem.
scrape_html	Lấy nội dung HTML đầy đủ từ một URL.
scrape_markdown	Lấy nội dung của một URL dưới dạng Markdown.
scrape_screenshot	Chụp ảnh màn hình chất lượng cao của bất kỳ trang web nào.

Bắt đầu

Đăng nhập vào Scrapeless và nhận mã API của bạn.

Cấu hình Khách hàng MCP của bạn

Máy chủ Scrapeless MCP hỗ trợ cả hai chế độ vận chuyển Stdio và Streamable HTTP.
🖥️ Stdio (Thực thi cục bộ)

Copy

{
  "mcpServers": {
    "Máy chủ Scrapeless MCP": {
      "command": "npx",
      "args": ["-y", "scrapeless-mcp-server"],
      "env": {
        "SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
      }
    }
  }
}

🌐 Streamable HTTP (Chế độ API lưu trữ)

Copy

{
  "mcpServers": {
    "Máy chủ Scrapeless MCP": {
      "type": "streamable-http",
      "url": "https://api.scrapeless.com/mcp",
      "headers": {
        "x-api-token": "YOUR_SCRAPELESS_KEY"
      },
      "disabled": false,
      "alwaysAllow": []
    }
  }
}

Tùy chọn Nâng cao

Tùy chỉnh hành vi phiên trình duyệt với các tham số tùy chọn. Những tham số này có thể được thiết lập thông qua biến môi trường (đối với Stdio) hoặc tiêu đề HTTP (đối với Streamable HTTP):

Stdio (Biến môi trường)	Streamable HTTP (Tiêu đề HTTP)	Mô tả
BROWSER_PROFILE_ID	x-browser-profile-id	Chỉ định một ID hồ sơ trình duyệt có thể tái sử dụng để duy trì phiên.
BROWSER_PROFILE_PERSIST	x-browser-profile-persist	Bật lưu trữ lâu dài cho cookie, lưu trữ cục bộ, v.v.
BROWSER_SESSION_TTL	x-browser-session-ttl	Định nghĩa thời gian hết hạn tối đa phiên trong giây. Phiên sẽ tự động hết hạn sau thời gian không hoạt động này.

Trường hợp sử dụng

Lấy dữ liệu và thu thập thông tin

Giám sát Thương mại điện tử: Tự động truy cập các trang sản phẩm để thu thập giá cả, tình trạng kho hàng và mô tả.
Nghiên cứu Thị trường: Lấy dữ liệu hàng loạt các tin tức, đánh giá hoặc trang công ty để phân tích và so sánh.
Tổng hợp Nội dung: Trích xuất nội dung trang, bài viết và bình luận để thu thập tập trung.
Tạo Dữ liệu Khách hàng: Thu thập thông tin liên hệ và thông tin công ty từ các trang web công ty hoặc danh bạ.

Kiểm thử & Đảm bảo Chất lượng

Xác minh Chức năng: Sử dụng các cú nhấp chuột, gõ văn bản và chờ phần tử để đảm bảo các trang hoạt động như mong đợi.
Kiểm thử Hành trình Người dùng: Mô phỏng các tương tác của người dùng thực tế (gõ, nhấp chuột, cuộn trang) để xác thực quy trình làm việc.
Hỗ trợ Kiểm thử Hồi quy: Chụp ảnh màn hình của những trang chính và so sánh để phát hiện các thay đổi về giao diện người dùng hoặc nội dung.

Tự động hóa Nhiệm vụ & Quy trình

Điền mẫu: Tự động hoàn thành và gửi các mẫu web (ví dụ: đăng ký, khảo sát).
Thu thập Dữ liệu & Tạo Báo cáo: Định kỳ trích xuất dữ liệu trang và lưu dưới dạng HTML hoặc ảnh màn hình để phân tích.
Nhiệm vụ Hành chính Đơn giản: Tự động hóa các hoạt động lặp đi lặp lại ở phía sau hoặc trên web bằng cách sử dụng cú nhấp chuột và gõ văn bản mô phỏng.

Triển lãm

Trường hợp 1: Tự động hóa Tương tác Web và Trích xuất Dữ liệu với Claude

Sử dụng Máy chủ MCP Trình duyệt, Claude có thể thực hiện các thao tác web phức tạp—như điều hướng, nhấp chuột, cuộn trang và lấy dữ liệu—thông qua các lệnh hội thoại, với bản xem trước thực thi theo thời gian thực qua các phiên trực tiếp.

Trường hợp 2: Bỏ qua Cloudflare để Lấy Nội dung Trang Đích

Sử dụng Máy chủ MCP Trình duyệt, các trang được bảo vệ bởi Cloudflare được truy cập tự động, và khi hoàn thành, nội dung trang được trích xuất và trả về ở định dạng Markdown.

Tích hợp

Claude Desktop

Mở Claude Desktop
Điều hướng đến: Cài đặt → Công cụ → Máy chủ MCP
Nhấp "Thêm Máy chủ MCP"
Dán cấu hình Stdio hoặc Streamable HTTP ở trên
Lưu và bật máy chủ
Claude sẽ bây giờ có thể thực hiện các truy vấn web, trích xuất nội dung và tương tác với các trang bằng Scrapeless

Cursor IDE

Mở Cursor
Nhấn Cmd + Shift + P và tìm kiếm: Cấu hình Máy chủ MCP
Thêm cấu hình Scrapeless MCP sử dụng định dạng ở trên
Lưu tệp và khởi động lại Cursor (nếu cần)
Bây giờ bạn có thể hỏi Cursor những điều như:
- “Tìm kiếm StackOverflow để giải quyết lỗi này”
- “Lấy HTML từ trang này”
Và nó sẽ sử dụng Scrapeless trong nền.

Tại Scrapless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định và chính sách bảo mật trang web hiện hành. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động cạo nào, hãy tham khảo ý kiến cố vấn pháp lý của bạn và xem xét các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

n8n + LLM Scraper: Nắm bắt câu trả lời AI trong quy trình không mã

Xây dựng một quy trình n8n để thu thập câu trả lời của LLM theo lịch trình với một nút yêu cầu HTTP đến Scrapeless LLM Chat Scraper, không cần mã và không cần trình duyệt.

Alex Johnson

18-Jun-2026

luồng n8n ghi lại các câu trả lời LLM qua nút Yêu cầu HTTP

Cách nâng cao Crawl4AI với Trình duyệt đám mây Scrapeless

Học cách tích hợp Crawl4AI với Scrapeless Cloud Browser để thu thập dữ liệu web hiệu quả và quy mô lớn. Mở khóa proxy tự động, dấu vân tay tùy chỉnh, tái sử dụng phiên và gỡ lỗi theo thời gian thực.

Michael Lee

20-Oct-2025

Cách cải thiện Crawl4AI với Trình duyệt Đám mây Scrapeless

Máy chủ MCP không bị bỏ qua chính thức hoạt động! Xây dựng Kết nối AI-Web Tối ưu của bạn.

Khám phá cách mà Máy chủ MCP không mảnh vỡ cung cấp cho LLM khả năng duyệt web và thu thập dữ liệu theo thời gian thực. Tìm hiểu cách xây dựng các tác nhân AI có thể tìm kiếm, trích xuất và tương tác với nội dung web động một cách liền mạch.

Michael Lee

17-Jul-2025

Danh mục