🎯 Trình duyệt đám mây tùy chỉnh, chống phát hiện được hỗ trợ bởi Chromium tự phát triển, thiết kế dành cho trình thu thập dữ liệu webtác nhân AI. 👉Dùng thử ngay
Quay lại blog

Cách kết nối Pi Agent với web: Hướng dẫn tích hợp máy chủ MCP không scrapeless.

Alex Johnson
Alex Johnson

Senior Web Scraping Engineer

18-May-2026

Những điểm chính:

  • Pi Agent là một tác nhân mã hóa trên terminal được thiết kế tối giản. Nó đi kèm với bốn công cụ (read, write, edit, bash) và thêm mọi thứ khác thông qua các mở rộng tùy chọn, giúp giữ cho cửa sổ ngữ cảnh nhỏ nhưng có nghĩa là không có truy cập web được tích hợp sẵn.
  • pi-mcp-adapter kết nối Pi với bất kỳ máy chủ MCP nào thông qua một công cụ proxy khoảng ~200 token. Các máy chủ mặc định hoạt động lười biếng — chúng chỉ khởi động khi tác nhân gọi một trong các công cụ của chúng — vì vậy việc kết nối vài máy chủ MCP không làm quá tải ngân sách ngữ cảnh.
  • Máy chủ Scrapeless MCP phơi bày 21 công cụ qua stdio và qua một điểm cuối HTTP có thể truyền được tại https://api.scrapeless.com/mcp. Phạm vi bao gồm google_search, google_trends, toàn bộ 16 công cụ browser_* (một trình duyệt chống phát hiện được lưu trữ trên đám mây với proxy dân cư ở 195+ quốc gia), và ba công cụ lấy dữ liệu không trạng thái (scrape_html, scrape_markdown, scrape_screenshot).
  • Một tệp .mcp.json kết nối Pi với Scrapeless. Bộ chuyển đổi đọc định dạng cấu hình MCP tiêu chuẩn mà Claude Desktop, Cursor và các khách hàng MCP khác đã sử dụng, vì vậy cùng một đoạn JSON có thể được sử dụng cho bất kỳ khách hàng nào trong số đó.
  • Mô hình end-to-end: prompt → Pi → pi-mcp-adapterscrapeless-mcp-server → trình duyệt đám mây → kết quả xếp hạng hoặc Markdown được trích xuất → mã được tạo ra từ dữ liệu trực tiếp. Pi ngừng tạo ra từ kiến thức chỉ được đào tạo và bắt đầu gắn kết đầu ra với trang mà nó vừa lấy dữ liệu.
  • Miễn phí để bắt đầu. Tài khoản Scrapeless mới bao gồm thời gian chạy Trình duyệt lấy dữ liệu miễn phí — đăng ký tại app.scrapeless.com.

Giới thiệu: một tác nhân mã hóa tối giản với các công cụ web trực tiếp

Hầu hết các tác nhân mã hóa trên terminal đều có hàng chục tính năng mà bạn có thể không bao giờ sử dụng. Pi Agent có quan điểm trái ngược: bốn công cụ, hoàn toàn minh bạch, mọi thứ khác được thêm vào theo yêu cầu. Điều này giúp giữ cho tác nhân nhanh và cửa sổ ngữ cảnh rẻ, nhưng cũng có nghĩa là Pi không thể truy cập tài liệu mới nhất cho một thư viện, đọc trang phát hành được công bố tuần trước, hoặc kéo dữ liệu trực tiếp từ một trang web công khai một mình.

Giải pháp là kết nối Pi với một máy chủ Giao thức Ngữ cảnh Mô hình (MCP) phơi bày các công cụ web. Gói scrapeless-mcp-server làm chính xác điều đó — dựa vào Trình duyệt lấy dữ liệu Scrapeless, một trình duyệt chống phát hiện được lưu trữ trên đám mây mà truy cập qua proxy dân cư ở 195+ quốc gia.

Bài viết này sẽ hướng dẫn việc kết nối hai yếu tố với pi-mcp-adapter (mở rộng MCP cộng đồng cho Pi) và một tệp .mcp.json duy nhất. Điểm cuối mà Pi kết nối đến là điểm mà Claude Desktop, Cursor và các khách hàng MCP khác sử dụng; cùng một đoạn JSON hoạt động trên tất cả chúng.


Những gì bạn có thể làm với nó

  • Căn cứ vào việc tạo mã trong tài liệu trực tiếp. Để Pi lấy README hiện tại của một thư viện trước khi tạo một ví dụ — không còn API lỗi thời từ kiến thức mô hình đã đào tạo.
  • Tìm kiếm và lấy dữ liệu trong một lần. Pi gọi google_search để xếp hạng các trang ứng viên, sau đó scrape_markdown để kéo trang liên quan nhất dưới dạng Markdown sạch.
  • Điều khiển một trình duyệt chống phát hiện trên đám mây từ một chỉ thị terminal. Các công cụ như browser_goto, browser_click, browser_type, và browser_get_html cho phép Pi hoàn toàn kiểm soát một Chromium đám mây thực tế với tính năng duy trì phiên.
  • Lấy dữ liệu theo vùng thông qua các proxy dân cư. Giới hạn tìm kiếm tới gl=us hoặc gl=de trực tiếp từ cuộc gọi công cụ của tác nhân.
  • Giữ trong một phiên terminal duy nhất. Không chuyển tab trình duyệt, không sao chép-dán đầu ra curl, không có CLI lấy dữ liệu riêng để chăm sóc.

Tại Scrapeless, chúng tôi chỉ truy cập dữ liệu công khai có sẵn trong khi hoàn toàn tuân thủ các quy định, luật pháp và chính sách quyền riêng tư của trang web hiện hành. Nội dung trong bài viết này chỉ để mục đích trình bày.


Pi Agent là gì?

Pi Agent là một tác nhân mã hóa trên terminal được xây dựng bởi Mario Zechner (người sáng tạo ra framework trò chơi libGDX). Ngay từ đầu, nó cung cấp cho mô hình bốn công cụ:

  • read — đọc tệp và thư mục
  • write — tạo và chỉnh sửa tệp
  • edit — thực hiện các chỉnh sửa mục tiêu cho các tệp hiện có
  • bash — thực thi các lệnh shell

Mọi thứ khác là tùy chọn. Bạn mở rộng Pi thông qua các mở rộng TypeScript, kỹ năng và mẫu chỉ thị được đóng gói dưới dạng các gói có thể cài đặt qua npm hoặc git. Tác nhân hoạt động trong bốn chế độ — tương tác (đàm thoại), in/JSON (kịch bản), RPC (tích hợp stdin/stdout), và SDK (nhúng). Hỗ trợ từ các nhà cung cấp là rộng rãi: Anthropic, OpenAI, Google, Mistral, Groq, và nhiều hơn nữa.

Cài đặt nó toàn cục với npm:

bash Copy
npm install -g @mariozechner/pi-coding-agent

Sự đánh đổi là rõ ràng: một bề mặt khởi đầu nhỏ mà bạn có thể phát triển để phù hợp với quy trình làm việc của mình, thay vì một bộ công cụ một kích cỡ cho tất cả.


Tại sao Pi cần truy cập web

Lý do của Pi bị ràng buộc bởi những gì mô hình nền tảng đã được đào tạo. Điều đó có nghĩa là nó không thể:

  • Tra cứu những thay đổi API mới nhất của một thư viện sau thời điểm cắt đào tạo.
  • Lấy các trang tài liệu hiện tại, nhật ký thay đổi hoặc ghi chú phát hành
  • Đọc một trang công khai để lấy bảng cấu hình, giá cả hoặc sơ đồ
  • Xác minh rằng một ví dụ trong dữ liệu huấn luyện của nó vẫn biên dịch với phiên bản gói ngày nay

Đối với những hệ sinh thái di chuyển nhanh — bất cứ điều gì liên quan đến web, frontend, công cụ AI, cơ sở hạ tầng — điều này rất quan trọng. Kết nối Pi với một máy chủ MCP có khả năng web và bạn nhận được một tác nhân lập trình tìm kiếm thông tin hiện tại và lấy thông tin từ các trang chính xác mà nó cần trước khi tạo mã. Đầu ra không còn là một dự đoán tốt nhất từ bộ nhớ cũ mà bắt đầu được căn cứ vào trang vừa được render.


Máy chủ MCP không có rác là gì?

Máy chủ MCP không có rác là một máy chủ Giao thức Ngữ cảnh Mô hình (Model Context Protocol) mở các API trình duyệt đám mây, tìm kiếm và lấy nội dung không có rác như các công cụ MCP. Bất kỳ khách hàng tương thích MCP nào — Pi, Claude Desktop, Cursor, Codex CLI, Gemini CLI, Windsurf, VS Code Copilot Chat — đều có thể gọi chúng trực tiếp từ một cuộc trò chuyện.

Tại thời điểm xuất bản, máy chủ cung cấp 21 công cụ trên ba danh mục:

  • Tìm kiếm và xu hướnggoogle_search, google_trends
  • Tự động hóa trình duyệt (16 công cụ)browser_create, browser_close, browser_goto, browser_go_back, browser_go_forward, browser_click, browser_type, browser_press_key, browser_wait, browser_wait_for, browser_screenshot, browser_snapshot, browser_get_html, browser_get_text, browser_scroll, browser_scroll_to
  • Lấy nội dung không có trạng tháiscrape_html, scrape_markdown, scrape_screenshot

Hai chế độ truyền tải được hỗ trợ:

  • Stdionpx -y scrapeless-mcp-server chạy máy chủ như một quá trình con của khách hàng MCP. Đây là mặc định phù hợp cho các tác nhân trên máy tính để bàn và trong terminal như Pi.
  • HTTP có thể stream — chỉ định khách hàng đến https://api.scrapeless.com/mcp. Đây là mặc định phù hợp cho các tác nhân lưu trữ trên đám mây không thể gọi đến npx.

Cả hai chế độ đều được hỗ trợ bởi cùng một khóa API Scrapeless. Mã nguồn của máy chủ có tại github.com/scrapeless-ai/scrapeless-mcp-server; tài liệu tham khảo công cụ đầy đủ tại docs.scrapeless.com. Nhận khóa API của bạn trên kế hoạch miễn phí tại app.scrapeless.com.


Cầu MCP: pi-mcp-adapter

Pi không đi kèm với hỗ trợ MCP ngay từ đầu. Đó là một sự lựa chọn có chủ ý: Mario lập luận rằng các định nghĩa công cụ MCP quá nặng nề về token cho một tác nhân tối thiểu. Các máy chủ MCP phổ biến như Playwright MCP cung cấp 21 công cụ và tiêu thụ khoảng 13,7k token; Chrome DevTools MCP cung cấp 26 công cụ và tiêu thụ khoảng 18k token. Kết nối một vài máy chủ có thể tiêu tốn một phần đáng kể của cửa sổ ngữ cảnh trước khi cuộc trò chuyện bắt đầu.

Phản hồi của cộng đồng là pi-mcp-adapter: một phần mở rộng Pi cung cấp một công cụ proxy duy nhất (~200 token) thay vì tải mọi định nghĩa công cụ MCP trước. Tác nhân tìm kiếm và gọi các công cụ riêng lẻ theo yêu cầu:

Copy
mcp({ search: "screenshot" })
mcp({ tool: "scrapeless_scrape_markdown", args: '{"url": "https://example.com"}' })

Các máy chủ mặc định lười biếng — chúng chỉ bắt đầu khi tác nhân gọi một trong các công cụ của chúng lần đầu tiên, và chúng ngắt kết nối sau 10 phút không hoạt động (có thể cấu hình). Siêu dữ liệu công cụ được lưu vào đĩa để tìm kiếm và mô tả hoạt động mà không cần kết nối trực tiếp.

Bộ chuyển đổi đọc các tệp cấu hình MCP tiêu chuẩn theo thứ tự ưu tiên này:

  1. ~/.config/mcp/mcp.json (chia sẻ toàn cầu theo người dùng)
  2. <Thư mục tác nhân Pi>/mcp.json (đại diện toàn cầu của Pi, thường là ~/.pi/agent/mcp.json)
  3. .mcp.json (chia sẻ theo dự án địa phương)
  4. .pi/mcp.json (đại diện dự án của Pi)

Cài đặt nó bằng một lệnh (chạy bên trong Pi hoặc qua CLI của Pi):

bash Copy
pi install npm:pi-mcp-adapter

Phiên bản bộ chuyển đổi tại thời điểm xuất bản là 2.6.1.


Cách kết nối tác nhân Pi với máy chủ MCP không có rác

Điều kiện tiên quyết

  • Node.js 18 trở lên. Tác nhân Pi và pi-mcp-adapter đều yêu cầu điều này; biến thể CLI Gemini của hỗ trợ Pi cần Node 20 trở lên.
  • Tài khoản Scrapeless và khóa API. Đăng ký tại app.scrapeless.com. Tài khoản mới bao gồm thời gian chạy trình duyệt lấy nội dung miễn phí.
  • Một khóa API từ nhà cung cấp mô hình mà Pi hỗ trợ — Anthropic, OpenAI, Google Gemini, Mistral, DeepSeek, Groq, hoặc bất kỳ tên nào khác mà Pi liệt kê tại /login.

Bước 1 — Cài đặt tác nhân Pi

Mở terminal của bạn và chạy:

bash Copy
npm install -g @mariozechner/pi-coding-agent

Xác minh việc cài đặt:

bash Copy
pi --version

Tệp nhị phân Pi tại thời điểm xuất bản là @mariozechner/pi-coding-agent phiên bản 0.73.1.

Bước 2 — Cài đặt pi-mcp-adapter

Với Pi đã được cài đặt, thêm phần mở rộng thích ứng MCP:

bash Copy
pi install npm:pi-mcp-adapter

Khởi động lại Pi sau khi cài đặt. Bộ chuyển đổi lấy một công cụ proxy mcp duy nhất có giá khoảng 200 token, cộng với lệnh slash /mcp để quản lý máy chủ tương tác.

Bước 3 — Nhận khóa API Scrapeless của bạn

Đăng nhập vào app.scrapeless.com, mở Cài đặt → Khóa API, và sao chép khóa của bạn. Giữ nó trong bộ nhớ tạm để sử dụng ở bước tiếp theo.

Bước 4 — Cấu hình .mcp.json

Trong thư mục dự án của bạn, tạo một tệp có tên là .mcp.json. Đây là định dạng tệp cấu hình MCP tiêu chuẩn mà pi-mcp-adapter đọc khi khởi động (không yêu cầu cú pháp đặc biệt cho Pi):

json Copy
{
  "mcpServers": {
    "scrapeless": {
      "command": "npx",
      "args": ["-y", "scrapeless-mcp-server"],
      "env": {
        "SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
      }
    }
  }
}

Thay thế YOUR_SCRAPELESS_KEY bằng khóa từ Bước 3. Máy chủ MCP đọc khóa API từ biến môi trường SCRAPELESS_KEY — tên đó là nguồn gốc của sự thật; không thay đổi thành SCRAPELESS_API_KEY.

Khi chạy lần đầu, npx -y scrapeless-mcp-server sẽ tải gói và khởi động máy chủ qua stdio. Không cần lệnh cài đặt riêng.

Nếu bạn muốn bỏ qua stdio và sử dụng phương thức truyền tải HTTP có thể luồng, hãy thay thế mục nhập thành:

json Copy
{
  "mcpServers": {
    "scrapeless": {
      "url": "https://api.scrapeless.com/mcp",
      "headers": {
        "x-api-token": "YOUR_SCRAPELESS_KEY"
      }
    }
  }
}

Cả hai hình thức đều sử dụng cùng một khóa API Scrapeless và xuất hiện cùng 21 công cụ. Stdio là mặc định đúng cho một workstation; HTTP là mặc định đúng nếu Pi đang chạy trên một máy chủ đám mây không thể gọi đến npx.

Bước 5 — Kết nối với nhà cung cấp mô hình

Khởi động Pi:

bash Copy
pi

Bạn sẽ thấy pi-mcp-adapter được liệt kê dưới Mở rộng. Gõ /login và chọn phương thức xác thực của bạn (đăng ký hoặc khóa API). Chọn nhà cung cấp mà bạn muốn sử dụng, dán khóa API, và Pi sẽ lưu thông tin xác thực cho các phiên sau. Gõ /model để mở bảng chọn mô hình và chọn một mô hình.

Nhận khóa API Scrapeless của bạn trên gói miễn phí: app.scrapeless.com

Bước 6 — Xác minh kết nối

/mcp để mở bảng MCP. Máy chủ scrapeless được liệt kê nhưng lười biếng — lúc đầu nó có thể hiển thị 0/21 vì kết nối chưa được mở. Làm sáng hàng bằng các phím mũi tên và nhấn Ctrl+R để kết nối lại (hoặc gọi bất kỳ công cụ Scrapeless nào, điều này sẽ kích hoạt kết nối lười biếng).

Khi đã kết nối, phần dưới của terminal hiển thị MCP: 1/1 servers. 21 công cụ giờ đây có thể khám phá. Để xác nhận bằng cách liệt kê chúng:

Copy
mcp({ search: "scrapeless" })

Bạn sẽ thấy các công cụ google_search, google_trends, browser_*, và scrape_* trong kết quả. Nhấn Esc để đóng bảng điều khiển.

Bước 7 — Chạy một tác vụ thực

Đưa cho Pi một lệnh cần dữ liệu web trực tuyến. Ví dụ:

Copy
Tìm kiếm trên web tài liệu chính thức của npm axios, thu thập trang liên quan nhất,
và tạo một ví dụ JavaScript hoạt động thực hiện yêu cầu GET với việc xử lý lỗi đúng cách.
Lưu nó dưới dạng axios-example.js.

Pi gọi scrapeless_google_search trước, trả về một danh sách kết quả xếp hạng với tiêu đề, URL và đoạn trích từ tài liệu chính thức của axios. Sau đó nó chọn URL phù hợp nhất và gọi scrapeless_scrape_markdown để lấy trang ở định dạng Markdown sạch — trình duyệt đám mây xử lý việc kết xuất JavaScript và bất kỳ thách thức chống phát hiện nào trên đường đi, và Pi nhận nội dung đã được trích xuất thay vì HTML thô.

Với tài liệu trong ngữ cảnh, Pi tạo ra axios-example.js dựa trên phiên bản API mà nó vừa đọc. Nếu xuất hiện lỗi tạm thời os error 10054 hoặc HTTP 503, hãy thử gọi lại — đội tàu trình duyệt đám mây tái chế các phiên và việc phát lại thường thành công.

Bước 8 — Khám phá đầu ra

Pi ghi axios-example.js vào thư mục dự án của bạn. Tệp chứa một ví dụ phản ánh các mẫu mà nó vừa thu thập — async/await, phân nhánh mã trạng thái và kiểm tra lỗi nhất quán với những gì tài liệu axios hiện tại khuyến nghị:

javascript Copy
async function fetchPost() {
  try {
    const response = await axios.get('https://jsonplaceholder.typicode.com/posts/1');
    console.log('Trạng thái:', response.status);
    console.log('Tiêu đề:', response.data.title);
    console.log('Nội dung:', response.data.body);
  } catch (error) {
    if (error.response) {
      console.error('Trạng thái:', error.response.status);
      console.error('Dữ liệu:', error.response.data);
    } else if (error.request) {
      console.error('Không nhận được phản hồi từ máy chủ');
    } else {
      console.error('Lỗi thiết lập yêu cầu:', error.message);
    }
  }
}

Chạy nó:

bash Copy
npm install axios
node axios-example.js

Những gì bạn nhận lại

Một phản hồi điển hình tools/list từ máy chủ Scrapeless MCP có hình dạng này (lược đồ phản ánh máy chủ trực tiếp tại thời điểm xuất bản; giá trị trường là mẫu minh họa):

json Copy
{
  "tools": [
    {
      "name": "google_search",
      "description": "Công cụ tìm kiếm thông tin toàn cầu",
      "inputSchema": {
        "type": "object",
        "properties": {
          "q":  { "type": "string", "default": "Tiêu đề tin tức hàng đầu" },
          "gl": { "type": "string", "default": "us" },
          "hl": { "type": "string", "default": "en" }
        }
      }
    },
    {
      "name": "scrape_markdown",
      "description": "Lấy nội dung của một URL và trả về dưới dạng Markdown",
      "inputSchema": {
        "type": "object",
        "properties": { "url": { "type": "string", "format": "uri" } },
        "required": ["url"]
      }
    },
    { "name": "browser_create",   "description": "Tạo một phiên trình duyệt đám mây mới" },
    { "name": "browser_goto",     "description": "Chuyển đến một URL trong một phiên hiện có" },
    { "name": "browser_get_html", "description": "Trả về HTML đã được render của trang hiện tại" }
    // …16 cái nữa
  ]
}

Những quan sát chân thực sau khi tích hợp điều này:

  • Chi phí token chủ yếu đến từ công cụ proxy, không phải từ 21 công cụ cơ bản. Bộ điều hợp giữ siêu dữ liệu trong bộ nhớ đệm đĩa; không gì được tải vào prompt hệ thống cho đến khi bạn gọi directTools trên một máy chủ.
  • Khởi động lười biếng có lợi trong các phiên lạnh. Máy chủ Scrapeless MCP chỉ khởi động khi lần đầu tiên Pi gọi một trong các công cụ của nó, vì vậy việc mở phiên Pi có cấu hình máy chủ này không tốn thêm chi phí.
  • google_search + scrape_markdown là cặp phổ biến. Tìm kiếm để tìm trang, lấy dữ liệu để đọc. Các công cụ browser_* được dành cho các quy trình cần đăng nhập, chuyển trang hoặc phân trang.
  • Lỗi tạm thời os error 10054 / HTTP 503 xảy ra. Nó được tài liệu hóa trong hướng dẫn Scrapeless và nổi lên khi phiên trình duyệt đám mây thay đổi. Thực hiện lại lệnh gọi công cụ từ Pi thay vì khởi động lại phiên.
  • SCRAPELESS_KEY là biến môi trường chuẩn. Các bề mặt Scrapeless khác (CLI độc lập, kỹ năng tác nhân) sử dụng SCRAPELESS_API_KEY. Máy chủ MCP là ngoại lệ.

Kết luận: một tác nhân lập trình tối thiểu đọc web trực tiếp

Tác nhân Pi mặc định giữ ở mức tối thiểu; Máy chủ Scrapeless MCP thêm 21 công cụ web mà không thay đổi điều đó. Sợi dây kết nối là pi-mcp-adapter — một công cụ proxy, khoảng 200 token, khởi động máy chủ lười — và một tệp .mcp.json mà hệ sinh thái MCP rộng lớn đã hiểu. Đoạn JSON cùng một này có thể áp dụng cho Claude Desktop, Cursor, Codex CLI, Gemini CLI, Windsurf hoặc VS Code Copilot Chat mà không thay đổi.

Sự khác biệt định tính xuất hiện lần đầu tiên khi bạn yêu cầu Pi tạo mã chống lại một thư viện mà bạn chưa định nghĩa: thay vì suy đoán từ bộ nhớ dữ liệu đào tạo, Pi tìm kiếm, lấy dữ liệu từ tài liệu chuẩn, và viết ví dụ của nó chống lại phiên bản thực sự đang hoạt động. Kết hợp hướng dẫn này với tổng quan về Máy chủ Scrapeless MCP để có danh sách công cụ đầy đủ, hoặc với hướng dẫn AWS Strands + Scrapeless MCP nếu cùng một máy chủ MCP đang được tích hợp vào một tác nhân dựa trên khung thay vì một tác nhân trong terminal. Ghim chế độ chỉ proxy cho sử dụng thông thường, nâng cấp các công cụ riêng lẻ lên directTools khi bạn muốn mô hình nhìn thấy chúng trong prompt hệ thống của nó, và giữ lifecycle: lazy để các phiên lạnh vẫn duy trì chi phí thấp.


Sẵn sàng Xây Dựng Kênh Dữ Liệu Được Hỗ Trợ AI của Bạn?

Tham gia cộng đồng của chúng tôi để nhận kế hoạch miễn phí và kết nối với các nhà phát triển đang xây dựng các kênh tác nhân dựa trên MCP: Discord · Telegram.

Đăng ký tại app.scrapeless.com để nhận runtime Trình Duyệt Lấy Dữ Liệu miễn phí, sau đó chèn đoạn .mcp.json ở trên vào Pi (hoặc bất kỳ khách hàng MCP nào khác) và bắt đầu phát sinh mã của bạn có cơ sở dữ liệu trực tuyến. Chi tiết giá cả tại scrapeless.com/en/pricing.


Câu hỏi thường gặp

1. Việc lấy dữ liệu bằng máy chủ Scrapeless MCP thông qua Pi có hợp pháp không?
Máy chủ MCP chỉ truy cập vào nội dung công khai, nội dung mà một người dùng không đăng nhập sẽ thấy trong trình duyệt. Tính hợp pháp phụ thuộc vào quyền tài phán và Điều khoản Dịch vụ của trang web mục tiêu. Kiểm tra ToS của bất kỳ trang nào mà Pi được yêu cầu lấy dữ liệu và tham khảo ý kiến luật sư cho các trường hợp sử dụng có rủi ro cao.

2. Tôi có cần một proxy trên máy chủ Scrapeless MCP không?
Không. Trình duyệt đám mây đã thoát qua các proxy dân cư ở hơn 195 quốc gia. Sử dụng tham số gl trong google_search (hoặc một gợi ý kiểu --proxy-country trong prompt của tác nhân) để định rõ một vùng.

3. Pi thấy điều gì nếu một lệnh gọi công cụ gặp ERR_TUNNEL_CONNECTION_FAILED, os error 10054, hoặc HTTP 503?
Đây là những lỗi tạm thời trên đội ngũ trình duyệt đám mây. Pi hiển thị lỗi cho mô hình, mà thường tự động thử lại; nếu không, hãy phát lại lời nhắc. Chúng không phải là dấu hiệu cho thấy dây điện MCP bị hỏng.

4. Pi hiển thị máy chủ Scrapeless nhưng 0/21 công cụ - có vấn đề gì không?
Không có gì cả. Các máy chủ mặc định là lười biếng trong pi-mcp-adapter. Số lượng sẽ chuyển sang 21/21 lần đầu tiên Pi gọi một công cụ Scrapeless. Để kết nối cưỡng bức, hãy làm nổi bật máy chủ trong /mcp và nhấn Ctrl+R, hoặc chạy /mcp reconnect scrapeless từ dòng lệnh.

5. Công cụ proxy rất tuyệt, nhưng tôi có thể trực tiếp mở công cụ Scrapeless cho mô hình của Pi không?
Có — thêm "directTools": true (hoặc "directTools": ["google_search", "scrape_markdown"] để chọn một tập con) vào mục scrapeless trong .mcp.json. Các công cụ trực tiếp tiêu tốn khoảng 150–300 token mỗi công cụ trong lời nhắc hệ thống; hãy chọn những cái mà tác nhân sử dụng nhiều nhất.

6. Có thể sử dụng cùng một đoạn .mcp.json bên ngoài Pi không?
Có. Đối tượng mcpServers là phong bì cấu hình MCP tiêu chuẩn. Claude Desktop, Cursor, Codex CLI, Gemini CLI, Windsurf và VS Code Copilot Chat đều đọc nó (một số với sự khác biệt nhỏ về đường dẫn hoặc tên tệp). Khối Scrapeless phía trên hoạt động trong tất cả các ứng dụng đó.

7. Có bao nhiêu máy chủ MCP mà Pi có thể kết nối cùng lúc?
Không có giới hạn cứng — pi-mcp-adapter giữ mỗi máy chủ trong trạng thái lười biếng và ngắt kết nối sau 10 phút không hoạt động, vì vậy chi phí token và quy trình giữ nguyên không đổi bất kể có bao nhiêu máy chủ được liệt kê. Giới hạn quan trọng là cửa sổ ngữ cảnh của nhà cung cấp mô hình và ngân sách theo công cụ riêng của Pi.

8. Điều này có hoạt động mà không cần tác nhân AI không - tôi có thể gọi máy chủ MCP Scrapeless từ một tập lệnh không?
Có. Điểm cuối HTTP có thể phát trực tuyến tại https://api.scrapeless.com/mcp có thể gọi từ bất kỳ khách hàng HTTP nào bằng cách sử dụng chuỗi JSON-RPC initializetools/listtools/call; một bài kiểm tra khói bằng curl chống lại nó trả về serverInfo.name: "scrapeless-mcp-server" và một tiêu đề mcp-session-id để theo dõi các cuộc gọi tiếp theo. Pi là lớp tiện ích, không phải là phụ thuộc cứng.

Tại Scrapless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định và chính sách bảo mật trang web hiện hành. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động cạo nào, hãy tham khảo ý kiến ​​cố vấn pháp lý của bạn và xem xét các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

Danh mục