FlareSolverr: Hướng dẫn từng bước hoàn chỉnh [2026]

Michael Lee

Expert Network Defense Engineer

17-Nov-2025

FlareSolverr về cơ bản là một máy chủ proxy được thiết kế để vượt qua các biện pháp bảo vệ chống bot của Cloudflare. Nó hoạt động như một môi giới giữa các trang web được Cloudflare bảo vệ và các yêu cầu truy xuất dữ liệu của bạn. Sử dụng Python, Selenium và ChromeDriver, FlareSolverr cho phép người dùng bỏ qua các thách thức của Cloudflare và truy cập nội dung web được bảo vệ một cách hiệu quả.

Hướng dẫn này cung cấp cái nhìn sâu sắc về FlareSolverr, bao gồm hướng dẫn cài đặt cho Linux, Docker và Windows. Nó cũng giải thích cấu hình cho các kịch bản khác nhau, bao gồm biến môi trường, Cloudflare, Plex, Prometheus, và tích hợp với các công cụ khác như Jackett và Prowlarr.

Thông báo

Hướng dẫn này chỉ dành cho mục đích giáo dục. Nó không khuyến khích bất kỳ hành vi, sản phẩm hoặc dịch vụ vi phạm pháp luật nào. Người dùng chịu trách nhiệm tuân thủ tất cả các quy định pháp luật hiện hành, bao gồm các quy tắc về sở hữu trí tuệ. Chúng tôi không chịu trách nhiệm cho bất kỳ thiệt hại nào phát sinh từ việc sử dụng hướng dẫn này.

1. Giới thiệu về FlareSolverr

a. FlareSolverr là gì?

Cloudflare cung cấp các giải pháp bảo mật như bảo vệ chống bot, giảm thiểu DDoS và các biện pháp bảo vệ quyền riêng tư của người dùng. Để phân biệt con người với bot, Cloudflare sử dụng các thách thức JavaScript, CAPTCHA và các kỹ thuật nhận diện vân tay. Trong khi những trở ngại này ngăn chặn các hoạt động bot độc hại, chúng cũng có thể chặn các tác vụ tự động hợp pháp.

FlareSolverr là một máy chủ proxy mã nguồn mở giúp vượt qua các biện pháp bảo vệ chống bot của Cloudflare bằng cách giả lập môi trường trình duyệt thực.

Lưu ý: Không phải tất cả các bot đều có hại. Bot có thể thực hiện các công việc hợp pháp như thu thập dữ liệu web, quét công cụ tìm kiếm, giám sát hoặc hỗ trợ các ứng dụng AI.

b. FlareSolverr hoạt động như thế nào?

FlareSolverr hoạt động như một proxy giả lập hành vi trình duyệt của con người để vượt qua các thách thức của Cloudflare. Quy trình làm việc điển hình là:

Một khách hàng (ví dụ: thư viện HTTP Python) gửi một yêu cầu.
FlareSolverr, ban đầu ở chế độ chờ, khởi chạy một trình duyệt Chrome thông qua Python Selenium và Undetected ChromeDriver.
Yêu cầu được chuyển tiếp đến trang web được Cloudflare bảo vệ.
Các thách thức của Cloudflare sẽ được giải quyết tự động.
Trang web phản hồi và FlareSolverr trả lại HTML và cookie cho khách hàng.

Điều này cho phép dữ liệu kết quả được sử dụng với các khách hàng HTTP khác như Python Requests.

c. Các trường hợp sử dụng phổ biến

FlareSolverr hỗ trợ nhiều ứng dụng khác nhau, bao gồm:

Bỏ qua bảo vệ Cloudflare cho việc thu thập dữ liệu web (tin tức, thương mại điện tử, theo dõi giá cả).
Truy cập các chỉ mục torrent và Usenet qua Jackett, Prowlarr và Sonarr/Radarr.
Cung cấp truy cập từ xa ổn định cho các máy chủ Plex ẩn sau Cloudflare.
Giám sát các API được Cloudflare bảo vệ với Prometheus.
Cung cấp nội dung đã thu thập cho các mô hình AI/LLM.
Tích hợp với các trình duyệt không giao diện như Playwright hoặc Puppeteer để thu thập dữ liệu ẩn danh.
Bỏ qua một số tường CAPTCHA (thành công hạn chế; có thể cần đến các công cụ giải CAPTCHA bên thứ ba).

d. Ưu nhược điểm

Ưu điểm:

Bỏ qua tự động các thách thức của Cloudflare.
Thu thập dữ liệu hiệu quả từ các trang web được bảo vệ.
Giả lập trình duyệt một cách liền mạch để truy cập đáng tin cậy.
Tích hợp dễ dàng với Python, Selenium và chu trình ChromeDriver.
HTML và cookie có thể được sử dụng với các khách hàng HTTP khác.

Nhược điểm:

Vấn đề pháp lý và đạo đức—bỏ qua các cơ chế chống bot có thể vi phạm điều khoản dịch vụ.
Tải thêm lên máy chủ trên các trang web mục tiêu.
Tiêu thụ tài nguyên cao do các phiên trình duyệt và giải quyết JavaScript.
Phụ thuộc vào các công cụ bên ngoài như Selenium và ChromeDriver.
Xử lý CAPTCHA có thể bị hạn chế; cần đến các công cụ giải CAPTCHA bên thứ ba như 2Captcha hoặc CapSolver.

2. Cài đặt FlareSolverr

a. Cài đặt Linux

Yêu cầu: Python 3.11+, pip.

Các bước:

Mở terminal và tạo một thư mục:

bash Copy

mkdir FlareSolverr
cd FlareSolverr

Tải xuống phiên bản nhị phân mới nhất từ GitHub chính thức.
Giải nén tệp lưu trữ:

bash Copy

tar -xzf flaresolverr_linux_x64.tar.gz
cd flaresolverr

Chạy FlareSolverr:

bash Copy

./flaresolverr

Truy cập có sẵn tại http://0.0.0.0:8191.

Khắc phục sự cố:

Thiếu libatk-1.0.so.0 → sudo apt install libatk1.0-0
Thiếu Xvfb → sudo apt install xvfb

Mẹo: Chrome hiện đại hỗ trợ chế độ không giao diện, khiến Xvfb trở nên tùy chọn.

b. Cài đặt Docker

Nhân bản kho lưu trữ:

bash Copy

git clone https://github.com/FlareSolverr/FlareSolverr.git
cd FlareSolverr
sudo docker-compose up -d

Xác minh container:

bash Copy

sudo docker ps

Truy cập FlareSolverr tại http://localhost:8191.

Hỗ trợ nhiều kiến trúc: x86, x86-64, ARM32, ARM64.

c. Cài đặt Windows

Tải xuống phiên bản nhị phân Windows x64 từ GitHub.
Giải nén và chạy FlareSolverr.exe.
Cho phép truy cập tường lửa.

3. Cấu hình FlareSolverr

a. Thay đổi biến môi trường

Linux:

bash Copy

export LOG_LEVEL=debug
export TZ=America/New_York

Docker: Sửa đổi docker-compose.yml trong phần environment.
Windows:

cmd Copy

set LOG_LEVEL=debug
```plaintext
đặt TZ=Châu Âu/London

b. Cấu hình Cloudflare

Đặt các biến môi trường quan trọng:

bash Copy

xuất CAPTCHA_SOLVER=hcaptcha
xuất LOG_LEVEL=debug
./flaresolverr

c. Cấu hình Plex

bash Copy

xuất PROXY='{"url": "http://địa-chỉ-máy-chủ-proxy:port-proxy"}'
xuất LOG_LEVEL=info
./flaresolverr

d. Cấu hình Prometheus

Kích hoạt Prometheus: PROMETHEUS_ENABLED=true
Đặt cổng lắng nghe: PROMETHEUS_PORT=xxxx
Cấu hình Prometheus để quét các điểm cuối FlareSolverr.

e. Các ứng dụng khác (Jackett, Prowlarr)

Kích hoạt FlareSolverr trong cài đặt ứng dụng.
Đặt URL máy chủ: http://flaresolverr:8191.
Điều chỉnh các biến giải CAPTCHA nếu cần thiết.

4. Sử dụng FlareSolverr

a. Sử dụng `curl` trên Linux

Tạo phiên:

bash Copy

curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "sessions.create"}'

Liệt kê các phiên:

bash Copy

curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "sessions.list"}'

Hủy phiên:

bash Copy

curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "sessions.destroy", "session": "session_id_here"}'

Yêu cầu GET:

bash Copy

curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "request.get", "url": "http://www.example.com", "maxTimeout": 60000}'

b. Sử dụng Python Requests

python Copy

import requests

post_body = {
    "cmd": "request.get",
    "url": "https://www.rapidseedbox.com/",
    "maxTimeout": 60000
}

response = requests.post(
    'http://localhost:8191/v1',
    headers={'Content-Type': 'application/json'},
    json=post_body
)

print(response.json())

Điều này trả về nội dung HTML và cookie từ trang web mục tiêu.

5. Kết luận

FlareSolverr là một công cụ mạnh mẽ để vượt qua các biện pháp bảo vệ của Cloudflare, cho phép thu thập dữ liệu web, giám sát và truy cập truyền thông đáng tin cậy. Nó tích hợp liền mạch với các công cụ như Prometheus, Plex, Jackett và Prowlarr.

Dù được cài đặt trên Linux, Docker hay Windows, FlareSolverr có thể được cấu hình để đáp ứng nhiều trường hợp sử dụng khác nhau. Kết hợp với curl hoặc Python Requests, nó cung cấp một giải pháp hiệu quả để truy cập nội dung web bị bảo vệ.

Tại Scrapless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định và chính sách bảo mật trang web hiện hành. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động cạo nào, hãy tham khảo ý kiến cố vấn pháp lý của bạn và xem xét các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

n8n + LLM Scraper: Nắm bắt câu trả lời AI trong quy trình không mã

Xây dựng một quy trình n8n để thu thập câu trả lời của LLM theo lịch trình với một nút yêu cầu HTTP đến Scrapeless LLM Chat Scraper, không cần mã và không cần trình duyệt.

Alex Johnson

18-Jun-2026

luồng n8n ghi lại các câu trả lời LLM qua nút Yêu cầu HTTP

Cách nâng cao Crawl4AI với Trình duyệt đám mây Scrapeless

Học cách tích hợp Crawl4AI với Scrapeless Cloud Browser để thu thập dữ liệu web hiệu quả và quy mô lớn. Mở khóa proxy tự động, dấu vân tay tùy chỉnh, tái sử dụng phiên và gỡ lỗi theo thời gian thực.

Michael Lee

20-Oct-2025

Cách cải thiện Crawl4AI với Trình duyệt Đám mây Scrapeless

Máy chủ MCP không bị bỏ qua chính thức hoạt động! Xây dựng Kết nối AI-Web Tối ưu của bạn.

Khám phá cách mà Máy chủ MCP không mảnh vỡ cung cấp cho LLM khả năng duyệt web và thu thập dữ liệu theo thời gian thực. Tìm hiểu cách xây dựng các tác nhân AI có thể tìm kiếm, trích xuất và tương tác với nội dung web động một cách liền mạch.

Michael Lee

17-Jul-2025

Danh mục

FlareSolverr: Hướng dẫn từng bước hoàn chỉnh [2026]

Thông báo

1. Giới thiệu về FlareSolverr

a. FlareSolverr là gì?

b. FlareSolverr hoạt động như thế nào?

c. Các trường hợp sử dụng phổ biến

d. Ưu nhược điểm

2. Cài đặt FlareSolverr

a. Cài đặt Linux

b. Cài đặt Docker

c. Cài đặt Windows

3. Cấu hình FlareSolverr

a. Thay đổi biến môi trường

b. Cấu hình Cloudflare

c. Cấu hình Plex

d. Cấu hình Prometheus

e. Các ứng dụng khác (Jackett, Prowlarr)

4. Sử dụng FlareSolverr

a. Sử dụng curl trên Linux

b. Sử dụng Python Requests

5. Kết luận

Bài viết phổ biến nhất

n8n + LLM Scraper: Nắm bắt câu trả lời AI trong quy trình không mã

Cách nâng cao Crawl4AI với Trình duyệt đám mây Scrapeless

Máy chủ MCP không bị bỏ qua chính thức hoạt động! Xây dựng Kết nối AI-Web Tối ưu của bạn.

a. Sử dụng `curl` trên Linux