🎯 Trình duyệt đám mây tùy chỉnh, chống phát hiện được hỗ trợ bởi Chromium tự phát triển, thiết kế dành cho trình thu thập dữ liệu webtác nhân AI. 👉Dùng thử ngay
Quay lại blog

FlareSolverr: Hướng dẫn từng bước hoàn chỉnh [2026]

Michael Lee
Michael Lee

Expert Network Defense Engineer

17-Nov-2025

FlareSolverr về cơ bản là một máy chủ proxy được thiết kế để vượt qua các biện pháp bảo vệ chống bot của Cloudflare. Nó hoạt động như một môi giới giữa các trang web được Cloudflare bảo vệ và các yêu cầu truy xuất dữ liệu của bạn. Sử dụng Python, Selenium và ChromeDriver, FlareSolverr cho phép người dùng bỏ qua các thách thức của Cloudflare và truy cập nội dung web được bảo vệ một cách hiệu quả.

Hướng dẫn này cung cấp cái nhìn sâu sắc về FlareSolverr, bao gồm hướng dẫn cài đặt cho Linux, Docker và Windows. Nó cũng giải thích cấu hình cho các kịch bản khác nhau, bao gồm biến môi trường, Cloudflare, Plex, Prometheus, và tích hợp với các công cụ khác như Jackett và Prowlarr.


Thông báo

Hướng dẫn này chỉ dành cho mục đích giáo dục. Nó không khuyến khích bất kỳ hành vi, sản phẩm hoặc dịch vụ vi phạm pháp luật nào. Người dùng chịu trách nhiệm tuân thủ tất cả các quy định pháp luật hiện hành, bao gồm các quy tắc về sở hữu trí tuệ. Chúng tôi không chịu trách nhiệm cho bất kỳ thiệt hại nào phát sinh từ việc sử dụng hướng dẫn này.


1. Giới thiệu về FlareSolverr

a. FlareSolverr là gì?

Cloudflare cung cấp các giải pháp bảo mật như bảo vệ chống bot, giảm thiểu DDoS và các biện pháp bảo vệ quyền riêng tư của người dùng. Để phân biệt con người với bot, Cloudflare sử dụng các thách thức JavaScript, CAPTCHA và các kỹ thuật nhận diện vân tay. Trong khi những trở ngại này ngăn chặn các hoạt động bot độc hại, chúng cũng có thể chặn các tác vụ tự động hợp pháp.

FlareSolverr là một máy chủ proxy mã nguồn mở giúp vượt qua các biện pháp bảo vệ chống bot của Cloudflare bằng cách giả lập môi trường trình duyệt thực.

Lưu ý: Không phải tất cả các bot đều có hại. Bot có thể thực hiện các công việc hợp pháp như thu thập dữ liệu web, quét công cụ tìm kiếm, giám sát hoặc hỗ trợ các ứng dụng AI.


b. FlareSolverr hoạt động như thế nào?

FlareSolverr hoạt động như một proxy giả lập hành vi trình duyệt của con người để vượt qua các thách thức của Cloudflare. Quy trình làm việc điển hình là:

  1. Một khách hàng (ví dụ: thư viện HTTP Python) gửi một yêu cầu.
  2. FlareSolverr, ban đầu ở chế độ chờ, khởi chạy một trình duyệt Chrome thông qua Python Selenium và Undetected ChromeDriver.
  3. Yêu cầu được chuyển tiếp đến trang web được Cloudflare bảo vệ.
  4. Các thách thức của Cloudflare sẽ được giải quyết tự động.
  5. Trang web phản hồi và FlareSolverr trả lại HTML và cookie cho khách hàng.

Điều này cho phép dữ liệu kết quả được sử dụng với các khách hàng HTTP khác như Python Requests.


c. Các trường hợp sử dụng phổ biến

FlareSolverr hỗ trợ nhiều ứng dụng khác nhau, bao gồm:

  • Bỏ qua bảo vệ Cloudflare cho việc thu thập dữ liệu web (tin tức, thương mại điện tử, theo dõi giá cả).
  • Truy cập các chỉ mục torrent và Usenet qua Jackett, Prowlarr và Sonarr/Radarr.
  • Cung cấp truy cập từ xa ổn định cho các máy chủ Plex ẩn sau Cloudflare.
  • Giám sát các API được Cloudflare bảo vệ với Prometheus.
  • Cung cấp nội dung đã thu thập cho các mô hình AI/LLM.
  • Tích hợp với các trình duyệt không giao diện như Playwright hoặc Puppeteer để thu thập dữ liệu ẩn danh.
  • Bỏ qua một số tường CAPTCHA (thành công hạn chế; có thể cần đến các công cụ giải CAPTCHA bên thứ ba).

d. Ưu nhược điểm

Ưu điểm:

  • Bỏ qua tự động các thách thức của Cloudflare.
  • Thu thập dữ liệu hiệu quả từ các trang web được bảo vệ.
  • Giả lập trình duyệt một cách liền mạch để truy cập đáng tin cậy.
  • Tích hợp dễ dàng với Python, Selenium và chu trình ChromeDriver.
  • HTML và cookie có thể được sử dụng với các khách hàng HTTP khác.

Nhược điểm:

  • Vấn đề pháp lý và đạo đức—bỏ qua các cơ chế chống bot có thể vi phạm điều khoản dịch vụ.
  • Tải thêm lên máy chủ trên các trang web mục tiêu.
  • Tiêu thụ tài nguyên cao do các phiên trình duyệt và giải quyết JavaScript.
  • Phụ thuộc vào các công cụ bên ngoài như Selenium và ChromeDriver.
  • Xử lý CAPTCHA có thể bị hạn chế; cần đến các công cụ giải CAPTCHA bên thứ ba như 2Captcha hoặc CapSolver.

2. Cài đặt FlareSolverr

a. Cài đặt Linux

Yêu cầu: Python 3.11+, pip.

Các bước:

  1. Mở terminal và tạo một thư mục:
bash Copy
mkdir FlareSolverr
cd FlareSolverr
  1. Tải xuống phiên bản nhị phân mới nhất từ GitHub chính thức.
  2. Giải nén tệp lưu trữ:
bash Copy
tar -xzf flaresolverr_linux_x64.tar.gz
cd flaresolverr
  1. Chạy FlareSolverr:
bash Copy
./flaresolverr

Truy cập có sẵn tại http://0.0.0.0:8191.

Khắc phục sự cố:

  • Thiếu libatk-1.0.so.0sudo apt install libatk1.0-0
  • Thiếu Xvfb → sudo apt install xvfb

Mẹo: Chrome hiện đại hỗ trợ chế độ không giao diện, khiến Xvfb trở nên tùy chọn.


b. Cài đặt Docker

  1. Nhân bản kho lưu trữ:
bash Copy
git clone https://github.com/FlareSolverr/FlareSolverr.git
cd FlareSolverr
sudo docker-compose up -d
  1. Xác minh container:
bash Copy
sudo docker ps
  1. Truy cập FlareSolverr tại http://localhost:8191.

Hỗ trợ nhiều kiến trúc: x86, x86-64, ARM32, ARM64.


c. Cài đặt Windows

  1. Tải xuống phiên bản nhị phân Windows x64 từ GitHub.
  2. Giải nén và chạy FlareSolverr.exe.
  3. Cho phép truy cập tường lửa.

3. Cấu hình FlareSolverr

a. Thay đổi biến môi trường

Linux:

bash Copy
export LOG_LEVEL=debug
export TZ=America/New_York

Docker: Sửa đổi docker-compose.yml trong phần environment.
Windows:

cmd Copy
set LOG_LEVEL=debug
```plaintext
đặt TZ=Châu Âu/London

b. Cấu hình Cloudflare

Đặt các biến môi trường quan trọng:

bash Copy
xuất CAPTCHA_SOLVER=hcaptcha
xuất LOG_LEVEL=debug
./flaresolverr

c. Cấu hình Plex

bash Copy
xuất PROXY='{"url": "http://địa-chỉ-máy-chủ-proxy:port-proxy"}'
xuất LOG_LEVEL=info
./flaresolverr

d. Cấu hình Prometheus

  • Kích hoạt Prometheus: PROMETHEUS_ENABLED=true
  • Đặt cổng lắng nghe: PROMETHEUS_PORT=xxxx
  • Cấu hình Prometheus để quét các điểm cuối FlareSolverr.

e. Các ứng dụng khác (Jackett, Prowlarr)

  • Kích hoạt FlareSolverr trong cài đặt ứng dụng.
  • Đặt URL máy chủ: http://flaresolverr:8191.
  • Điều chỉnh các biến giải CAPTCHA nếu cần thiết.

4. Sử dụng FlareSolverr

a. Sử dụng curl trên Linux

  • Tạo phiên:
bash Copy
curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "sessions.create"}'
  • Liệt kê các phiên:
bash Copy
curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "sessions.list"}'
  • Hủy phiên:
bash Copy
curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "sessions.destroy", "session": "session_id_here"}'
  • Yêu cầu GET:
bash Copy
curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "request.get", "url": "http://www.example.com", "maxTimeout": 60000}'

b. Sử dụng Python Requests

python Copy
import requests

post_body = {
    "cmd": "request.get",
    "url": "https://www.rapidseedbox.com/",
    "maxTimeout": 60000
}

response = requests.post(
    'http://localhost:8191/v1',
    headers={'Content-Type': 'application/json'},
    json=post_body
)

print(response.json())

Điều này trả về nội dung HTML và cookie từ trang web mục tiêu.


5. Kết luận

FlareSolverr là một công cụ mạnh mẽ để vượt qua các biện pháp bảo vệ của Cloudflare, cho phép thu thập dữ liệu web, giám sát và truy cập truyền thông đáng tin cậy. Nó tích hợp liền mạch với các công cụ như Prometheus, Plex, Jackett và Prowlarr.

Dù được cài đặt trên Linux, Docker hay Windows, FlareSolverr có thể được cấu hình để đáp ứng nhiều trường hợp sử dụng khác nhau. Kết hợp với curl hoặc Python Requests, nó cung cấp một giải pháp hiệu quả để truy cập nội dung web bị bảo vệ.


Tại Scrapless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định và chính sách bảo mật trang web hiện hành. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động cạo nào, hãy tham khảo ý kiến ​​cố vấn pháp lý của bạn và xem xét các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

Danh mục