🎯 Trình duyệt đám mây tùy chỉnh, chống phát hiện được hỗ trợ bởi Chromium tự phát triển, thiết kế dành cho trình thu thập dữ liệu webtác nhân AI. 👉Dùng thử ngay
Quay lại blog

Cách Sử Dụng pip với Máy Chủ Proxy: Hướng Dẫn Từng Bước

Emily Chen
Emily Chen

Advanced Data Extraction Specialist

21-Nov-2025
Xem Nhanh

Tìm hiểu cách cấu hình pip để sử dụng máy chủ proxy qua dòng lệnh, tệp cấu hình hoặc biến môi trường cho việc quản lý gói liền mạch trong các mạng bị hạn chế.

Trình cài đặt gói Python, pip, là một công cụ thiết yếu cho việc quản lý các phụ thuộc dự án. Tuy nhiên, trong các môi trường doanh nghiệp, mạng bị hạn chế hoặc khi xử lý các tài nguyên bị geo-block, pip có thể không kết nối được với Chỉ mục Gói Python (PyPI) hoặc các kho gói khác. Giải pháp là cấu hình pip để sử dụng máy chủ proxy.

Hướng dẫn này cung cấp một hướng dẫn đầy đủ về ba phương pháp chính để thiết lập proxy với pip, đảm bảo việc quản lý gói liền mạch bất kể hạn chế mạng như thế nào.

Tại Sao Phải Sử Dụng Proxy Với pip?

Cấu hình một proxy cho pip là cần thiết vì một vài lý do:

  • Vượt Qua Các Hạn Chế Mạng: Nhiều tổ chức sử dụng tường lửa hoặc máy chủ proxy để kiểm soát quyền truy cập internet. Một proxy cho phép pip vượt qua những hạn chế này để kết nối tới PyPI.
  • Bảo Mật và Tuân Thủ: Trong các môi trường bảo mật, tất cả lưu lượng truy cập ra ngoài phải đi qua một proxy được theo dõi để ghi log và kiểm tra bảo mật.
  • Truy Cập Địa Lý Cụ Thể: Mặc dù ít phổ biến hơn đối với PyPI, việc sử dụng proxy có thể đảm bảo truy cập vào các gương hoặc kho chứa riêng tư bị hạn chế theo địa lý.

Ba Cách Cấu Hình Proxy Cho pip

Bạn có thể cấu hình pip để sử dụng máy chủ proxy bằng cách sử dụng dòng lệnh, tệp cấu hình hoặc biến môi trường hệ thống.

Phương Pháp 1: Cờ Dòng Lệnh (Tạm Thời)

Cách nhanh nhất để sử dụng proxy cho một lần cài đặt là truyền cờ --proxy trực tiếp vào lệnh pip install. Phương pháp này lý tưởng cho việc thử nghiệm một proxy hoặc cho các cài đặt một lần.

Cú Pháp:

bash Copy
pip install <tên_gói> --proxy <giao_thức>://[người_dùng:mật_khẩu@]<địa_chỉ_ip>:<cổng>

Ví dụ (với xác thực):

bash Copy
pip install requests --proxy http://user:password@192.168.1.10:8080

Lệnh này sẽ chỉ sử dụng proxy đã chỉ định trong khoảng thời gian của lệnh pip install đó.

Phương Pháp 2: Tệp Cấu Hình pip (Cụ Thể Cho Người Dùng)

Đối với một giải pháp bền vững và cụ thể cho người dùng, bạn có thể chỉnh sửa tệp cấu hình pip. Đây là phương pháp phổ biến nhất và được khuyến nghị cho các nhà phát triển.

Vị trí của tệp cấu hình thay đổi theo hệ điều hành:

Hệ Điều Hành Tên Tệp Vị Trí Cụ Thể Cho Người Dùng
Linux/macOS pip.conf ~/.config/pip/pip.conf hoặc ~/pip/pip.conf
Windows pip.ini %APPDATA%\pip\pip.ini

Nội Dung Tệp Cấu Hình:

Mở hoặc tạo tệp và thêm phần sau, thay thế địa chỉ proxy bằng địa chỉ của bạn:

ini Copy
[global]
proxy = http://user:password@your.proxy.server:port

Khi đã lưu lại, pip sẽ tự động sử dụng proxy này cho tất cả các lệnh được thực hiện bởi người dùng đó, loại bỏ cần thiết phải sử dụng cờ --proxy.

Phương Pháp 3: Biến Môi Trường (Toàn Cục)

Cài đặt biến môi trường hệ thống là phương pháp toàn diện nhất, vì nó buộc tất cả các ứng dụng tôn trọng các biến này (bao gồm pip, curl, và nhiều ứng dụng khác) phải sử dụng proxy.

Bạn cần phải thiết lập cả biến HTTP_PROXYHTTPS_PROXY.

Linux/macOS (Bash/Zsh):

Thêm các dòng sau vào tệp cấu hình shell của bạn (ví dụ: ~/.bashrc hoặc ~/.zshrc):

bash Copy
export HTTP_PROXY="http://user:password@your.proxy.server:port"
export HTTPS_PROXY="http://user:password@your.proxy.server:port"

Nhớ chạy source ~/.bashrc (hoặc tệp tương ứng của bạn) hoặc khởi động lại terminal để thay đổi có hiệu lực.

Windows (Command Prompt):

bash Copy
set HTTP_PROXY=http://user:password@your.proxy.server:port
set HTTPS_PROXY=http://user:password@your.proxy.server:port

Giải Pháp Proxy Được Khuyến Nghị: Scrapeless Proxies

Khi cấu hình pip để sử dụng một proxy, chất lượng và độ tin cậy của máy chủ proxy là rất quan trọng. Sử dụng một proxy chất lượng kém hoặc công cộng có thể dẫn đến tốc độ tải chậm, lỗi kết nối hoặc rủi ro bảo mật.

Scrapeless Proxies cung cấp một mạng lưới hiệu suất cao, an toàn và phân phối toàn cầu lý tưởng cho tất cả các nhu cầu quản lý gói và thu thập dữ liệu của bạn.
Scrapeless cung cấp một mạng lưới proxy toàn cầu bao gồm các proxy Residential, Static ISP, Datacenter và IPv6, với quyền truy cập vào hơn 90 triệu IP và tỷ lệ thành công lên đến 99.98%. Nó hỗ trợ nhiều trường hợp sử dụng — từ thu thập dữ liệu web và nghiên cứu thị trường [1] đến theo dõi giá, theo dõi SEO, xác minh quảng cáo và bảo vệ thương hiệu — làm cho nó trở thành lựa chọn lý tưởng cho cả quy trình dữ liệu doanh nghiệp và chuyên nghiệp.

Proxy Datacenter cho Tốc Độ và Ổn Định

Đối với quản lý gói như pip, tốc độ và độ ổn định là rất quan trọng. Proxy Datacenter của Scrapeless được tối ưu hóa cho loại lưu lượng cao, độ trễ thấp này.

Tính năng:

  • Thời gian hoạt động 99.99%
  • Thời gian phản hồi cực nhanh
  • Phiên làm việc ổn định trong thời gian dài
  • Truy cập API & tích hợp dễ dàng
  • Băng thông cao, độ trễ thấp
  • Hỗ trợ HTTP/HTTPS/SOCKS5

Proxy Scrapeless cung cấp phủ sóng toàn cầu, minh bạch và hiệu suất ổn định cao, làm cho nó trở thành lựa chọn đáng tin cậy hơn và mạnh mẽ hơn so với các lựa chọn khác — đặc biệt là cho các ứng dụng dữ liệu quan trọng cho doanh nghiệp và chuyên nghiệp cần giải pháp sản phẩm [2] và thu thập dữ liệu toàn cầu [3].

Kết luận

Cho dù bạn chọn cờ lệnh tạm thời, tệp cấu hình vĩnh viễn hay các biến môi trường hệ thống, cấu hình pip để sử dụng proxy là một quá trình đơn giản giúp giải quyết các vấn đề kết nối mạng thường gặp. Bằng cách kết hợp các phương pháp cấu hình này với một nhà cung cấp proxy chất lượng cao, đáng tin cậy như Scrapeless, bạn đảm bảo rằng môi trường phát triển Python của bạn vẫn hiệu quả và không bị giới hạn.


Tài liệu tham khảo

[1] Hướng Dẫn Người Dùng pip: Cấu Hình
[2] Tùy Chọn Dòng Lệnh pip install
[3] Tài Liệu GNU Bash: Thiết Lập Biến
[4] W3C: Định Nghĩa Phương Thức HTTP/1.1 (GET)
[5] IETF: Giao thức truyền tải siêu văn bản (HTTP/1.1): Cú Pháp Tin Nhắn và Định Tuyến

Tại Scrapless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định và chính sách bảo mật trang web hiện hành. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động cạo nào, hãy tham khảo ý kiến ​​cố vấn pháp lý của bạn và xem xét các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

Danh mục