🥳Hãy tham gia Cộng đồng ScrapelessYêu cầu dùng thử miễn phí để truy cập Bộ công cụ quét web mạnh mẽ của chúng tôi!
Quay lại Blog

Cách xây dựng một trình trích xuất Xu hướng Google | Hướng dẫn trích xuất dữ liệu trình duyệt năm 2025

Michael Lee
Michael Lee

Expert Network Defense Engineer

15-Jan-2025

Bất cứ khi nào bạn cần ý tưởng từ khóa hoặc chủ đề cho tiếp thị nội dung, bạn sẽ thấy Google Trends là một trong những lựa chọn tốt nhất.

Google đi đầu trong kiến thức của con người, giám sát thông tin được công bố theo thời gian thực và có thể giám sát gần như mọi chủ đề, theo dõi sự thay đổi của nó theo thời gian hoặc sự gia tăng đột biến về sự quan tâm.

Do đó, theo dõi Google Trends là một cách tuyệt vời để nhanh chóng thu hút được rất nhiều lưu lượng truy cập và liên kết ngắn hạn.

Thật không may, đối với những người chúng ta làm việc trong tiếp thị nội dung, không có cách nào thực sự hiệu quả để giám sát và trích xuất thông tin từ Google Trends một cách nhanh chóng và rộng rãi. Họ có các trang xu hướng hàng ngày và thời gian thực cho toàn quốc, nhưng không có cách nào để giám sát tất cả chúng, không có cách nào để tải xuống hoặc xuất dữ liệu hàng loạt dưới dạng CSV, và không có cách nào để liên tục nhận được dữ liệu tùy chỉnh được lặp lại trên nhiều thuật ngữ mà không cần phải tự mình vào và tìm kiếm từng thuật ngữ, tải xuống từng tệp CSV và tự biên soạn tất cả dữ liệu.

Không cần phải nói, đây là một rắc rối khá lớn.

Vậy, làm thế nào để bạn thu thập dữ liệu từ Google Trends và sử dụng nó một cách hiệu quả? Bài viết này sẽ giới thiệu 5 cách để xây dựng công cụ thu thập dữ liệu Google Trends của bạn.

Phương pháp 1. Sử dụng trình duyệt thu thập dữ liệu

Google Trends không cung cấp API chính thức. Nếu có, nó sẽ làm mọi thứ dễ dàng hơn nhiều.

Một số người cho rằng đó là vì lý do bảo mật; những người khác cho rằng đó là để bảo vệ mã giám sát độc quyền của họ. Tôi đoán API Google Trends có thể nằm trong kế hoạch tính năng của Google, nhưng họ có thể không sẵn sàng cung cấp nó miễn phí.

Không thành vấn đề! Chúng ta có thể sử dụng một trình duyệt thu thập dữ liệu bên thứ ba mạnh mẽ để thu thập dữ liệu Google Trends. Trình duyệt thu thập dữ liệu có thể dễ dàng bỏ qua việc phát hiện robot và đạt được việc thu thập dữ liệu của Google Trends. Scrapeless Scraping Browser là một trong những công cụ thu thập dữ liệu Google Trends mạnh mẽ nhất năm 2025.

Tại sao chọn Scrapeless?

Với Scrapeless, bạn có thể dễ dàng truy cập và thu thập dữ liệu Google Trends mà không cần viết hoặc duy trì các tập lệnh thu thập dữ liệu phức tạp. Chỉ cần gọi mã chúng tôi cung cấp để nhanh chóng trích xuất tất cả Dữ liệu Google Trends bạn cần.

Điều kiện tiên quyết

  • Node.js: Phiên bản 14 trở lên.
  • npm: Trình quản lý gói Node.
  • Dịch vụ Scrapeless Browserless: Sử dụng dịch vụ trình duyệt được cung cấp bởi Scrapeless

Lấy khóa API

Truy cập bảng điều khiển Scraping Browser và lấy khóa API của bạn từ tab Cài đặt. Đó là một tham số cần thiết để hoàn tất việc thu thập dữ liệu.

Lấy khóa API

Cài đặt

  1. Cài đặt các phụ thuộc
Bash Copy
npm install

Cấu hình

Bước 1. Biến môi trường: Tạo tệp .env trong thư mục gốc của dự án và thêm khóa API của bạn:

Bash Copy
API_KEY=your_scrapeless_api_key

Bước 2. Cấu hình tập lệnh: Tập lệnh được cấu hình sẵn để lấy xu hướng cho "youtube" và "twitter" tại Hoa Kỳ trong 7 ngày qua. Chúng ta cần tùy chỉnh:

  • Thay đổi từ khóa: Sửa đổi tham số q trong biến QUERY_PARAMS.
  • Thay đổi vị trí địa lý: Cập nhật tham số geo.
  • Điều chỉnh phạm vi ngày: Thay đổi tham số ngày nếu cần.

Bước 3. Đặt cookie: Để đảm bảo rằng dữ liệu của bạn về sở thích thay đổi theo thời gian được hiển thị ổn định. Bạn cần đặt cookie thông qua puppeteer trước khi truy cập trang web:

Bash Copy
const cookies = JSON.parse(fs.readFileSync('./data/cookies.json', 'utf-8'));await browser.setCookie(...cookies);

Bây giờ bạn cần truy cập cookie ở đây trong trình duyệt của mình và đăng nhập vào https://trends.google.com để xuất cookies.json. Nếu bạn không biết cách xuất cookie, bạn có thể thử sử dụng tiện ích mở rộng trình duyệt này để xuất cookie ở định dạng json.

Sử dụng

Chạy tập lệnh bằng Node.js:

Bash Copy
node index.js

Các bước hoạt động của tập lệnh:

  1. Tập lệnh kết nối với trình duyệt từ xa
  2. Điều hướng đến Google Trends với các tham số đã chỉ định bằng cách đặt cookie thông qua puppeteer.
  3. Trích xuất dữ liệu xu hướng và ghi nhật ký vào bảng điều khiển.
  4. Lưu ảnh chụp màn hình của trang xu hướng dưới dạng trends.png và cập nhật cookie.
  5. Xử lý bất kỳ giới hạn tốc độ nào bằng cách tải lại trang nếu gặp lỗi 429.
  6. Nhận dữ liệu kết quả: result.json.

Phương pháp 2. Viết một trình thu thập dữ liệu bằng ChatGPT

Trí tuệ nhân tạo là một chủ đề rất gây tranh cãi hiện nay. Tôi có xu hướng nghĩ "nó không tốt cho việc sản xuất nội dung", nhưng nó chắc chắn có những công dụng của nó. Một trong số đó là lập trình.

Trên thực tế, ChatGPT được xây dựng trên Python và nó sử dụng hầu hết các trang web GitHub và StackExchange như một phần của mô hình đào tạo của nó. Kết quả là, nó thường hoạt động tốt đối với những thứ cần phải cụ thể, chính xác và kỹ thuật, như công việc lập trình.

Tất nhiên, nó không hoàn hảo. ChatGPT thực sự không có môi trường phát triển riêng của mình và nó không thể làm những việc như "viết mã có thể chạy" hoặc "đảm bảo mã tốt nhất có thể".

Hãy xem GPT đã nói với tôi điều gì:

Python Copy
from pytrends.request import TrendReq
import pandas as pd

# Khởi tạo pytrends
pytrends = TrendReq(hl='en-US', tz=360)

# Thiết lập từ khóa bạn muốn theo dõi
keyword = 'Python Programming'

# Xây dựng dữ liệu tải lên cho từ khóa
pytrends.build_payload([keyword], cat=0, timeframe='now 7-d', geo='', gprop='')

# Lấy sự quan tâm theo thời gian
data = pytrends.interest_over_time()

# Hiển thị dữ liệu
print(data)

# Lưu dữ liệu vào tệp CSV
data.to_csv('google_trends_data.csv')

# Lấy các truy vấn liên quan
related_queries = pytrends.related_queries()
print(related_queries[keyword]['top'])

# Lấy các tìm kiếm xu hướng thời gian thực ở Hoa Kỳ
trending_searches = pytrends.trending_searches(pn='united_states')
print(trending_searches.head())

Tuy nhiên, ChatGPT không thể phân biệt được sự thật với hư cấu, vì vậy nó có thể cung cấp cho bạn một mức độ hoặc mã không chính xác. Không sao, đó không phải là vấn đề.

Chỉ cần biết rằng bạn có thể yêu cầu ChatGPT viết một công cụ thu thập dữ liệu cho Google Trends và nó sẽ tạo mã cho bạn. Sau đó, bạn cần khắc phục sự cố mã đó, đảm bảo bạn hiểu nó hoạt động như thế nào và nó đến từ đâu và khắc phục các sự cố mà nó tạo ra. Rốt cuộc, nó giúp bạn tiết kiệm rất nhiều thời gian và công sức.

Phương pháp 3. Sử dụng thư viện Pytrends

Cuối cùng thì Pytrends cũng đã đến!

Pytrends là một công cụ thu thập dữ liệu Google Trends và bộ chuyển đổi API dựa trên Python. Nó là dịch vụ API Google Trends lớn nhất, phổ biến nhất và được duy trì tốt nhất cho đến nay.

Việc cài đặt hoàn toàn rất dễ dàng, sau đó chỉ cần định dạng các yêu cầu của bạn để lấy dữ liệu bạn cần, thiết lập danh sách proxy để xử lý việc thu thập dữ liệu của bạn và sau đó sử dụng dữ liệu.

Tuy nhiên, bạn phải tuân thủ các hạn chế của Google về việc thu thập dữ liệu. Điều này có nghĩa là bạn phải bỏ qua các khối, thêm độ trễ và nói chung là bắt chước hành vi của con người. Điều này có thể khó thiết lập và có thể yêu cầu thử và sai.

Đừng la hét vào việc phát hiện chống bot!
Scrapeless Web Unlocker giúp rất nhiều để tránh bị chặn và xác minh CAPTCHA!

Thử nghiệm miễn phí ngay bây giờ!

Bạn cũng có thể chọn xây dựng giải pháp tùy chỉnh của riêng mình bằng Python. Tuy nhiên, việc xây dựng trình thu thập dữ liệu Google Trends hoàn toàn bằng Python đòi hỏi phải xem xét toàn diện để tránh bị Google phát hiện trực tiếp và gây cản trở công việc của bạn.

Chúng tôi đã giải thích chi tiết các bước thu thập dữ liệu Google Trends bằng Python trong các bài viết trước. Vui lòng đọc kỹ để cung cấp cho bạn sự trợ giúp toàn diện nhất.

Những cân nhắc khác

Nó không bất hợp pháp, nhưng nó lại trái với chính sách. Tuy nhiên, bạn không được thu thập thông tin cá nhân được bảo vệ bởi pháp luật từ Google Trends.

Về mặt kỹ thuật, "truy cập tự động" vi phạm Điều khoản sử dụng của Google. Sử dụng công cụ thu thập dữ liệu, robot hoặc API để truy cập dữ liệu Google Trends (hoặc bất kỳ trang Google nào khác) về mặt kỹ thuật là vi phạm Điều khoản dịch vụ.

Google thường sẽ không hành động chống lại bạn cụ thể. Tuy nhiên, họ sẽ giám sát hành vi của bạn và nếu bạn vi phạm giới hạn tốc độ hoặc cố gắng bỏ qua các hạn chế truy cập, họ có thể hạn chế hoặc cấm địa chỉ IP của bạn truy cập dữ liệu Google Trends.

Có. Trên thực tế, bạn thường cần một danh sách các proxy để luân phiên. Càng nhiều yêu cầu từ một địa chỉ IP nhất định trong một khoảng thời gian ngắn, Google càng có khả năng tạm thời hoặc vĩnh viễn chặn các địa chỉ IP đó.

Bạn nên sử dụng proxy nhà ở thông minh có thể luân phiên. Chúng có thể phần lớn tránh được các giới hạn tốc độ do một IP duy nhất gây ra.

Scrapeless cung cấp dịch vụ proxy IP sạch toàn cầu cao cấp, chuyên về proxy IPv4 nhà ở động. Với hơn 70 triệu IP tại 195 quốc gia, mạng proxy nhà ở của Scrapeless cung cấp hỗ trợ proxy toàn cầu toàn diện để thúc đẩy sự phát triển kinh doanh của bạn.

Kết luận

4 phương pháp hiệu quả trong bài viết này có thể giúp bạn xây dựng một công cụ thu thập dữ liệu Google Trends mạnh mẽ. Tất cả những gì bạn cần nhớ là:

  • Không thu thập bất kỳ dữ liệu cá nhân nào!
  • Nhập cách bỏ qua việc phát hiện chống bot.
  • Tìm một proxy luân phiên phù hợp.

API Google Trends của Scrapeless tích hợp với trình giải mã CAPTCHA, Web Unlocker và proxy luân phiên thông minh, có thể giúp dễ dàng thu thập dữ liệu Google Trends và cung cấp trải nghiệm thu thập dữ liệu liền mạch.

Nhận bản dùng thử miễn phí ngay bây giờ!

Tại Scrapeless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định hiện hành và chính sách bảo mật của trang web. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm pháp lý đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động thu thập dữ liệu nào, hãy tham khảo ý kiến ​​cố vấn pháp lý của bạn và xem lại các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

Danh mục