🥳Tham gia Cộng đồng Scrapelessnhận thử nghiệm miễn phí của bạn để truy cập Bộ công cụ Web Scraping mạnh mẽ của chúng tôi!
Quay lại blog

Cách xây dựng một công cụ theo dõi tin tức kinh doanh thông minh trên Dify?

Emily Chen
Emily Chen

Advanced Data Extraction Specialist

17-Jun-2025

Trong bối cảnh cạnh tranh gay gắt hiện nay, việc theo dõi thông tin về danh tiếng thương hiệu, các phát triển trong ngành và thông tin từ đối thủ theo thời gian thực là rất quan trọng cho việc ra quyết định hiệu quả. Tuy nhiên, việc theo dõi tin tức và thông tin một cách thủ công là tốn thời gian, cần nhiều nhân lực và dễ bị bỏ lỡ những thông tin quan trọng.

Giải pháp này tích hợp Dify, một nền tảng tự động hóa AI không cần mã hàng đầu, với Scrapeless Deep SerpApi, một giao diện dữ liệu tìm kiếm Google cấp doanh nghiệp, để xây dựng một hệ thống giám sát tin tức doanh nghiệp thông minh và có thể mở rộng, giúp các doanh nghiệp:

  • Tự động thu thập và lọc tin tức theo thời gian thực
  • Sử dụng AI để phân tích thông minh và tạo ra những thông tin có thể hành động
  • Tự động gửi thông báo và báo cáo qua nhiều kênh

1. Tổng quan giải pháp

Thành phần Mô tả
Nền tảng Workflow Thông minh Dify Thiết kế và thực hiện quy trình không mã với hỗ trợ kéo và thả cho tích hợp AI và API
Scrapeless Deep SerpApi API tìm kiếm Google ổn định, tốc độ cao, chống chặn, hỗ trợ truy vấn đa vùng và đa ngôn ngữ
Mô hình AI (ví dụ: GPT-4 / Claude) Thực hiện phân tích ngữ nghĩa tự động và tạo ra các tóm tắt tin tức và thông tin doanh nghiệp thông minh
Plugin thông báo (ví dụ: Discord Webhook) Đẩy báo cáo giám sát theo thời gian thực để đảm bảo thông tin được giao nhanh chóng

2. Tổng quan Công cụ Cấp Doanh Nghiệp

Nền tảng Workflow Thông minh Dify

Một nền tảng tự động hóa AI không cần mã được thiết kế cho quy trình linh hoạt, cấp doanh nghiệp

  • Giao diện trực quan để xây dựng quy trình kéo và thả—không cần lập trình
  • Tích hợp mượt mà với các mô hình AI chính (GPT-4, Claude 3, Gemini, v.v.)
  • Hệ sinh thái plugin để kết nối với API và nguồn dữ liệu bên ngoài
  • Giám sát theo thời gian thực với nhật ký chi tiết và theo dõi lỗi
  • Kiểm soát truy cập dựa trên vai trò và hỗ trợ cộng tác nhóm
  • Phù hợp cho triển khai riêng trong môi trường doanh nghiệp bảo mật

Scrapeless Deep SerpApi

Một API Google SERP thời gian thực, độ chính xác cao được thiết kế cho quy trình AI và thông tin doanh nghiệp

Scrapeless Deep SerpApi được xây dựng dành riêng cho các trường hợp sử dụng cấp doanh nghiệp như giám sát thương hiệu, trí tuệ thị trường, tạo nội dung và ra quyết định dựa trên AI. Nó trích xuất dữ liệu có cấu trúc theo thời gian thực trực tiếp từ kết quả tìm kiếm Google (phân tích HTML), đảm bảo độ chính xác, tính mới mẻ và độ tin cậy.

Ưu điểm chính

  • Truy cập ngay lập tức dữ liệu Google SERP thời gian thực (phản hồi dưới 3 giây)
  • Độ phủ kết quả toàn diện: kết quả tự nhiên, google local, google hình ảnh, google tin tức, v.v.
  • Không có bộ đệm: Phân tích HTML trực tiếp đảm bảo kết quả mới nhất, có thể xác minh
  • Công nghệ chống scraping: Tỉ lệ thành công 99,9%, không cần cấu hình proxy thủ công
  • Hỗ trợ 195+ quốc gia và nhiều ngôn ngữ cho việc giám sát toàn cầu
  • Đầu ra có cấu trúc ở các định dạng dữ liệu thông thường, giúp các mô hình AI và quy trình tự động dễ dàng phân tích và xử lý
  • Thanh toán minh bạch, dựa trên mức sử dụng mà không có giới hạn hoặc hạn chế trường ẩn

📌 Lý tưởng cho:

  • Xây dựng hệ thống giám sát và cảnh báo truyền thông cấp doanh nghiệp
  • Theo dõi hoạt động của đối thủ và xu hướng thị trường toàn cầu
  • Tạo ra các tập dữ liệu tối ưu hóa cho tìm kiếm để gia tăng việc thu hồi thông tin (RAG)
  • Cung cấp công cụ SEO và tự động hóa nội dung ở quy mô lớn

3. Thiết lập Môi trường & Đăng ký Tài khoản

3.1 Đăng ký Tài khoản Scrapeless và Nhận Token API

  • Truy cập Bảng điều khiển Scrapeless
  • Đăng ký tài khoản doanh nghiệp
  • Sau khi đăng nhập, điều hướng đến trang Quản lý API để nhận token API của bạn

⚠️ ** quan trọng**: Giữ token API của bạn an toàn và không bao giờ chia sẻ công khai.

3.2 Đăng ký tài khoản Dify và cài đặt plugin Deep SerpApi

  1. Đăng ký Dify nếu bạn chưa làm và cài đặt https://marketplace.dify.ai/plugins/scrapelesshq/deep_serpapi

  2. Tạo một ứng dụng mới và chọn "Workflow"

  3. Trong studio quy trình, nhấp vào nút "+" để thêm một công cụ mới

  4. Điều hướng đến tab "Công cụ" trong bảng điều khiển

  5. Tìm kiếm "Deep SerpApi" của scrapelesshq (như trong danh sách công cụ đã hiển thị)

  6. Nhấp vào "Deep SerpApi" để thêm nó vào quy trình làm việc của bạn


4. Quy trình cấu hình chi tiết

Bước 1: Thêm nút Deep SerpApi

  • Nhấp vào nút "+" trong trình chỉnh sửa quy trình làm việc

  • Chọn tab Công cụ

  • Chọn Deep SerpApi (Scrapeless) và thêm nó vào quy trình làm việc của bạn

  • Trong bảng cấu hình, dán mã API Token đã sao chép trước đó


Bước 2: Cấu hình tham số tìm kiếm

  • Trong trường Chuỗi truy vấn của nút Deep SerpApi, nhập truy vấn tìm kiếm của bạn, ví dụ:
    • "Tên Công Ty của Bạn" tin tức
  • Hỗ trợ cú pháp tìm kiếm nâng cao như:
    • "Tên Công Ty của Bạn" HOẶC "Từ Khóa Ngành"
    • "Tên Công Ty" VÀ (thông báo HOẶC đối tác)
  • Trong ví dụ này, chúng tôi sử dụng:
Copy
{{ company }} tin tức kinh doanh mới nhất tháng 6 năm 2025 site:reuters.com HOẶC site:bloomberg.com HOẶC site:cnn.com

Bước 3: Thêm nút Mẫu để định dạng kết quả tìm kiếm

  1. Nhấp vào nút “+” sau nút Deep SerpApi.

  2. Chọn “Mẫu” từ các khối có sẵn.

  3. Trong trường Mẫu, nhập mẫu định dạng sau:

Copy
Kết quả tìm kiếm:
{% for item in arg1[0].organic_results %}
- Tiêu đề: {{ item.title }}
- Liên kết: {{ item.link }}
{% endfor %}
  • Mẫu này sẽ hiển thị kết quả tìm kiếm một cách có cấu trúc để thuận tiện cho phân tích AI sau này.

Bước 4: Cấu hình nút Phân tích AI

  1. Nhấp vào nút “+” sau nút Deep SerpApi.
  2. Chọn “LLM” từ các khối có sẵn.
  3. Chọn mô hình AI mà bạn ưa thích (GPT-4 được khuyến nghị).

Bạn sẽ cần nhấp vào “Cài đặt Nhà cung cấp Mô hình” để cài đặt hoặc kích hoạt mô hình của bạn.

  1. Bạn sẽ được chuyển đến một trang với lựa chọn LLM. Bạn có thể tự do chọn một cái mà bạn muốn. Trong ví dụ của chúng tôi, chúng tôi sẽ sử dụng Claude.

  2. Trong Thông báo hệ thống, tham chiếu đến kết quả tìm kiếm:

Copy
Bạn là một nhà phân tích tình báo kinh doanh.

Dựa trên các kết quả tìm kiếm sau đây, hãy tạo một báo cáo tình báo B2B ngắn gọn cho công ty "{{ company }}". Báo cáo của bạn nên bao gồm:

1. Cảm xúc tổng thể (Tích cực/ Trung lập/ Tiêu cực)
2. Các phát triển hoặc cập nhật tin tức chính
3. Các rủi ro hoặc cơ hội kinh doanh
4. Các tác động chiến lược đối với công ty
5. Bất kỳ mục nào cần khẩn cấp hoặc lưu ý

Nếu các kết quả tìm kiếm quá chung chung hoặc thiếu nội dung cụ thể cho công ty, hãy chỉ ra điều đó và gợi ý cách cải thiện truy vấn.

Sử dụng dấu đầu dòng khi có thể. Giữ cho giọng điệu chuyên nghiệp và có thể hành động.
  1. Trong Thông báo của người dùng, tham chiếu đến kết quả mẫu được định dạng:
Copy
Vui lòng phân tích các kết quả tìm kiếm này về công ty: những thông tin dựa trên tiêu đề tin tức, nội dung và nguồn đã tìm thấy.
  1. Sau đó, trong ô văn bản nhắc, sử dụng / để gọi ra bộ chọn biến, và bạn có thể gọi ra một danh sách các biến, bao gồm output, text, sys., v.v., để bạn chèn vào mẫu hoặc thiết lập biến.

Bước 5: Chạy và Gỡ lỗi quy trình làm việc

  • Nhấp vào nút Chạy ở góc trên bên phải của giao diện

  • Chờ quy trình làm việc thực hiện và kiểm tra kết quả đầu ra

  • Dựa trên kết quả phân tích, điều chỉnh từ khóa tìm kiếm và những gợi ý của AI để tối ưu hiệu suất


Bước 6: Tích hợp các kênh thông báo Doanh nghiệp (ví dụ: Discord Webhook) (Tùy chọn)

Để nhận thông báo trực tiếp trên máy chủ Discord của bạn khi quy trình làm việc hoàn tất, bạn có thể thêm tích hợp webhook:

  1. Thêm một Khối Mới:
  • Nhấn nút “+” sau bước phân tích LLM của bạn
  • Chọn “Công cụ” từ menu khối
Thêm Khối Công Cụ
  1. Tìm Discord Webhook trong Marketplace:
  • Trong phần Công cụ, nhấp vào “Marketplace”
  • Tìm kiếm “Discord” hoặc “webhook”
  • Cài đặt công cụ Discord webhook nếu nó chưa có sẵn Hỗ trợ Discord trên Marketplace
discord
  1. Cấu hình Webhook của Bạn:
  • Chọn công cụ Discord Webhook
  • Nhập URL Webhook Discord của bạn (bạn có thể lấy điều này từ cài đặt máy chủ Discord của bạn)
  • Tùy chỉnh định dạng tin nhắn để bao gồm kết quả phân tích
  • Sử dụng các biến từ các bước trước để bao gồm nội dung động
Cấu hình Discord Webhook
  1. Tùy chỉnh Tin nhắn:
  • Bao gồm truy vấn tìm kiếm trong thông báo
  • Thêm tóm tắt các phát hiện chính
  • Định dạng tin nhắn để dễ đọc trong Discord
Copy
🔍 **Báo cáo Thông tin Doanh nghiệp Hằng ngày**

/ ngữ cảnh

---
📊 *Được tạo ra bởi Dify + Scrapeless Deep SerpAPI*

Lưu ý: Bạn có thể sử dụng bất kỳ dịch vụ webhook nào bạn chọn (Slack, Microsoft Teams, v.v.) bằng cách làm theo quy trình tương tự và tìm kiếm công cụ thích hợp trong marketplace.


Bước 7: Thêm một nút kết thúc để hoàn tất cấu hình quy trình làm việc

Để hoàn tất quy trình làm việc của bạn, thêm một khối Kết thúc:
1. Thêm Khối Cuối:

  • Nhấp vào nút "+" sau bước webhook của bạn (hoặc bước LLM nếu bạn bỏ qua webhook)
  • Chọn "Kết thúc" từ menu khối

2. Cấu hình Khối Kết thúc:

  • Khối Kết thúc đánh dấu sự hoàn tất của quy trình làm việc của bạn
  • Bạn có thể tùy chọn cấu hình các biến đầu ra sẽ được trả về khi quy trình làm việc hoàn tất
  • Điều này hữu ích nếu bạn muốn sử dụng quy trình làm việc này như là một phần của một tự động hóa lớn hơn

Cấu hình Khối Kết thúc
Quy trình làm việc hoàn chỉnh của bạn giờ sẽ trông như sau:

Tất cả Cấu hình

Bước 8: Đầu ra các kết quả

Đầu ra các kết quả

🚀 Sẵn sàng nâng cao Quy trình trí tuệ của bạn?

Đăng ký Scrapeless Google SERP API hôm nay và ngay lập tức nhận 2,500 cuộc gọi API miễn phí — không cần thẻ tín dụng.
Trải nghiệm dữ liệu tìm kiếm có cấu trúc theo thời gian thực được xây dựng cho quy mô, độ chính xác và quy trình làm việc AI bản địa.

👉 Bắt đầu miễn phí và tăng cường dự án tiếp theo của bạn!

Demo Quy trình làm việc

Để giúp bạn hiểu rõ hơn cách quy trình theo dõi tin tức kinh doanh thông minh này hoạt động từ đầu đến cuối, chúng tôi đã tạo một video GIF ngắn. Nó cho thấy từng bước trong hành động — từ việc thu thập kết quả tìm kiếm theo thời gian thực với Deep SerpApi, định dạng chúng bằng một khối Mẫu, phân tích dữ liệu bằng cách sử dụng LLM, và cuối cùng gửi các thông tin chi tiết qua webhook Discord.
Demo Quy trình làm việc

5. Câu chuyện thành công & Tác động hiệu suất

Tổ chức Tài chính hàng đầu

“Từ Phản ứng đến Chủ động” — Theo dõi tin tức theo thời gian thực với độ chính xác 95%

Một tổ chức tài chính lớn gặp khó khăn trong việc theo dõi các chu kỳ tin tức chuyển động nhanh liên quan đến quy định ngân hàng, rủi ro danh tiếng và các sự kiện kinh tế vĩ mô. Trước khi triển khai hệ thống, các nhóm tuân thủ và rủi ro của họ phụ thuộc nhiều vào việc theo dõi truyền thông thủ công, điều này tốn nhiều thời gian và thường làm chậm phản ứng quan trọng.

Sau khi tích hợp hệ thống theo dõi Dify + Scrapeless:

  • Độ trễ phát hiện tin tức đã giảm 80%, cho phép nhận thức gần như theo thời gian thực về rủi ro quy định hoặc danh tiếng.
  • Độ chính xác của các mô hình cảnh báo dựa trên cảm xúc đã cải thiện lên 95%, nhờ vào dữ liệu SERP có cấu trúc chất lượng cao cung cấp cho các bộ phân loại AI.
  • Sự hợp tác giữa các phòng ban được cải thiện, khi các cảnh báo được gửi trực tiếp vào các kênh Slack nội bộ và bảng điều khiển BI.
  • Kết quả: Cửa sổ giảm thiểu rủi ro đã được rút ngắn từ giờ xuống phút, giảm thiểu thiệt hại tiềm tàng từ báo chí tiêu cực hoặc thông tin sai lệch.

Doanh Nghiệp Sản Xuất Toàn Cầu

“Tầm Nhìn Toàn Cầu, Hiểu Biết Địa Phương” — Thông Tin Thị Trường Đa Ngôn Ngữ Trên Quy Mô Lớn

Công ty sản xuất đa quốc gia này cần theo dõi tin tức toàn cầu trên nhiều thị trường khác nhau để thông báo cho chiến lược chuỗi cung ứng, xử lý rủi ro thương mại và hoạt động của đối thủ cạnh tranh — đặc biệt là ở Châu Âu, Đông Nam Á và Mỹ Latinh.

Với giải pháp tích hợp:

  • Giám sát dựa trên SERP tự động bao phủ 20+ ngôn ngữ100+ miền quốc gia, giảm thiểu các điểm mù trong truyền thông không sử dụng tiếng Anh.
  • Cảnh báo về sự thay đổi chính sách, sự cố môi trường hoặc tranh chấp lao động đã được xuất hiện sớm hơn tới 72 giờ so với quy trình thủ công trước đây.
  • Bảng điều khiển nội bộ đã tập hợp thông tin xuyên suốt các múi giờ và đội nhóm, cho phép những người ra quyết định cấp cao hành động nhanh hơn trước các sự cố toàn cầu.
  • Kết quả: Khả năng phản ứng chiến lược đã được cải thiện đáng kể, đặc biệt trong lĩnh vực mua sắmlập kế hoạch logistics.

🔧 Muốn Xây Dựng Quy Trình Thông Minh Hơn?

Nếu bạn đang tìm cách nâng cấp hệ thống giám sát dữ liệu của mình lên một cấp độ mới, đừng bỏ lỡ những hướng dẫn chi tiết này:

Khám phá những hướng dẫn này và bắt đầu xây dựng các đường ống thông minh, nhanh hơn và tự động hơn ngay hôm nay!

6. Câu Hỏi Thường Gặp & Thực Hành Tốt Nhất

Vấn đề Giải pháp Được Khuyến Nghị
Không có kết quả tìm kiếm Kiểm tra tính hợp lệ và quyền truy cập của mã token API
Kết quả tìm kiếm không chính xác Cải thiện từ khóa và loại bỏ các thuật ngữ tìm kiếm không liên quan
Phân tích AI không chính xác Cải thiện yêu cầu để làm rõ điểm chính của phân tích
Hạn ngạch API đã vượt quá hoặc có lỗi Theo dõi tần suất sử dụng và lên kế hoạch cho các cuộc gọi API phù hợp

7. Tóm tắt

Giải pháp này tận dụng sự tích hợp sâu giữa nền tảng quy trình làm việc thông minh Dify và Scrapeless Deep SerpApi để cho phép giám sát tự động và phân tích thông minh các tin tức kinh doanh ở cấp độ doanh nghiệp. Với hệ thống này, các công ty có thể cập nhật thông tin về các phát triển thương hiệu trong thời gian thực, thu thập hiểu biết về các xu hướng ngành, phản ứng nhanh chóng với sự thay đổi của thị trường, và trao quyền cho những người ra quyết định để lập kế hoạch chiến lược cho tương lai.

Tại Scrapless, chúng tôi chỉ truy cập dữ liệu có sẵn công khai trong khi tuân thủ nghiêm ngặt các luật, quy định và chính sách bảo mật trang web hiện hành. Nội dung trong blog này chỉ nhằm mục đích trình diễn và không liên quan đến bất kỳ hoạt động bất hợp pháp hoặc vi phạm nào. Chúng tôi không đảm bảo và từ chối mọi trách nhiệm đối với việc sử dụng thông tin từ blog này hoặc các liên kết của bên thứ ba. Trước khi tham gia vào bất kỳ hoạt động cạo nào, hãy tham khảo ý kiến ​​cố vấn pháp lý của bạn và xem xét các điều khoản dịch vụ của trang web mục tiêu hoặc có được các quyền cần thiết.

Bài viết phổ biến nhất

Danh mục