n8n 是一个开源工作流自动化工具,允许用户以可视化和可定制的方式连接和集成各种应用程序、服务和 API。与 Zapier 或 Make(前身为 Integromat)等工具类似,n8n 使技术性和非技术性用户都能够创建自动化工作流——也称为“自动化”或“流”——而无需重复手动任务。
Scrapeless 在 n8n 中提供以下模块:
- 搜索 Google – 轻松访问并检索来自 Google 的丰富搜索数据。
- 解锁网站 – 访问并提取来自通常会阻止机器人的 JS-Render 网站的数据。
- 从单个页面抓取数据 – 从单个网页中提取信息。
- 从所有页面爬取数据 – 爬取一个网站及其链接页面以提取全面数据。
为什么在 n8n 中使用 Scrapeless?
整合 Scrapeless 与 n8n 可以让您创建先进的、具有韧性的网页抓取工具,而无需编写代码。好处包括:
- 访问 Deep SerpApi,以单次请求获取和提取 Google SERP 数据。
- 使用通用抓取 API 绕过限制,访问任何网站。
- 使用爬虫抓取进行详细抓取个别页面。
- 使用爬虫爬行进行递归爬取和从所有链接页面检索数据。
- 将数据链入 n8n 支持的 350 多个服务(Google Sheets、Airtable、Notion 等)。
对于没有代理基础设施或抓取高级/反机器人域的团队,此集成将是一个游戏规则改变者。
如何在 n8n 中连接 Scrapeless 服务?
步骤 1. 获取您的 Scrapeless API 密钥
- 创建一个账户并登录到 Scrapeless 仪表板。您可以获得 2,500 次免费的 API 调用。
- 生成您的 Scrapeless API 密钥。
步骤 2. 设置触发条件并连接到 Scrapeless
-
导航到 n8n 概述页面,点击“创建工作流”。
-
将出现一个空的工作流编辑器,您可以在其中添加第一步。我们需要用触发器来启动工作流,选择“手动触发”。
-
添加 Scrapeless 社区节点。如果尚未安装,请点击安装。然后选择“Google 搜索”。
-
点击“创建新凭据”。粘贴 Scrapeless API 密钥。
-
现在我们可以配置搜索查询。我们将搜索“B2B 销售自动化趋势分析”。
-
现在,您可以点击运行图标以测试配置是否成功。测试正确后,我们需要配置 Discord。
步骤 3. 将抓取结果转换为 JSON 格式
接下来,我们只需将上一步中抓取的结果转换为 JSON 格式。我们需要配置一个转换文件。
您只需点击“+”号并添加“转换为 JSON”。然后请按照如下所示进行配置。
步骤 4. 连接 Discord 以接收消息。
-
点击“+”添加 Discord。
-
选择“Webhook”作为连接类型。
-
接下来,您需要配置用于接收信息的 Discord 社区的 webhook 链接。粘贴 Discord webhook 链接。
-
然后,在消息中,您可以定义数据的来源。当然,您不需要设置此选项。
-
在最后一步,您需要在“文件”下选择“转换为文件”。
第5步. 运行以获取结构化文件
点击运行此工作流,您将获取到相应的结构化文件,您可以直接下载并使用。
使用Scrapeless构建您的第一个n8n自动化
我们邀请您立即尝试Scrapeless与n8n之间的集成,并分享您的反馈和用例。您可以从Scrapeless仪表板获取您的API密钥,然后前往n8n创建一个免费帐户,开始构建您自己的网络数据自动化工作流!
在Scrapeless,我们仅访问公开可用的数据,并严格遵循适用的法律、法规和网站隐私政策。本博客中的内容仅供演示之用,不涉及任何非法或侵权活动。我们对使用本博客或第三方链接中的信息不做任何保证,并免除所有责任。在进行任何抓取活动之前,请咨询您的法律顾问,并审查目标网站的服务条款或获取必要的许可。