如何免费轻松抓取公开的谷歌招聘结果

Emily Chen

Advanced Data Extraction Specialist

20-Feb-2025

网络上数百万个职位空缺信息可供查看，手动浏览谷歌职位信息既费时又低效。抓取谷歌职位结果可以自动化这个过程，节省您的宝贵时间，并让您快速访问最新的职位列表。无论您是招聘人员、开发者，还是希望收集相关数据的求职者，本指南都将逐步向您展示如何有效且负责任地抓取谷歌职位结果。让我们开始吧！

为什么抓取谷歌职位信息？

谷歌职位信息聚合来自多个来源的职位列表，包括招聘网站、公司网站和招聘机构。抓取谷歌职位信息可以为您提供以下方面的数据：

就业市场趋势：追踪热门技能、薪资范围和职位名称。
竞争分析：分析竞争对手的职位发布信息。
招聘洞察：根据实时数据改进招聘策略。

鉴于谷歌职位服务于众多求职者和雇主，抓取这些数据可以为招聘网站、招聘机构、人力资源部门和市场研究人员提供显著优势。

抓取谷歌职位的挑战

虽然抓取谷歌职位信息非常有价值，但它也面临一些挑战：

反抓取技术：谷歌采用 CAPTCHA、IP 封锁和速率限制等技术来防止机器人抓取数据。
频繁的 HTML 更改：谷歌经常更新其网站结构，要求抓取程序不断适应。
法律问题：抓取谷歌职位信息可能会违反谷歌的服务条款，因此务必谨慎操作。

也就是说，使用合适的工具，您可以绕过这些障碍，有效地抓取谷歌职位结果。

推荐工具：使用 Scrapeless 抓取谷歌职位

Scrapeless 谷歌职位抓取 API 是一个用于从谷歌职位搜索引擎提取职位数据的工具。它允许用户通过简单的 API 调用获取与特定职位搜索相关的结构化数据，例如职位名称、公司名称、职位地点、发布日期、职位描述等。该 API 旨在简化数据收集过程，使用户能够专注于数据分析和利用，而无需处理网络抓取和解析的复杂性。

Scrapeless 谷歌职位抓取 API 提供各种参数，允许用户根据特定需求自定义搜索请求。

以下是一些常用的参数：

参数	是否必需	描述
engine	TRUE	将参数设置为 `google_jobs` 以使用 Google 职位 API 引擎。
q	TRUE	参数定义您要搜索的查询。
uule	FALSE	参数是您要用于搜索的 Google 编码位置。`uule` 和 `location` 参数不能同时使用。
google_domain	FALSE	参数定义要使用的 Google 域名。默认为 `google.com`。前往 Google 域名页面查看受支持的 Google 域名的完整列表。
gl	FALSE	参数定义要用于 Google 搜索的国家/地区。这是一个两位数的国家/地区代码（例如，`us` 表示美国，`uk` 表示英国，或 `fr` 表示法国）。前往 Google 国家/地区页面查看受支持的 Google 国家/地区的完整列表。
hl	FALSE	参数定义要用于 Google 职位搜索的语言。这是一个两位数的语言代码（例如，`en` 表示英语，`es` 表示西班牙语，或 `fr` 表示法语）。前往 Google 语言页面查看受支持的 Google 语言的完整列表。
next_page_token	FALSE	参数定义下一页标记。它用于检索下一页结果。每页最多返回 10 个结果。下一页标记可在 SerpApi JSON 响应中找到：`pagination -> next_page_token`。
lrad	TRUE	定义搜索半径（公里）。不会严格限制半径。
ltype	TRUE	参数将按在家办公筛选结果。
uds	TRUE	参数启用筛选搜索。它是 Google 提供的作为筛选器的字符串。`uds` 值在以下部分提供：使用提供的 `uds`、`q` 和 `link` 值的筛选器。

主要特性：

高效的职位数据抓取：实时获取 Google 职位数据，并返回结构化的职位信息，方便分析和使用。
易于集成：支持多种编程语言（Python、JavaScript 等），API 返回 JSON 格式，易于集成和分析。
绕过反爬虫技术：自动处理 CAPTCHA 和反爬虫措施，确保稳定抓取，无需担心 IP 封锁。
多维度过滤和自定义搜索：支持按职位类型、地点、薪资等进行过滤，并允许自定义查询以准确匹配需求。
分页支持：自动抓取多个页面的职位信息，避免手动分页处理。
全球覆盖：支持跨区域抓取，适应多语言环境，提供全球职位数据。
分析和报告：抓取的数据可用于招聘趋势分析，提供详细的抓取报告和统计数据。
可靠的技术支持：全天候客户服务支持，提供详细的文档和示例，帮助开发者快速上手。

注册免费试用 Scrapeless 并获得 100,000 次请求！立即体验高效的网络抓取，轻松获取例如 Google 职位等数据，帮助您的项目快速启动！不要错过这个机会，立即开始！

如何使用 Scrapeless 抓取谷歌职位结果

使用 Scrapeless 谷歌职位抓取 API 非常简单，只需按照以下步骤操作：

1. 注册 Scrapeless 帐户并获取 API 密钥。

要开始使用，您需要从 Scrapeless 仪表盘获取您的 API 密钥：

登录到 Scrapeless 仪表盘。
导航到 API 密钥管理。
点击创建以生成您的唯一 API 密钥。
创建后，只需点击 API 密钥即可复制它。

2. 构建 API 请求 URL，包括必需的参数。

访问 API 文档。
点击所需端点的“试用”。
在“身份验证”字段中输入您的 API 密钥。
在参数设置中填写必要的参数。（此处我们以 barista new york 为例）

以下是一些结果示例。您可以通过 API 文档查看特定信息。

Copy

{
    "filters": [
        {
            "name": "Salary",
            "link": "https://www.google.com/search?sca_esv=7833c6f0638101e1&gl=us&hl=en&q=Barista+new+york+salary&uds=ABqPDvztZD_Nu18FR6tNPw2cK_RRh8EK4tyFmWRymX9upubXBbjB9KOIUC88GpIatv-n-DLX9TtKJXNMMIdYO2nQxb4xNzjttr0Uu43Lm-GmXHPL687fgvBmKH8qj2H7a2iTdJo0v3e37tUrY02SF9SsGMZ3e6PQT6rfudnU2eFoPJICzOXs6zcIod6Pfwk5wDtpqw_NEY9J&udm=8&sa=X&ved=2ahUKEwiD1tP_mtGLAxUFvokEHZrtEVQQxKsJegQIDRAB&ictx=0",
            "parameters": {
                "uds": "ABqPDvztZD_Nu18FR6tNPw2cK_RRh8EK4tyFmWRymX9upubXBbjB9KOIUC88GpIatv-n-DLX9TtKJXNMMIdYO2nQxb4xNzjttr0Uu43Lm-GmXHPL687fgvBmKH8qj2H7a2iTdJo0v3e37tUrY02SF9SsGMZ3e6PQT6rfudnU2eFoPJICzOXs6zcIod6Pfwk5wDtpqw_NEY9J",
                "q": "Barista new york salary"
            }
        },
        {
            "name": "Remote",
            "link": "https://www.google.com/search?sca_esv=7833c6f0638101e1&gl=us&hl=en&q=barista%2Bnew%2Byork+remote&uds=ABqPDvztZD_Nu18FR6tNPw2cK_RR9uegVYgQNm0A_FIwPHdCgp6BeV4cyixUjw1hgRDJQE5JaCKrpdXj8qAqGf0tBZYFos3UXw0dnkvxmLPGYpQ1yE9796a05FNrMXiTref7_yMgP5WfYbP3wPdvk9Hpbv8q3y-R1UTsn-dAlNF5N6OicWqVsFU&udm=8&sa=X&ved=2ahUKEwiD1tP_mtGLAxUFvokEHZrtEVQQxKsJegQICxAB&ictx=0",
            "parameters": {
                "uds": "ABqPDvztZD_Nu18FR6tNPw2cK_RR9uegVYgQNm0A_FIwPHdCgp6BeV4cyixUjw1hgRDJQE5JaCKrpdXj8qAqGf0tBZYFos3UXw0dnkvxmLPGYpQ1yE9796a05FNrMXiTref7_yMgP5WfYbP3wPdvk9Hpbv8q3y-R1UTsn-dAlNF5N6OicWqVsFU",
                "q": "barista+new+york remote"
            }
        },
        {
            "name": "Date posted",
            "options": [
                {
                    "name": "Yesterday",
                    "link": "https://www.google.com/search?sca_esv=7833c6f0638101e1&gl=us&hl=en&q=barista+new+york since yesterday&uds=ABqPDvztZD_Nu18FR6tNPw2cK_RRnjGLk826jw_-m_gI8QkMG3DU62Ft1lBDpjQtJxI9n5nlvphZ_FhozuiZa-pL3OlfNFOvId9p73T3jFBmYJw05hbE-N1E2J12Se4S2XNj_H36-FruHX4cIe_j8ucbIbgQDsccD5Ht0tt1_fw91zMseXuY-BwyvhnOJiTzcgUbCOHZIRrKI_unZuhz8K9n1iIpXWV3AWpk95QNoL9B0qFURXiTlhykG63NrQz80D-aaM61vCTXQbTneARk4u1P870m6qmrYlxzFIesLLxnrvkOGKouA-AdW2wQ-2NEBupAK1JbQkL9sm7bwG6gYn0jjt-9oEOUaw&udm=8&sa=X&ved=2ahUKEwiD1tP_mtGLAxUFvokEHZrtEVQQkbEKegQIDhAC",
                    "parameters": {
                        "uds": "ABqPDvztZD_Nu18FR6tNPw2cK_RRnjGLk826jw_-m_gI8QkMG3DU62Ft1lBDpjQtJxI9n5nlvphZ_FhozuiZa-pL3OlfNFOvId9p73T3jFBmYJw05hbE-N1E2J12Se4S2XNj_H36-FruHX4cIe_j8ucbIbgQDsccD5Ht0tt1_fw91zMseXuY-BwyvhnOJiTzcgUbCOHZIRrKI_unZuhz8K9n1iIpXWV3AWpk95QNoL9B0qFURXiTlhykG63NrQz80D-aaM61vCTXQbTneARk4u1P870m6qmrYlxzFIesLLxnrvkOGKouA-AdW2wQ-2NEBupAK1JbQkL9sm7bwG6gYn0jjt-9oEOUaw",
                        "q": "barista new york since yesterday"
                    }
                },
                {
                    "name": "Last 3 days",
                    "link": "https://www.google.com/search?sca_esv=7833c6f0638101e1&gl=us&hl=en&q=barista+new+york in the last 3 days&uds=ABqPDvztZD_Nu18FR6tNPw2cK_RRd1B6K-OJf2BQH1wRTP-WvlEGmt8-DwYPt192b7rPO2QTcWR6ib4kDRMCnL5tVQO8zO8RIE3h2OD731flcyiUpJA7ZkSb5ZOOKftaPnoXuSflVkzggT4i1-LmAD9fzly5xZp6y4SnVxMgTtvd2-WpYQVk-HlJi9DiLqRclx-08Fctyj76ilhCrPNTcmeYWmuT3xuop_zwqsM1_UfNSL0c8bLdkX1nPpadMD-n5uhcQ4y6Rbc4e50nyyw5-sVgk4XWD1razm6vSiNlcXlYeWYJ3osuWXRrHChhUVY3tXnTCv8I1_94wzPzrFNfwp_-qsGrzzJMWg&udm=8&sa=X&ved=2ahUKEwiD1tP_mtGLAxUFvokEHZrtEVQQkbEKegQIDhAD",
                    "parameters": {
                        "uds": "ABqPDvztZD_Nu18FR6tNPw2cK_RRd1B6K-OJf2BQH1wRTP-WvlEGmt8-DwYPt192b7rPO2QTcWR6ib4kDRMCnL5tVQO8zO8RIE3h2OD731flcyiUpJA7ZkSb5ZOOKftaPnoXuSflVkzggT4i1-LmAD9fzly5xZp6y4SnVxMgTtvd2-WpYQVk-HlJi9DiLqRclx-08Fctyj76ilhCrPNTcmeYWmuT3xuop_zwqsM1_UfNSL0c8bLdkX1nPpadMD-n5uhcQ4y6Rbc4e50nyyw5-sVgk4XWD1razm6vSiNlcXlYeWYJ3osuWXRrHChhUVY3tXnTCv8I1_94wzPzrFNfwp_-qsGrzzJMWg",
                        "q": "barista new york in the last 3 days"
                    }
                },
                {
                    "name": "Last week",
                    "link": "https://www.google.com/search?sca_esv=7833c6f0638101e1&gl=us&hl=en&q=barista+new+york in the last

您还可以将我们的演示代码集成到您的程序中。

以下是一些请求示例：

Copy

import json
import requests

class Payload:
    def __init__(self, actor, input_data):
        self.actor = actor
        self.input = input_data

def send_request():
    host = "api.scrapeless.com"
    url = f"https://{host}/api/v1/scraper/request"
    token = "your_token"

    headers = {
        "x-api-token": token
    }

    input_data = {
        "engine": "google_jobs",
        "q": "barista new york",
    }

    payload = Payload("scraper.google.jobs", input_data)

    json_payload = json.dumps(payload.__dict__)

    response = requests.post(url, headers=headers, data=json_payload)

    if response.status_code != 200:
        print("Error:", response.status_code, response.text)
        return

    print("body", response.text)


if __name__ == "__main__":
    send_request()

为什么 Scrapeless 非常适合抓取谷歌职位

无需 CAPTCHA：Scrapeless 可绕过 CAPTCHA，确保抓取过程顺利进行。
**自动代理管理：**该服务轮换 IP 地址并管理代理，因此您不会被 Google 禁止。
**高成功率：**Scrapeless 旨在有效处理Google 的反机器人措施，提供高抓取成功率。
**结构化数据：**Scrapeless 以组织良好的格式返回数据，便于分析并集成到您的工作流程中。

此外，Scrapeless SERP API 还支持从谷歌地图、谷歌航班、谷歌趋势、谷歌搜索结果页面等提取数据。

抓取谷歌职位的最佳实践

虽然抓取可以有效，但重要的是要遵循最佳实践以避免问题：

**遵守 Google 的服务条款：**抓取 Google 职位可能会违反其服务条款，因此始终负责任地使用抓取并了解潜在的法律风险。
**限制请求：**不要在短时间内向 Google 发送过多的请求。使用速率限制或随机延迟等功能来避免被检测到。
**监控抓取性能：**定期监控抓取工具的性能，以确保其按预期工作且数据准确。

关于 Google 职位抓取器的常见问题

1. 什么是 Google 职位抓取器？

Google 职位抓取器是一种旨在从 Google 职位提取职位列表的工具。它可以帮助您收集有价值的数据，例如职位名称、公司名称、地点、薪资和职位描述。

2. 抓取谷歌地图是否合法？

出于合乎道德的原因抓取公开数据并不违法。

结论

抓取 Google 职位结果可以提供有关就业市场的宝贵见解，帮助优化招聘策略，并使企业保持竞争力。Scrapeless 提供了一个出色的解决方案，无需处理 CAPTCHA、IP 禁止或复杂的编码即可抓取 Google 的职位列表。通过使用 Scrapeless，您可以快速收集结构化的职位数据，并将其用于您的市场研究或招聘工作。

无论您是数据分析师、招聘人员还是希望了解招聘趋势的企业，Scrapeless 都提供了一种简单、可靠且有效的方法来访问 Google 职位数据。