🥳加入无抓取社区领取您的免费试用,访问我们强大的网页抓取工具包!
返回博客

如何使用Python抓取谷歌酒店信息?

Sophia Martinez
Sophia Martinez

Specialist in Anti-Bot Strategies

06-Mar-2025

从谷歌酒店等平台提取信息带来了巨大的机遇:您可以轻松访问最新的聚合酒店数据(包括价格、可用性、评论和位置),从而为您的市场研究提供动力或比较价格以做出更好的决策。

酒店价格由于季节性、需求变化和促销活动而频繁波动,因此几乎不可能通过手动收集信息来保持最新。相反,您可以通过抓取旅游网站和平台来自动化(和扩展)此过程。

本教程将向您展示如何使用Python的Scraping API来实现这一点。它将逐步引导您完成如何从谷歌酒店抓取数据。

为什么我们要抓取谷歌酒店?

Google Hotels

如果您搜索与酒店相关的关键字,谷歌会生成其自身的以酒店为中心的版块,其中包含数千家酒店的名称、图片、地址、评分和价格。这是因为谷歌可以访问数百万个旅游和酒店网站,并将所有这些信息聚合到一个地方。

您可以从谷歌酒店抓取哪些数据?

🏨 酒店名称和描述

💰 价格信息(例如,每晚价格、折扣、税费)

🗺️ 位置数据(例如,地址、与地标的距离)

🛜 设施和特色(例如,免费Wi-Fi、游泳池、早餐)

🌟 评论和评分(例如,平均分数、评论数量)

🔔 可用性和预订选项

抓取谷歌酒店的挑战

谷歌酒店严重依赖JavaScript动态呈现其内容。这意味着您在页面上看到的数据(例如,酒店名称、价格、评论)在原始HTML源代码中是不可用的。谷歌酒店以高度结构化但嵌套的格式显示大量信息。

同时,谷歌还采用了复杂的反抓取机制来防止自动访问其平台。

  • 验证码
  • IP封锁
  • 速率限制
  • 行为分析

此外,谷歌经常更新其平台以改善用户体验并添加新功能。这些更新通常涉及HTML结构、CSS类或JavaScript行为的更改。

为什么使用API来抓取谷歌酒店?

  • 无需从头创建并维护解析器。
  • 绕过谷歌的封锁:可以自动解决验证码或IP封锁问题。
  • 无需额外付费购买代理和验证码求解器。
  • 无需使用浏览器自动化。

Scrapeless 谷歌酒店API可以轻松处理上述所有问题,每次请求的响应时间约为2.33秒1.47秒非常快)。用户只需一个API调用即可获得准确的抓取数据,我们使用结构良好的JSON显示这些数据。

如何抓取谷歌酒店?

我们的谷歌酒店API允许您从谷歌酒店抓取酒店和度假租赁的结果。您可以访问Scrapeless Playground了解更多详情。

Scrapeless Playground

为什么企业选择Scrapeless?

🔴 节省成本: 谷歌购物API仅需**$0.80**。订阅后,您可以获得10%的折扣!

🔴 准确的数据: 我们的开发人员不断分析谷歌的抓取算法和限制,以确保API得到更新和优化。

🔴 稳定且成功率高: Scrapeless 保证99%的成功率和可靠性谷歌趋势抓取的稳定性和准确性已达到近100%!目前,平均响应时间约为1-2秒,比大多数API提供商快得多。此外,数据以标准化的JSON格式返回,可以直接使用。

Scrapeless已获得超过2000家企业用户的信任!
立即加入Discord 领取您的免费试用版! 限时提供1000个名额——快来行动吧!

谷歌酒店API指南

步骤1. 获取您的API密钥

要开始使用,您需要从Scrapeless Dashboard获取您的API密钥:

  • 登录到Scrapeless Dashboard
  • 导航到API密钥管理
  • 点击创建以生成您的唯一API密钥。
  • 创建后,只需点击API密钥即可复制它。
Obtain Your API Key

步骤2:在代码中使用您的API密钥

您现在可以使用您的API密钥将Scrapeless集成到您的项目中。请按照以下步骤测试和实现API。

  1. 访问API文档
  2. 点击所需端点的“试用”。
  3. 在代码主体中配置您需要的参数。

这是我的请求正文:

Python Copy
{
  "actor": "scraper.google.hotels",
  "input": {
    "engine": "google_hotels",
    "q": "Bali Resorts",
    "check_in_date": "2025-03-18",
    "check_out_date": "2025-03-28"
  }
}
Google hotel
  • 将关键字q替换为您要查询的关键字。
  • engine参数是必需的,其值必须为google_hotels。但是,您可以添加更具体的参数,例如google_scholar_author
  • 常用参数:
参数 是否必需 说明
engine TRUE 设置为google_hotels以使用此API。
q TRUE 搜索查询(例如,巴厘岛度假村)。
hl FALSE 语言设置(默认值:en)。
currency FALSE 返回价格的货币。
check_in_date TRUE 参数定义入住日期。格式为YYYY-MM-DD。例如2025-03-05
check_out_date TRUE 参数定义退房日期。格式为YYYY-MM-DD。例如2025-03-06
  1. 在“Auth”字段中输入您的API密钥。
  2. 点击“发送”以获取抓取响应。
input your API key

您还可以直接将我们的参考代码集成到您的程序中。只需将your_token替换为您申请的令牌:

Python Copy
import json
import requests


class Payload:
    def __init__(self, actor, input_data):
        self.actor = actor
        self.input = input_data


def send_request():
    host = "api.scrapeless.com"
    url = f"https://{host}/api/v1/scraper/request"
    token = your_token ## replace with your API Token

    headers = {
        "x-api-token": token
    }

    input_data = {
        "engine": "google_hotels",
        "q": "Bali Resorts",
        "check_in_date": "2025-03-18",
        "check_out_date": "2025-03-28"
    }

    payload = Payload("scraper.google.hotels", input_data)

    json_payload = json.dumps(payload.__dict__)

    response = requests.post(url, headers=headers, data=json_payload)

    if response.status_code != 200:
        print("Error:", response.status_code, response.text)
        return

    print("body", response.text)


if __name__ == "__main__":
    send_request()

您可以在这里看到参考JSON抓取结果:

JSON Copy
{
    "brands": [
        {
            "id": 37,
            "name": "Hyatt"
        },
        {
            "id": 180,
            "name": "Sol by Melia"
        },
        {
            "id": 402,
            "name": "Spot On"
        },
        {
            "id": 91,
            "name": "Mercure"
        },
        {
            "id": 174,
            "name": "Melia Hotels International"
        },
        {
            "id": 87,
            "name": "Hotel Indigo"
        },
        {
            "id": 135,
            "name": "Four Points by Sheraton"
        },
        {
            "id": 390,
            "name": "Capital O"
        },
        {
            "id": 154,
            "name": "Tribute Portfolio"
        },
        {
            "id": 325,
            "name": "Kempinski"
        },
        {
            "id": 90,
            "name": "Pullman Hotels and Resorts"
        },
        {
            "id": 137,
            "name": "W Hotels"
        },
        {
            "id": 53,
            "name": "Wyndham Hotels u0026 Resorts"
        },
        {
            "id": 67,
            "name": "Banyan Tree"
        },
        {
            "id": 134,
            "name": "Element"
        },
        {
            "id": 21,
            "name": "Ibis"
        },
        {
            "id": 2,
            "name": "InterContinental Hotels u0026 Resorts"
        },
        {
            "id": 117,
            "name": "Grand Hyatt"
        },

使用 Playground

您也可以登录 Scrapeless Playground 对 Google Hotels 数据进行可视化爬取。请参考以下步骤:

  • 步骤 1. 登录 Scrapeless Playground
  • 步骤 2. 找到 Google Hotels 参与者并点击。
  • 步骤 3. 配置所需参数
  • 步骤 4. 点击开始搜索并获取结果。
Scrapeless Playground

更多资源

Scrapeless Deep SerpApi已准备就绪!

Deep SerpApi

Deep SerpAPi是一款专为大型语言模型(LLM)和AI代理设计的专用搜索引擎。它提供实时、准确和无偏见的信息,使AI应用程序能够有效地检索和处理数据:

✅ 它内置了20多个谷歌搜索API场景接口,并连接到主流搜索引擎的数据。

✅ 它涵盖了20多种数据类型,例如搜索结果、新闻、视频和图像。

✅ 它支持过去24小时内的历史数据更新。

Deep SerpApi将充分考虑AI开发人员的需求!我们将简化将动态网页信息集成到AI驱动解决方案的过程,最终实现一个一键式搜索和提取网络数据的ALL-in-One API。此外,我们将长期保持该领域最低的价格:$0.1-$0.3/1K查询。

不要错过我们的开发者赞助计划!
立即加入我们的社区并获得50刀/月的免费积分

抓取的谷歌酒店数据的用例

对于旅游科技开发人员、营销人员和分析师来说,谷歌酒店是一个宝藏般的数据来源。这就是为什么抓取此平台值得您花费时间的原因:

  1. 竞争性价格分析: 跟踪酒店的实时价格波动,以领先于竞争对手。
  2. 市场研究: 确定热门目的地、热门设施和客户偏好。
  3. 个性化推荐: 构建根据用户偏好提供量身定制酒店建议的应用程序。
  4. 搜索引擎优化和内容创建: 使用抓取的数据创建数据驱动的旅游博客或指南。
  5. 动态定价策略: 企业可以根据需求、可用性和竞争对手的价格发现定价趋势、调整价格并实现具有竞争力的定价机会。这优化了收入和入住率。
  6. 自定义提醒: 监控价格下降以提醒客户或供个人使用。
  7. 旅游聚合服务: 为用户提供来自各种来源的酒店价格和选择的全面视图。
  8. 预算和规划: 旅行者可以估算住宿费用并相应地调整计划。

结束语

恭喜您,您已经学习了构建谷歌酒店抓取程序最简单的方法!只需简单的API调用即可完成复杂的数据收集和提取。抓取谷歌酒店数据对于定价策略、定价趋势、市场研究、情绪分析、预测分析等具有重要价值。

Scrapeless 正在逐渐涵盖更深入的谷歌酒店信息和更全面的谷歌抓取场景。我们致力于为客户提供简单快速的API,以便他们能够将资源集中在业务核心上。

您始终可以获得2美元的免费试用!

在Scrapeless,我们仅访问公开可用的数据,并严格遵循适用的法律、法规和网站隐私政策。本博客中的内容仅供演示之用,不涉及任何非法或侵权活动。我们对使用本博客或第三方链接中的信息不做任何保证,并免除所有责任。在进行任何抓取活动之前,请咨询您的法律顾问,并审查目标网站的服务条款或获取必要的许可。

最受欢迎的文章

目录