🥳हमारे शक्तिशाली वेब स्क्रैपिंग टूलकिट तक पहुंचने के लिए स्क्रैपलेस कम्युनिटी और अपने नि: शुल्क परीक्षण का दावा करें!
वापस ब्लॉग पर

Python से Expedia डेटा कैसे Scrape करें?

Michael Lee
Michael Lee

Expert Network Defense Engineer

02-Mar-2025

Expedia यात्रियों के लिए सबसे पसंदीदा वेबसाइट है! उपयोगकर्ता इस पर आसानी से व्यापक और सटीक यात्रा जानकारी प्राप्त कर सकते हैं: हवाई किराए की कीमतों से लेकर वेकेशन रेंटल और कार रेंटल तक। जानकारी प्राप्त करने के अलावा, Expedia उपयोगकर्ताओं को अपनी वेबसाइट पर सीधे उड़ानें, आवास और किराये बुक करने की भी अनुमति देता है, जिससे यह यात्रा संबंधी डेटा के लिए एक मूल्यवान संसाधन बन जाता है।

हालांकि, Expedia एक स्क्रैपिंग एपीआई प्रदान नहीं करता है, जिससे बड़ी मात्रा में उड़ान जानकारी को सीधे स्क्रैप करना मुश्किल हो जाता है। बड़ी संख्या में पृष्ठों के कारण, इस डेटा को मैन्युअल रूप से एकत्र करना व्यावहारिक नहीं है।

आइए इस लेख में जानें कि Expedia पर सटीक उड़ान जानकारी को आसानी से कैसे स्क्रैप किया जाए।

अभी पढ़ना शुरू करें!

Expedia

Expedia का डेटा इतना महत्वपूर्ण क्यों है?

Expedia के डेटा को क्रॉल करके, आप यात्रा उद्योग में कंपनियों को बेहतर निर्णय लेने में मदद करने के लिए समृद्ध बाजार की जानकारी प्राप्त कर सकते हैं। चाहे वह परिचालन रणनीतियों को अनुकूलित करना हो या ग्राहकों को अधिक किफायती विकल्प प्रदान करना हो, यह डेटा महत्वपूर्ण भूमिका निभा सकता है।

  • बाजार विश्लेषण: यात्रा एजेंसियों को अधिक प्रतिस्पर्धी रणनीति विकसित करने में मदद करने के लिए बाजार के रुझानों और प्रतिस्पर्धी मूल्य निर्धारण का विश्लेषण करें।
  • मूल्य तुलना: ग्राहकों के लिए सर्वोत्तम विकल्प सुनिश्चित करने के लिए वास्तविक समय में विभिन्न प्लेटफार्मों पर कीमतों की तुलना करें।
  • इन्वेंटरी निगरानी: उड़ान, होटल और कार किराये की इन्वेंटरी पर नज़र रखें, और मांग को पूरा करने के लिए समय पर आपूर्ति को समायोजित करें।
  • प्रवृत्ति पूर्वानुमान: ऐतिहासिक डेटा के आधार पर यात्रा के रुझानों की भविष्यवाणी करें और पहले से संसाधनों की योजना बनाएँ।

Expedia से डेटा स्क्रैप करना मुश्किल क्यों है?

अधिकांश आधुनिक वेबसाइटों की तरह, Expedia एक गतिशील वेबसाइट है जो सामग्री को प्रस्तुत करने और उपयोगकर्ता इंटरैक्शन को संभालने के लिए बहुत सारे जावास्क्रिप्ट का उपयोग करती है। इसलिए, Beautiful Soup और Cheerio जैसे पारंपरिक HTML-आधारित वेब स्क्रैपिंग टूल का उपयोग करके स्क्रैप करना मुश्किल है क्योंकि वे जावास्क्रिप्ट निष्पादित नहीं कर सकते हैं।

Python का उपयोग करके Expedia डेटा स्क्रैप करने के 2 तरीके

विधि 1. स्क्रैपलेस स्क्रैपिंग एपीआई (सर्वोत्तम विकल्प)

स्क्रैपलेस Expedia और अन्य यात्रा संबंधी वेबसाइटों से डेटा निकालने के लिए एक शक्तिशाली और कुशल ऑल-इन-वन टूलकिट है। यह अपने स्वयं के स्क्रैपर के निर्माण की तकनीकी चुनौतियों के बिना मूल्यवान जानकारी एकत्र करने का एक सहज तरीका प्रदान करता है।

स्क्रैपलेस एक किफायती, स्थिर और सुरक्षित Expedia स्क्रैपिंग एपीआई सेवा प्रदान करता है। यह आपको 3 सेकंड के भीतर उड़ान और होटल विवरण प्राप्त करने में मदद करता है। आपको केवल पैरामीटर कॉन्फ़िगर करने और अपना एपीआई टोकन इनपुट करने की आवश्यकता है।

  • व्यापक डेटा निष्कर्षण: स्क्रैपलेस उड़ानों, होटल की कीमतों, कार किराये और बहुत कुछ सहित यात्रा डेटा को स्क्रैप कर सकता है, यह सुनिश्चित करता है कि आपको अपनी ज़रूरत की सभी जानकारी मिल जाए।
  • अनुकूलित समाधान: आपकी विशिष्ट व्यावसायिक आवश्यकताओं को पूरा करने के लिए दर्जी-निर्मित स्क्रैपिंग समाधान उपलब्ध हैं, चाहे वह बाजार विश्लेषण, प्रतिस्पर्धी मूल्य निर्धारण या इन्वेंटरी निगरानी के लिए हो।
  • गतिशील सामग्री को संभालना: जावास्क्रिप्ट-गहन वेबसाइटों के प्रबंधन के लिए उन्नत तकनीकें पूर्ण और सटीक डेटा निष्कर्षण सुनिश्चित करती हैं।
  • स्केलेबल और विश्वसनीय: परियोजनाओं को विश्वसनीय और कुशलतापूर्वक वितरित करने के लिए बड़े पैमाने पर डेटा स्क्रैपिंग को संभालने में सक्षम, आपको समय पर और सुसंगत डेटा प्रदान करता है।
  • डेटा स्थानांतरण: आप अपने मौजूदा सिस्टम के साथ सहज एकीकरण सुनिश्चित करते हुए, स्क्रैपलेस कोड को सीधे अपने डेटाबेस में स्थानांतरित कर सकते हैं। स्क्रैपलेस JSON प्रारूप रिटर्न और निर्यात का समर्थन करता है।
  • अनुपालन और नैतिकता: स्क्रैपलेस वेबसाइट की सेवा की शर्तों और डेटा गोपनीयता नियमों का सम्मान करते हुए, कानूनी और नैतिक दिशानिर्देशों के अनुपालन को सुनिश्चित करता है।

विधि 2. अपना खुद का Expedia पाइथन स्क्रैपर बनाएँ

कमियाँ:

  • अपना खुद का Google मानचित्र स्क्रैपिंग टूल बनाना समय लेने वाला है।
  • आपको IP ब्लॉकिंग, CAPTCHA सत्यापन, कई प्रॉक्सी सेट करने और अनुरोध सीमाओं के प्रबंधन जैसी चुनौतियों का सामना करना पड़ सकता है।

पाइथन के साथ स्क्रैपलेस का उपयोग करके Expedia डेटा स्क्रैप करें

अगला, हम विस्तार से समझाएंगे कि Expedia उड़ान डेटा को क्रॉल करने के लिए पाइथन और स्क्रैपलेस एपीआई को कैसे जोड़ा जाए।

स्क्रैपलेस एपीआई के बिना विकास करते समय, Expedia साइट को क्रॉल करने के लिए अनुरोध गति, प्रॉक्सी, जोखिम नियंत्रण, डेटा सबमिशन और अन्य मुद्दों पर विचार करने की आवश्यकता हो सकती है, लेकिन अब स्क्रैपलेस एपीआई का उपयोग करके, आपको केवल अपनी आवश्यक डेटा के कॉन्फ़िगरेशन और संपादन की आवश्यकता है, और फिर प्रोग्राम चलाएँ, आप अपनी आवश्यक डेटा प्राप्त कर सकते हैं।

ध्यान दें: प्रासंगिक कोड और कॉन्फ़िगरेशन बाद में दिखाए जाएंगे

चरण 1. अपनी एपीआई कुंजी प्राप्त करें

आरंभ करने के लिए, आपको स्क्रैपलेस डैशबोर्ड से अपनी एपीआई कुंजी प्राप्त करने की आवश्यकता होगी:

  • स्क्रैपलेस डैशबोर्ड में लॉग इन करें।
  • एपीआई कुंजी प्रबंधन पर जाएँ।
  • अपनी अनूठी एपीआई कुंजी उत्पन्न करने के लिए बनाएँ पर क्लिक करें।
  • एक बार बनाए जाने के बाद, इसे कॉपी करने के लिए बस एपीआई कुंजी पर क्लिक करें।

स्क्रैपलेस के साथ अपना पंजीकरण पूरा करने के बाद, आपको $2 का मुफ़्त खोज शेष प्राप्त होगा।

एपीआई कुंजी प्रबंधन

चरण 2. स्क्रैपलेस एपीआई अनुरोध कोड लिखें

मैंने जो संदर्भ अनुरोध कोड लिखा है वह निम्नलिखित है। आवश्यकतानुसार आप विशिष्ट मानों को समायोजित कर सकते हैं:

Python Copy
payload = {
        "actor": "scraper.expedia", # कॉल की जाने वाली सेवा
        "input": {
            "origin": "Tokyo (and vicinity), Tokyo Prefecture, Japan", # प्रस्थान पता
            "destination": "New York, NY, United States of America (NYC-All Airports)", # गंतव्य
            "date": {"year": 2025, "month": 3, "day": 5}, # प्रस्थान तिथि
            "cabin_class": "PREMIUM_ECONOMY", # केबिन वर्ग
            "travelers": {
                "adult": 1, # वयस्कों की संख्या
                "children": [], # 2-17 वर्ष के बच्चों की आयु
                "infants_on_lap": [], # 0-1 वर्ष के शिशुओं की आयु
                "infants_in_seat": [], # 0-1 वर्ष के शिशुओं की आयु
            },
            "size": 20, # प्रति क्वेरी लौटाए गए डेटा की संख्या, अधिकतम 20
            "page": 0, # क्वेरी किए गए पृष्ठों की संख्या
        },
    }

चरण 3. स्क्रैपलेस एपीआई में एकीकृत करें

अभी-अभी बनाई गई एपीआई कुंजी याद रखें? अनुरोध लिखे जाने के बाद हमें आधिकारिक तौर पर स्क्रैपलेस एपीआई सेवा तक पहुँचने की आवश्यकता है। कृपया नीचे दिए गए कोड में अपना एपीआई टोकन भरें:

Python Copy
url = "https://api.scrapeless.com/api/v1/scraper/request"
headers = {"x-api-token": api-key} # अपना API-key इनपुट करें
res = requests.post(url, json=payload, headers=headers)

संपूर्ण कोडिंग:

Python Copy
import time
import requests

api_key = "..."

headers = {"x-api-token": api_key}

payload = {
    "actor": "scraper.expedia",
    "input": {
        "page": 0,
        "origin": "Tokyo (and vicinity), Tokyo Prefecture, Japan",
        "destination": "New York, NY, United States of America (NYC-All Airports)",
        "date": {"year": 2025, "month": 4, "day": 22},
        "cabin_class": "PREMIUM_ECONOMY",
        "travelers": {
            "adult": 1,
            "children": [],
            "infants_on_lap": [],
            "infants_in_seat": [],
        },
        "size": 20,
        "page": 0,
    },
}

url = "https://api.scrapeless.com/api/v1/scraper/request"
res = requests.post(url, json=payload, headers=headers)
print(data.text)
data = res.json()

# यदि समय सीमा समाप्त हो जाती है, तो हम कार्य ID वापस कर देते हैं
if "taskId" in data:
    for i in range(10):
        time.sleep(1)
        url = "https://api.scrapeless.com/api/v1/getTaskResult/" + data["taskId"]
        resp = requests.get(url, headers=headers)
        if resp.status_code != 200:
            print("failed:", resp.text)
            break
        if "data" in resp.json():
            print("succeed:", resp.text)
            break
        print(resp.text)

स्क्रैपिंग परिणाम संदर्भ

स्क्रैपिंग परिणाम

आगे पढ़ना:

APIDocs के माध्यम से Expedia डेटा स्क्रैप करें

आप स्क्रैपलेस एपीआई प्रलेखन में सीधे Expedia उड़ान डेटा को भी स्क्रैप कर सकते हैं। कृपया निम्नलिखित चरणों को देखें।

  • चरण 1. अपना एपीआई टोकन बनाएँ (पहले बताया गया है)।
  • चरण 2. Expedia पृष्ठ पर जाएँ और "इसे आज़माएँ" पर क्लिक करें।
  • चरण 3. Params अनुभाग में अपनी आवश्यक पैरामीटर कॉन्फ़िगर करें। आप Body में समग्र कोड सामग्री देख सकते हैं।
APIDocs के माध्यम से Expedia डेटा स्क्रैप करें

संदर्भ के लिए अनुरोध कोड यहां दिया गया है:

Python Copy
{
    "actor": "scraper.expedia",
    "input": {
        "origin": "Tokyo (and vicinity), Tokyo Prefecture, Japan",
        "destination": "New York, NY, United States of America (NYC-All Airports)",
        "date": {
            "year": 2025,
            "month": 3,
            "day": 5
        },
        "cabin_class": "PREMIUM_ECONOMY",
        "travelers": {
            "adult": 1,
            "children": [],
            "infants_on_lap": [],
            "infants_in_seat": []
        },
        "size": 20,
        "page": 0
    }
}
  • चरण 4. सबसे महत्वपूर्ण बात यह है कि "प्रमाणीकरण" पर क्लिक करें और अपना एपीआई टोकन पेस्ट करें। अंत में, डेटा को स्क्रैप करने के लिए "भेजें" पर क्लिक करें!
डेटा स्क्रैप करें
  • स्क्रैपिंग परिणाम संदर्भ:
JSON Copy
{
    "data": {
        "flightsSearch": {
            "flightsSheets": null,
            "clientMetadata": {
                "pageName": "TYO to NYC flights",
                "pageNameAnalytics": {
                    "__typename": "FlightsAnalytics",
                    "linkName": "Flight Search Page One Way",
                    "referrerId": "page.Flight-Search-Oneway"
                },
                "responseTags": [
                    "RESPONSE_SUMMARY_HYBRID",
                    "UNRECOGNIZED",
                    "UNRECOGNIZED",
                    "UNRECOGNIZED",
                    "RESPONSE_SUMMARY_REFINEMENTS_CACHE_LIVE"
                ],
                "responseMetrics": [
                    {
                        "name": "LISTINGS_SUPPLY_RESPONSE_TIME",
                        "value": "1450"
                    }
                ],
                "evaluatedExperiments": [
                    {
                        "bucket": 0,
                        "id": "FARES_ON_FSR_VARIANT"
                    },
                    {
                        "bucket": 1,
                        "id": "RECOMMENDED_SORT_V2_ENABLED"
                    },
                    {
                        "bucket": 0,
                        "id": "CACHE_HYDRATOR_FEATURE"
                    },
                    {
                        "bucket": 0,
                        "id": "TEST_SEARCH_STACK"
                    },
                    {
                        "bucket": 0,
                        "id": "NONSTOP_ENABLED"
                    },
                    {
                        "bucket": 1,
                        "id": "VERTICAL_SLICING_ENABLED"
                    },
                    {
                        "bucket": 0,
                        "id": "SHARED_UI_LISTINGS_ENABLED"
                    }
                ]
            },

स्क्रैपलेस डीप सर्पएपी तैयार है!

डीप सर्पएपी

डीप सर्पएपी बड़े भाषा मॉडल (LLM) और AI एजेंटों के लिए डिज़ाइन किया गया एक समर्पित सर्च इंजन है। यह वास्तविक समय, सटीक और निष्पक्ष जानकारी प्रदान करता है, जिससे AI अनुप्रयोग प्रभावी ढंग से डेटा प्राप्त और संसाधित कर सकते हैं:

✅ इसमें 20+ Google खोज API परिदृश्य इंटरफ़ेस अंतर्निहित हैं और यह मुख्यधारा के खोज इंजनों के डेटा से जुड़ा हुआ है।

✅ इसमें 20+ डेटा प्रकार शामिल हैं, जैसे खोज परिणाम, समाचार, वीडियो और चित्र।

✅ यह पिछले 24 घंटों के भीतर ऐतिहासिक डेटा अपडेट का समर्थन करता है।

डीप सर्पएपी पूरी तरह से AI डेवलपर्स की जरूरतों पर विचार करेगा! हम गतिशील वेब जानकारी को AI-संचालित समाधानों में एकीकृत करने की प्रक्रिया को सरल बनाएंगे और अंततः एक ALL-in-One API का एहसास करेंगे जो वेब डेटा की एक-क्लिक खोज और निष्कर्षण की अनुमति देता है। इसके अलावा, हम इस क्षेत्र में लंबे समय तक सबसे कम कीमत बनाए रखेंगे: $0.1-$0.3/1K क्वेरी।

हमारे डेवलपर प्रायोजन कार्यक्रम को न चूकें!
हमारे समुदाय में शामिल हों और अभी 500k मुफ़्त क्रेडिट प्राप्त करें।

समापन विचार

मैन्युअल रूप से पाइथन क्रॉलर का निर्माण Expedia डेटा क्रॉल कर सकता है, लेकिन विभिन्न वेबसाइट अवरोधक बाधाओं का सामना करना आसान है। यदि आप अधिक सुरक्षित, सीधे, तेज़ी से और सटीक रूप से Expedia उड़ान डेटा क्रॉल करना चाहते हैं, तो आप स्क्रैपलेस स्क्रैपिंग एपीआई आज़मा सकते हैं। परिणाम क्रॉलिंग को सहजतापूर्वक पूरा करने के लिए केवल सरल पैरामीटर कॉन्फ़िगरेशन और डेटा भरने की आवश्यकता है।

अभी निःशुल्क परीक्षण प्राप्त करें!

स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।

सबसे लोकप्रिय लेख

सूची