Python से Expedia डेटा कैसे Scrape करें?

Expert Network Defense Engineer
Expedia यात्रियों के लिए सबसे पसंदीदा वेबसाइट है! उपयोगकर्ता इस पर आसानी से व्यापक और सटीक यात्रा जानकारी प्राप्त कर सकते हैं: हवाई किराए की कीमतों से लेकर वेकेशन रेंटल और कार रेंटल तक। जानकारी प्राप्त करने के अलावा, Expedia उपयोगकर्ताओं को अपनी वेबसाइट पर सीधे उड़ानें, आवास और किराये बुक करने की भी अनुमति देता है, जिससे यह यात्रा संबंधी डेटा के लिए एक मूल्यवान संसाधन बन जाता है।
हालांकि, Expedia एक स्क्रैपिंग एपीआई प्रदान नहीं करता है, जिससे बड़ी मात्रा में उड़ान जानकारी को सीधे स्क्रैप करना मुश्किल हो जाता है। बड़ी संख्या में पृष्ठों के कारण, इस डेटा को मैन्युअल रूप से एकत्र करना व्यावहारिक नहीं है।
आइए इस लेख में जानें कि Expedia पर सटीक उड़ान जानकारी को आसानी से कैसे स्क्रैप किया जाए।
अभी पढ़ना शुरू करें!

Expedia का डेटा इतना महत्वपूर्ण क्यों है?
Expedia के डेटा को क्रॉल करके, आप यात्रा उद्योग में कंपनियों को बेहतर निर्णय लेने में मदद करने के लिए समृद्ध बाजार की जानकारी प्राप्त कर सकते हैं। चाहे वह परिचालन रणनीतियों को अनुकूलित करना हो या ग्राहकों को अधिक किफायती विकल्प प्रदान करना हो, यह डेटा महत्वपूर्ण भूमिका निभा सकता है।
- बाजार विश्लेषण: यात्रा एजेंसियों को अधिक प्रतिस्पर्धी रणनीति विकसित करने में मदद करने के लिए बाजार के रुझानों और प्रतिस्पर्धी मूल्य निर्धारण का विश्लेषण करें।
- मूल्य तुलना: ग्राहकों के लिए सर्वोत्तम विकल्प सुनिश्चित करने के लिए वास्तविक समय में विभिन्न प्लेटफार्मों पर कीमतों की तुलना करें।
- इन्वेंटरी निगरानी: उड़ान, होटल और कार किराये की इन्वेंटरी पर नज़र रखें, और मांग को पूरा करने के लिए समय पर आपूर्ति को समायोजित करें।
- प्रवृत्ति पूर्वानुमान: ऐतिहासिक डेटा के आधार पर यात्रा के रुझानों की भविष्यवाणी करें और पहले से संसाधनों की योजना बनाएँ।
Expedia से डेटा स्क्रैप करना मुश्किल क्यों है?
अधिकांश आधुनिक वेबसाइटों की तरह, Expedia एक गतिशील वेबसाइट है जो सामग्री को प्रस्तुत करने और उपयोगकर्ता इंटरैक्शन को संभालने के लिए बहुत सारे जावास्क्रिप्ट का उपयोग करती है। इसलिए, Beautiful Soup और Cheerio जैसे पारंपरिक HTML-आधारित वेब स्क्रैपिंग टूल का उपयोग करके स्क्रैप करना मुश्किल है क्योंकि वे जावास्क्रिप्ट निष्पादित नहीं कर सकते हैं।
Python का उपयोग करके Expedia डेटा स्क्रैप करने के 2 तरीके
विधि 1. स्क्रैपलेस स्क्रैपिंग एपीआई (सर्वोत्तम विकल्प)
स्क्रैपलेस Expedia और अन्य यात्रा संबंधी वेबसाइटों से डेटा निकालने के लिए एक शक्तिशाली और कुशल ऑल-इन-वन टूलकिट है। यह अपने स्वयं के स्क्रैपर के निर्माण की तकनीकी चुनौतियों के बिना मूल्यवान जानकारी एकत्र करने का एक सहज तरीका प्रदान करता है।
स्क्रैपलेस एक किफायती, स्थिर और सुरक्षित Expedia स्क्रैपिंग एपीआई सेवा प्रदान करता है। यह आपको 3 सेकंड के भीतर उड़ान और होटल विवरण प्राप्त करने में मदद करता है। आपको केवल पैरामीटर कॉन्फ़िगर करने और अपना एपीआई टोकन इनपुट करने की आवश्यकता है।
- व्यापक डेटा निष्कर्षण: स्क्रैपलेस उड़ानों, होटल की कीमतों, कार किराये और बहुत कुछ सहित यात्रा डेटा को स्क्रैप कर सकता है, यह सुनिश्चित करता है कि आपको अपनी ज़रूरत की सभी जानकारी मिल जाए।
- अनुकूलित समाधान: आपकी विशिष्ट व्यावसायिक आवश्यकताओं को पूरा करने के लिए दर्जी-निर्मित स्क्रैपिंग समाधान उपलब्ध हैं, चाहे वह बाजार विश्लेषण, प्रतिस्पर्धी मूल्य निर्धारण या इन्वेंटरी निगरानी के लिए हो।
- गतिशील सामग्री को संभालना: जावास्क्रिप्ट-गहन वेबसाइटों के प्रबंधन के लिए उन्नत तकनीकें पूर्ण और सटीक डेटा निष्कर्षण सुनिश्चित करती हैं।
- स्केलेबल और विश्वसनीय: परियोजनाओं को विश्वसनीय और कुशलतापूर्वक वितरित करने के लिए बड़े पैमाने पर डेटा स्क्रैपिंग को संभालने में सक्षम, आपको समय पर और सुसंगत डेटा प्रदान करता है।
- डेटा स्थानांतरण: आप अपने मौजूदा सिस्टम के साथ सहज एकीकरण सुनिश्चित करते हुए, स्क्रैपलेस कोड को सीधे अपने डेटाबेस में स्थानांतरित कर सकते हैं। स्क्रैपलेस JSON प्रारूप रिटर्न और निर्यात का समर्थन करता है।
- अनुपालन और नैतिकता: स्क्रैपलेस वेबसाइट की सेवा की शर्तों और डेटा गोपनीयता नियमों का सम्मान करते हुए, कानूनी और नैतिक दिशानिर्देशों के अनुपालन को सुनिश्चित करता है।
विधि 2. अपना खुद का Expedia पाइथन स्क्रैपर बनाएँ
कमियाँ:
- अपना खुद का Google मानचित्र स्क्रैपिंग टूल बनाना समय लेने वाला है।
- आपको IP ब्लॉकिंग, CAPTCHA सत्यापन, कई प्रॉक्सी सेट करने और अनुरोध सीमाओं के प्रबंधन जैसी चुनौतियों का सामना करना पड़ सकता है।
पाइथन के साथ स्क्रैपलेस का उपयोग करके Expedia डेटा स्क्रैप करें
अगला, हम विस्तार से समझाएंगे कि Expedia उड़ान डेटा को क्रॉल करने के लिए पाइथन और स्क्रैपलेस एपीआई को कैसे जोड़ा जाए।
स्क्रैपलेस एपीआई के बिना विकास करते समय, Expedia साइट को क्रॉल करने के लिए अनुरोध गति, प्रॉक्सी, जोखिम नियंत्रण, डेटा सबमिशन और अन्य मुद्दों पर विचार करने की आवश्यकता हो सकती है, लेकिन अब स्क्रैपलेस एपीआई का उपयोग करके, आपको केवल अपनी आवश्यक डेटा के कॉन्फ़िगरेशन और संपादन की आवश्यकता है, और फिर प्रोग्राम चलाएँ, आप अपनी आवश्यक डेटा प्राप्त कर सकते हैं।
ध्यान दें: प्रासंगिक कोड और कॉन्फ़िगरेशन बाद में दिखाए जाएंगे
चरण 1. अपनी एपीआई कुंजी प्राप्त करें
आरंभ करने के लिए, आपको स्क्रैपलेस डैशबोर्ड से अपनी एपीआई कुंजी प्राप्त करने की आवश्यकता होगी:
- स्क्रैपलेस डैशबोर्ड में लॉग इन करें।
- एपीआई कुंजी प्रबंधन पर जाएँ।
- अपनी अनूठी एपीआई कुंजी उत्पन्न करने के लिए बनाएँ पर क्लिक करें।
- एक बार बनाए जाने के बाद, इसे कॉपी करने के लिए बस एपीआई कुंजी पर क्लिक करें।
स्क्रैपलेस के साथ अपना पंजीकरण पूरा करने के बाद, आपको $2 का मुफ़्त खोज शेष प्राप्त होगा।

चरण 2. स्क्रैपलेस एपीआई अनुरोध कोड लिखें
मैंने जो संदर्भ अनुरोध कोड लिखा है वह निम्नलिखित है। आवश्यकतानुसार आप विशिष्ट मानों को समायोजित कर सकते हैं:
Python
payload = {
"actor": "scraper.expedia", # कॉल की जाने वाली सेवा
"input": {
"origin": "Tokyo (and vicinity), Tokyo Prefecture, Japan", # प्रस्थान पता
"destination": "New York, NY, United States of America (NYC-All Airports)", # गंतव्य
"date": {"year": 2025, "month": 3, "day": 5}, # प्रस्थान तिथि
"cabin_class": "PREMIUM_ECONOMY", # केबिन वर्ग
"travelers": {
"adult": 1, # वयस्कों की संख्या
"children": [], # 2-17 वर्ष के बच्चों की आयु
"infants_on_lap": [], # 0-1 वर्ष के शिशुओं की आयु
"infants_in_seat": [], # 0-1 वर्ष के शिशुओं की आयु
},
"size": 20, # प्रति क्वेरी लौटाए गए डेटा की संख्या, अधिकतम 20
"page": 0, # क्वेरी किए गए पृष्ठों की संख्या
},
}
चरण 3. स्क्रैपलेस एपीआई में एकीकृत करें
अभी-अभी बनाई गई एपीआई कुंजी याद रखें? अनुरोध लिखे जाने के बाद हमें आधिकारिक तौर पर स्क्रैपलेस एपीआई सेवा तक पहुँचने की आवश्यकता है। कृपया नीचे दिए गए कोड में अपना एपीआई टोकन भरें:
Python
url = "https://api.scrapeless.com/api/v1/scraper/request"
headers = {"x-api-token": api-key} # अपना API-key इनपुट करें
res = requests.post(url, json=payload, headers=headers)
संपूर्ण कोडिंग:
Python
import time
import requests
api_key = "..."
headers = {"x-api-token": api_key}
payload = {
"actor": "scraper.expedia",
"input": {
"page": 0,
"origin": "Tokyo (and vicinity), Tokyo Prefecture, Japan",
"destination": "New York, NY, United States of America (NYC-All Airports)",
"date": {"year": 2025, "month": 4, "day": 22},
"cabin_class": "PREMIUM_ECONOMY",
"travelers": {
"adult": 1,
"children": [],
"infants_on_lap": [],
"infants_in_seat": [],
},
"size": 20,
"page": 0,
},
}
url = "https://api.scrapeless.com/api/v1/scraper/request"
res = requests.post(url, json=payload, headers=headers)
print(data.text)
data = res.json()
# यदि समय सीमा समाप्त हो जाती है, तो हम कार्य ID वापस कर देते हैं
if "taskId" in data:
for i in range(10):
time.sleep(1)
url = "https://api.scrapeless.com/api/v1/getTaskResult/" + data["taskId"]
resp = requests.get(url, headers=headers)
if resp.status_code != 200:
print("failed:", resp.text)
break
if "data" in resp.json():
print("succeed:", resp.text)
break
print(resp.text)
स्क्रैपिंग परिणाम संदर्भ

आगे पढ़ना:
APIDocs के माध्यम से Expedia डेटा स्क्रैप करें
आप स्क्रैपलेस एपीआई प्रलेखन में सीधे Expedia उड़ान डेटा को भी स्क्रैप कर सकते हैं। कृपया निम्नलिखित चरणों को देखें।
- चरण 1. अपना एपीआई टोकन बनाएँ (पहले बताया गया है)।
- चरण 2. Expedia पृष्ठ पर जाएँ और "इसे आज़माएँ" पर क्लिक करें।
- चरण 3.
Params
अनुभाग में अपनी आवश्यक पैरामीटर कॉन्फ़िगर करें। आपBody
में समग्र कोड सामग्री देख सकते हैं।

संदर्भ के लिए अनुरोध कोड यहां दिया गया है:
Python
{
"actor": "scraper.expedia",
"input": {
"origin": "Tokyo (and vicinity), Tokyo Prefecture, Japan",
"destination": "New York, NY, United States of America (NYC-All Airports)",
"date": {
"year": 2025,
"month": 3,
"day": 5
},
"cabin_class": "PREMIUM_ECONOMY",
"travelers": {
"adult": 1,
"children": [],
"infants_on_lap": [],
"infants_in_seat": []
},
"size": 20,
"page": 0
}
}
- चरण 4. सबसे महत्वपूर्ण बात यह है कि "प्रमाणीकरण" पर क्लिक करें और अपना एपीआई टोकन पेस्ट करें। अंत में, डेटा को स्क्रैप करने के लिए "भेजें" पर क्लिक करें!

- स्क्रैपिंग परिणाम संदर्भ:
JSON
{
"data": {
"flightsSearch": {
"flightsSheets": null,
"clientMetadata": {
"pageName": "TYO to NYC flights",
"pageNameAnalytics": {
"__typename": "FlightsAnalytics",
"linkName": "Flight Search Page One Way",
"referrerId": "page.Flight-Search-Oneway"
},
"responseTags": [
"RESPONSE_SUMMARY_HYBRID",
"UNRECOGNIZED",
"UNRECOGNIZED",
"UNRECOGNIZED",
"RESPONSE_SUMMARY_REFINEMENTS_CACHE_LIVE"
],
"responseMetrics": [
{
"name": "LISTINGS_SUPPLY_RESPONSE_TIME",
"value": "1450"
}
],
"evaluatedExperiments": [
{
"bucket": 0,
"id": "FARES_ON_FSR_VARIANT"
},
{
"bucket": 1,
"id": "RECOMMENDED_SORT_V2_ENABLED"
},
{
"bucket": 0,
"id": "CACHE_HYDRATOR_FEATURE"
},
{
"bucket": 0,
"id": "TEST_SEARCH_STACK"
},
{
"bucket": 0,
"id": "NONSTOP_ENABLED"
},
{
"bucket": 1,
"id": "VERTICAL_SLICING_ENABLED"
},
{
"bucket": 0,
"id": "SHARED_UI_LISTINGS_ENABLED"
}
]
},
स्क्रैपलेस डीप सर्पएपी तैयार है!

डीप सर्पएपी बड़े भाषा मॉडल (LLM) और AI एजेंटों के लिए डिज़ाइन किया गया एक समर्पित सर्च इंजन है। यह वास्तविक समय, सटीक और निष्पक्ष जानकारी प्रदान करता है, जिससे AI अनुप्रयोग प्रभावी ढंग से डेटा प्राप्त और संसाधित कर सकते हैं:
✅ इसमें 20+ Google खोज API परिदृश्य इंटरफ़ेस अंतर्निहित हैं और यह मुख्यधारा के खोज इंजनों के डेटा से जुड़ा हुआ है।
✅ इसमें 20+ डेटा प्रकार शामिल हैं, जैसे खोज परिणाम, समाचार, वीडियो और चित्र।
✅ यह पिछले 24 घंटों के भीतर ऐतिहासिक डेटा अपडेट का समर्थन करता है।
डीप सर्पएपी पूरी तरह से AI डेवलपर्स की जरूरतों पर विचार करेगा! हम गतिशील वेब जानकारी को AI-संचालित समाधानों में एकीकृत करने की प्रक्रिया को सरल बनाएंगे और अंततः एक ALL-in-One API का एहसास करेंगे जो वेब डेटा की एक-क्लिक खोज और निष्कर्षण की अनुमति देता है। इसके अलावा, हम इस क्षेत्र में लंबे समय तक सबसे कम कीमत बनाए रखेंगे: $0.1-$0.3/1K क्वेरी।
हमारे डेवलपर प्रायोजन कार्यक्रम को न चूकें!
हमारे समुदाय में शामिल हों और अभी 500k मुफ़्त क्रेडिट प्राप्त करें।
समापन विचार
मैन्युअल रूप से पाइथन क्रॉलर का निर्माण Expedia डेटा क्रॉल कर सकता है, लेकिन विभिन्न वेबसाइट अवरोधक बाधाओं का सामना करना आसान है। यदि आप अधिक सुरक्षित, सीधे, तेज़ी से और सटीक रूप से Expedia उड़ान डेटा क्रॉल करना चाहते हैं, तो आप स्क्रैपलेस स्क्रैपिंग एपीआई आज़मा सकते हैं। परिणाम क्रॉलिंग को सहजतापूर्वक पूरा करने के लिए केवल सरल पैरामीटर कॉन्फ़िगरेशन और डेटा भरने की आवश्यकता है।
स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।