ChatGPT बनाम जेमिनी बनाम पेरप्लेक्सिटी: प्रतिक्रिया संरचना की तुलना
Lead Scraping Automation Engineer
TL;DR:
- तीन अभिनेता, एक परिवहन, तीन उत्तर आकार।
scraper.chatgpt,scraper.gemini, औरscraper.perplexityसभी एक ही अंत बिंदु पर POST करते हैं और वही{ status, task_id, task_result }लिफाफा वापस करते हैं — लेकिनtask_resultके अंदर के फील्ड अभिनेता के अनुसार भिन्न होते हैं। - "sources" फील्ड का प्रत्येक पर अलग नाम है। ChatGPT
content_referencesऔरsearch_resultलौटाता है; Geminicitationsलौटाता है; Perplexityweb_resultsलौटाता है — वही विचार, तीन कुंजी, प्रति-आइटम तीन आकार। जिस फील्ड को आप स्रोतों को प्राप्त करने के लिए पढ़ते हैं, वह तीनों में पोर्टेबल नहीं है। - केवल ChatGPT उत्पाद लौटाता है।
shoppingसक्षम करने पर,scraper.chatgptप्रति-विपणकoffersके साथ एकproductsएरे जोड़ता है; Gemini और Perplexity कोई खरीदारी सतह वापस नहीं करते। - Perplexity समृद्धतम लिफाफा लाता है। उत्तर और
web_resultsके अलावा, यह एकmedia_itemsएरे और एकrelated_promptसूची लौटाता है; Gemini सबसे हल्का है — उत्तर पाठ और एकcitationsएरे और कुछ नहीं। - इनपुट के झंडे अभिनेता के अनुसार भिन्न होते हैं। सभी
promptऔरcountryकोinputके अंदर लेते हैं; ChatGPT एक वैकल्पिकshoppingझंडा जोड़ता है, Perplexityweb_searchजोड़ता है। पैरामीटर हमेशाinputके अंदर जाते हैं, कभी भी शीर्ष स्तर पर नहीं। - हर फील्ड नल योग्य और प्रति-सेशन होती है। एक एरे किसी विशेष रन पर खाली लौट सकता है, इसलिए आप जो अभिनेता चुनते हैं वह निर्णय करता है कि आप किन फील्ड पर भरोसा कर सकते हैं —
task_idऔर एक कैप्चर समय टिकट को स्टोर करें और श्रृंखला पढ़ें, केवल एक कॉल नहीं। - शुरू करने के लिए स्वतंत्र। नए Scrapeless खातों में मुफ्त परीक्षण क्रेडिट शामिल होते हैं — app.scrapeless.com पर साइन अप करें।
परिचय: एक प्रॉम्प्ट, तीन उत्तर आकार
स्प्रैकलेस के माध्यम से ChatGPT, Gemini, और Perplexity को वही प्रश्न भेजें और तीन उत्तर लौटते हैं — तीन अलग JSON आकार में। परिवहन समान है: एक POST, एक x-api-token हेडर, एक { status, task_id, task_result } लिफाफा। जो बदलता है वह task_result के अंदर है — वह कुंजी जो उत्तर के स्रोतों को पकड़ती है, क्या उत्पाद लौटते हैं, क्या मीडिया और अनुवर्ती प्रॉम्प्ट शामिल हैं। एक क्लाइंट जो इनमें से एक अभिनेता को पढ़ता है, स्वचालित रूप से अन्य दो को नहीं पढ़ता है।
यह लौटाए गए स्कीमाओं की एक डेवलपर तुलना है, न कि यह तय करने के लिए कि कौन सा मॉडल बेहतर उत्तर देता है। यह, क्षेत्र से क्षेत्र, यह मैप करता है कि scraper.chatgpt, scraper.gemini, और scraper.perplexity वास्तव में समान प्रॉम्प्ट के लिए क्या लौटाते हैं, जहां स्कीमाएँ भिन्न होती हैं, और किस कार्य के लिए किस अभिनेता को पकड़ना है। उपकरण श्रेणी के लिए सर्वश्रेष्ठ LLM स्क्रैपर्स की दृष्टि, वह गाईड सतहों को रैंक करता है; यह एक उनके उत्तर आकारों को साथ-साथ रखता है।
प्रत्येक अभिनेता क्या पकड़ता है
तीनों यूनिवर्सल स्क्रैपिंग API LLM अभिनेता हैं, एक ही तरीके से कैप्चर किए गए:
scraper.chatgpt— ChatGPT का संश्लेषित उत्तर, इसके द्वारा उल्लिखित स्रोत, और (यदिshoppingचालू है) प्रति-विपणक ऑफ़र के साथ एक उत्पाद कैरोसेल।scraper.gemini— Gemini का उत्तर और एक उद्धरण एरे। तीन में सबसे हल्का।scraper.perplexity— Perplexity का उत्तर, इसकी वेब-परिणाम स्रोत, इनलाइन मीडिया, और अनुशंसित अनुवर्ती प्रॉम्प्ट्स।
साझा संविदा: वही अंत बिंदु, वही लिफाफा, वही प्रमाणीकरण
तीनों अभिनेता https://api.scrapeless.com/api/v2/scraper/execute पर एक x-api-token हेडर और { actor, input: { prompt, country, … } } के एक बॉडी के साथ POST करते हैं, और तीनों { status, task_id, task_result } लौटाते हैं। अभिनेताओं को बदलना एक-लाइन का परिवर्तन है।
bash
curl -sS -X POST https://api.scrapeless.com/api/v2/scraper/execute \
-H "Content-Type: application/json" \
-H "x-api-token: ${SCRAPELESS_API_KEY}" \
-d '{ "actor": "scraper.gemini", "input": { "prompt": "best running shoes 2026", "country": "US" } }'
# अभिनेता: scraper.chatgpt | scraper.gemini | scraper.perplexity
परिवहन पोर्टेबल है; पार्सिंग प्रति-अभिनेता है — task_result वह जगह है जहाँ वे भिन्न होते हैं।
उत्तर बॉडी, तुलना की
हर अभिनेता उत्तर को संश्लेषित उत्तर के रूप में result_text के रूप में लौटाता है (मार्कडाउन-शैली के गद्य)। यह फील्ड नाम वही एक चीज़ है जो उत्तर बॉडी को सभी तीन के बीच साझा करता है। तीनों में उत्तर के अलग-अलग मार्कडाउन और HTML वेरिएंट वापस नहीं आते हैं — result_text यहाँ एकल उत्तर प्रारूप है। (अभिनेता scraper.aimode, एक भिन्न सतह, वह है जो उत्तर को पाठ/मार्कडाउन/HTML में विभाजित करता है; ये तीन ऐसा नहीं करते हैं।)
जहां स्कीमाएँ भिन्न होती हैं: उद्धरण और स्रोत
"मॉडल ने क्या उद्धृत किया" यह सभी तीन अभिनेताओं के लिए वही प्रश्न है और प्रत्येक पर एक अलग फील्ड:
- ChatGPT इसे दो में विभाजित करता है:
content_references[](उद्धृत स्रोत, प्रत्येक के साथtitle,url,attribution) औरsearch_result[](वेब परिणाम जिसे उसने संदर्भित किया,title,url,snippet,attributionके साथ), एकweb_searchboolean द्वारा नियंत्रित किया गया। - Gemini एकल
citations[]सरणी लौटाता है, और यह प्रति आइटम सबसे विस्तृत है:title,url,website_name,snippet,favicon, औरhighlights। - Perplexity
web_results[]लौटाता है, सबसे सरल स्रोत आइटम:name,url,snippet।
एक ही अवधारणा, तीन कुंजी, तीन आकृति। Gemini के citations[].website_name के खिलाफ लिखी गई एक शेयर-ऑफ-उद्धरण पार्सर, Perplexity के web_results[].name के खिलाफ बिना फिर से मैप किए नहीं चलती।
प्लेटफ़ॉर्म-विशिष्ट फ़ील्ड्स
प्रत्येक अभिनेता कुछ ऐसा लौटाता है जो अन्य दो नहीं करते:
- ChatGPT — उत्पाद।
input.shopping: trueसेट करें औरscraper.chatgptएकproducts[]सरणी जोड़ता है, प्रत्येक उत्पाद में एक मूल्य, रेटिंग, समीक्षा संख्या, और एकoffers[]सूची एक व्यापारिक के लिए एक प्रविष्टि के साथ। यह एकmodelid और एकlinks[]सरणी भी लौटाता है। Gemini और Perplexity के पास कोई खरीद सतह नहीं है। - Perplexity — मीडिया और फॉलो-अप।
scraper.perplexityएकmedia_items[]सरणी (image,thumbnail,url,source,medium) और फॉलो-अप प्रश्नों की एकrelated_prompt[]सूची लौटाता है — इनमें से कोई भी अन्य दो नहीं लौटाते। - Gemini — कुछ अतिरिक्त नहीं। Gemini का मूल्य इसके विपरीत है: एक साफ दो-फील्ड उत्तर (
result_text+citations[]) जिसमें प्राधिकरण-विशिष्ट सतह को संभालने के लिए कुछ नहीं है।
फ़ील्ड मैट्रिक्स: सभी तीनों एकसाथ
| वैचारिक फ़ील्ड | scraper.chatgpt |
scraper.gemini |
scraper.perplexity |
|---|---|---|---|
| उत्तर पाठ | result_text |
result_text |
result_text |
| उद्धृत स्रोत | content_references[] (title, url, attribution) |
citations[] (title, url, website_name, snippet, favicon, highlights) |
web_results[] (name, url, snippet) |
| वेब-खोज परिणाम | search_result[] + web_search झंडा |
— | web_results[] |
| उत्पाद / ऑफ़र | products[] + offers[] (साथ में shopping: true) |
— | — |
| मीडिया | — | — | media_items[] |
| संबंधित प्रॉम्प्ट | — | — | related_prompt[] |
| मॉडल आईडी | model |
— | — |
| लिंक | links[] |
— | — |
| प्रतिध्वनित प्रॉम्प्ट | prompt |
prompt |
prompt |
| वैकल्पिक इनपुट झंडा | shopping |
— | web_search |
एक कॉलम में नीचे पढ़ें ताकि जान सकें कि एक अभिनेता आपको कौन सी फ़ील्ड प्रदान करता है; एक पंक्ति के पार पढ़ें ताकि देख सकें कि क्यों एक पार्सर तीनों की सेवा नहीं कर सकता।
अपने एपीआई कुंजी के लिए मुफ्त योजना पर जाएं: app.scrapeless.com
इनपुट पैरामीटर, तुलना की गई
input ऑब्जेक्ट वह जगह है जहां अनुरोध-पक्ष असमmetry मौजूद है। तीनों को prompt और country की आवश्यकता होती है; वैकल्पिक झंडे भिन्न होते हैं।
input फ़ील्ड |
scraper.chatgpt |
scraper.gemini |
scraper.perplexity |
|---|---|---|---|
prompt |
आवश्यक | आवश्यक | आवश्यक |
country |
आवश्यक | आवश्यक | आवश्यक |
shopping |
वैकल्पिक (→ products[]) |
— | — |
web_search |
वैकल्पिक | — | वैकल्पिक |
प्रत्येक फ़ील्ड input के अंदर होती है; शरीर के शीर्ष स्तर पर prompt या country भेजने को अस्वीकृत किया जाता है।
तीनों में उतार-चढ़ाव और शून्यता
उत्तर सत्र के अनुसार उत्पन्न होता है, इसलिए वही प्रॉम्प्ट एक रन से अगले पर विभिन्न पाठ और विभिन्न सरणी लंबाई लौटाता है, हर अभिनेता पर। प्रत्येक फ़ील्ड को शून्यनीय के रूप में मानें: products[] खाली हो सकता है भले ही shopping चालू हो, citations[] और web_results[] की गिनती में भिन्नता होती है, और एक निरंतर खाली सरणी का मतलब है कि उस प्रश्न के लिए कोई उत्तर नहीं था — इसे फिर से भेजने के लिए नहीं। प्रत्येक कॉल पर task_id और एक कैप्चर टाइमस्टैम्प स्टोर करें ताकि समय श्रृंखला संकेत हो, न कि एकल उत्तर।
निर्णय गाइड: किस नौकरी के लिए किस प्रतिक्रिया आकार को कैप्चर करना है
| यदि काम है… | कैप्चर | पढ़ें |
|---|---|---|
| क्रॉस-व्यापारी मूल्य / उत्पाद की निगरानी | scraper.chatgpt के साथ shopping: true |
products[] → offers[] |
| समृद्ध स्रोत मेटाडेटा के साथ उद्धरण का हिस्सा | scraper.gemini |
citations[] (website_name, highlights) |
| स्रोत ट्रैकिंग के साथ मीडिया और फॉलो-अप इरादा | scraper.perplexity |
web_results[], media_items[], related_prompt[] |
| सबसे सरल उत्तर-केवल कैप्चर | scraper.gemini |
result_text |
अभिनेता को प्रश्न से पिन करें। चूंकि परिवहन साझा किया जाता है, एक ही प्रॉम्प्ट और देश पर दो या तीन चलाना एक ही ग्राहक के साथ एक अलग अभिनेता स्ट्रिंग है — और आपको एक ही पास में प्रत्येक प्लेटफ़ॉर्म की सतह से उत्तर देता है।
निष्कर्ष: तीन आकार, एक ग्राहक
The transport is shared and the parsing is not: scraper.chatgpt, scraper.gemini, and scraper.perplexity एक ही एंडपॉइंट और एन्वेलप को जवाब देते हैं, लेकिन task_result में भिन्नता होती है - विभिन्न स्रोत कुंजियाँ, केवल ChatGPT के उत्पाद, केवल Perplexity के मीडिया और फॉलो-अप, Gemini का सरल दो-क्षेत्र आकार। आपको आवश्यकता के अनुसार अभिनेता का चयन करना है, प्रति अभिनेता task_result को मैप करें, और हर क्षेत्र को नल करने योग्य के रूप में मानें। यूनीवर्सल स्क्रैपिंग एपीआई क्रेडिट्स के साथ एक तयप्रकार संकेत को शेड्यूल पर चलाएँ, और एक क्लाइंट तीनों प्लेटफार्मों के उत्तर एकत्र करता है। यहाँ क्षेत्र नाम प्रत्येक अभिनेता के LLM चैट स्क्रैपर संदर्भ में लाइव रन के खिलाफ पुष्टि की गई हैं।
क्या आप अपना AI-उत्तर डेटा पाइपलाइन बनाने के लिए तैयार हैं?
हमारे समुदाय में शामिल हों और AI-उत्तर डेटा पाइपलाइनों का निर्माण करने वाले डेवलपर्स से जुड़ें: डिस्कॉर्ड · टेलीग्राम.
app.scrapeless.com पर मुफ्त ट्रायल क्रेडिट के लिए साइन अप करें और एक क्लाइंट को ChatGPT, Gemini, और Perplexity पर इंगित करें ताकि आपके प्रोग्राम द्वारा ट्रैक किए गए प्रश्नों पर सभी तीन उत्तर रूपों को कैप्चर कर सकें।
एफएक्यू
प्रश्न: क्या सभी तीन अभिनेता एक ही इनपुट लेते हैं?
तीनों input वस्तु के भीतर prompt और country लेते हैं। scraper.chatgpt एक वैकल्पिक shopping ध्वज जोड़ता है और scraper.perplexity web_search जोड़ता है; पैरामीटर हमेशा input के भीतर होते हैं, कभी भी शीर्ष स्तर पर नहीं।
प्रश्न: तीनों में उद्धरण क्षेत्रों के नाम अलग-अलग क्यों हैं?
हर अभिनेता अपने प्लेटफ़ॉर्म के प्रदर्शित उत्तर को पार्स करता है, इसलिए स्रोत डेटा प्लेटफ़ॉर्म के अनुसार आकार लिया गया है - ChatGPT के content_references, Gemini के citations, और Perplexity के web_results विभिन्न कुंजियों और विभिन्न आइटम क्षेत्रों को ले जाते हैं। साझा कुंजी मानने के बजाय उस अभिनेता द्वारा वापस किया गया फ़ील्ड पढ़ें।
प्रश्न: क्या एक क्लाइंट बिना फिर से लिखे सभी तीन पढ़ सकता है?
परिवहन के लिए, हाँ - वही एंडपॉइंट, x-api-token हेडर, और { status, task_id, task_result } एन्वेलप। आप अभिनेता का नाम बदलते हैं और प्रति अभिनेता task_result कुंजियों को मैप करते हैं, क्योंकि आंतरिक क्षेत्र सेट भिन्न होता है।
प्रश्न: कौन सा अभिनेता खरीदारी या उत्पाद डेटा लौटाता है?
scraper.chatgpt के साथ input.shopping: true एक products[] ऐरे को प्रति-व्यापारी offers[] के साथ भरता है। Gemini और Perplexity खरीदारी सतह लौटाते नहीं हैं।
प्रश्न: एक ही संकेत विभिन्न कार्यों पर विभिन्न क्षेत्रों को क्यों लौटाता है?
उत्तर प्रति सत्र उत्पन्न होते हैं और रन दर रन भिन्न होते हैं; प्रत्येक क्षेत्र नल करने योग्य है और एक ऐरे खाली वापस आ सकता है। लगातार खाली परिणाम को उस प्रश्न के लिए कोई उत्तर न मानें, और task_id के साथ एक कैप्चर टाइमस्टैम्प स्टोर करें ताकि श्रृंखला संकेत बन सके।
स्क्रैपलेस में, हम केवल सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करते हैं, जबकि लागू कानूनों, विनियमों और वेबसाइट गोपनीयता नीतियों का सख्ती से अनुपालन करते हैं। इस ब्लॉग में सामग्री केवल प्रदर्शन उद्देश्यों के लिए है और इसमें कोई अवैध या उल्लंघन करने वाली गतिविधियों को शामिल नहीं किया गया है। हम इस ब्लॉग या तृतीय-पक्ष लिंक से जानकारी के उपयोग के लिए सभी देयता को कोई गारंटी नहीं देते हैं और सभी देयता का खुलासा करते हैं। किसी भी स्क्रैपिंग गतिविधियों में संलग्न होने से पहले, अपने कानूनी सलाहकार से परामर्श करें और लक्ष्य वेबसाइट की सेवा की शर्तों की समीक्षा करें या आवश्यक अनुमतियाँ प्राप्त करें।



