अमेज़न कथित तौर पर पेरप्लेक्सिटी एआई की जांच कर रहा है, क्योंकि उस पर आरोप है कि वह बिना सहमति के वेबसाइटों को स्क्रैप करता है


अमेज़न वेब सर्विसेज ने यह पता लगाने के लिए जांच शुरू कर दी है कि क्या पेरप्लेक्सिटी एआई उसके नियमों का उल्लंघन कर रहा है। वायर्ड. सटीक रूप से कहें तो, कंपनी का क्लाउड डिवीजन कथित तौर पर उन आरोपों की जांच कर रहा है कि सेवा एक क्रॉलर का उपयोग कर रही है, जो इसके सर्वर पर होस्ट किया गया है, जो रोबोट एक्सक्लूजन प्रोटोकॉल को अनदेखा करता है। यह प्रोटोकॉल एक वेब मानक है, जिसमें डेवलपर्स एक डोमेन पर robots.txt फ़ाइल डालते हैं जिसमें निर्देश होते हैं कि बॉट किसी विशेष पृष्ठ तक पहुँच सकते हैं या नहीं। उन निर्देशों का पालन करना स्वैच्छिक है, लेकिन प्रतिष्ठित कंपनियों के क्रॉलर आम तौर पर उनका सम्मान करते हैं क्योंकि वेब डेवलपर्स ने 90 के दशक में मानक को लागू करना शुरू किया था।

एक पुराने लेख में, वायर्ड की सूचना दी उसने एक वर्चुअल मशीन की खोज की जो उसकी वेबसाइट के robots.txt निर्देशों को दरकिनार कर रही थी। वह मशीन IP पते 44.221.181.252 का उपयोग करके Amazon Web Services सर्वर पर होस्ट की गई थी, जो “निश्चित रूप से Perplexity द्वारा संचालित है।” कथित तौर पर इसने पिछले तीन महीनों में सैकड़ों बार कॉन्डे नास्ट की अन्य संपत्तियों का दौरा किया, ताकि उनकी सामग्री को खंगाला जा सके। अभिभावक, फोर्ब्स और दी न्यू यौर्क टाइम्स उन्होंने यह भी पाया कि यह उनके प्रकाशनों में कई बार आया था, वायर्ड यह पुष्टि करने के लिए कि क्या पेरप्लेक्सिटी वास्तव में अपनी सामग्री को स्क्रैप कर रही थी, वायर्ड कंपनी के चैटबॉट में अपने लेखों के शीर्षक या संक्षिप्त विवरण दर्ज किए। फिर टूल ने ऐसे परिणाम दिए जो उसके लेखों को “न्यूनतम श्रेय के साथ” बारीकी से दर्शाते थे।

हाल ही में रॉयटर्स रिपोर्ट में दावा किया गया है कि पेरप्लेक्सिटी एकमात्र एआई कंपनी नहीं है जो बड़े भाषा मॉडल को प्रशिक्षित करने के लिए इस्तेमाल की जाने वाली सामग्री को इकट्ठा करने के लिए robots.txt फ़ाइलों को बायपास कर रही है। हालाँकि, ऐसा लगता है कि वायर्ड केवल अमेज़ॅन को पेरप्लेक्सिटी एआई के क्रॉलर के बारे में जानकारी प्रदान की। “AWS की सेवा की शर्तें अपमानजनक और अवैध गतिविधियों को प्रतिबंधित करती हैं और हमारे ग्राहक उन शर्तों का पालन करने के लिए जिम्मेदार हैं,” अमेज़ॅन वेब सर्विसेज ने हमें एक बयान में बताया। “हमें नियमित रूप से विभिन्न स्रोतों से कथित दुर्व्यवहार की रिपोर्ट मिलती है और हम अपने ग्राहकों को उन रिपोर्टों को समझने के लिए संलग्न करते हैं।” प्रवक्ता ने यह भी कहा कि कंपनी के क्लाउड डिवीजन ने बताया वायर्ड वह प्रकाशन द्वारा उपलब्ध कराई गई जानकारी की जांच कर रहा था, जैसा कि वह संभावित उल्लंघनों की सभी रिपोर्टों की जांच करता है।

पेरप्लेक्सिटी की प्रवक्ता सारा प्लैटनिक ने बताया वायर्ड कंपनी ने पहले ही अमेज़ॅन की पूछताछ का जवाब दिया है और इस बात से इनकार किया है कि उसके क्रॉलर रोबोट एक्सक्लूज़न प्रोटोकॉल को दरकिनार कर रहे हैं। “हमारा PerplexityBot – जो AWS पर चलता है – robots.txt का सम्मान करता है, और हमने पुष्टि की है कि Perplexity-नियंत्रित सेवाएँ किसी भी तरह से क्रॉल नहीं कर रही हैं जो AWS सेवा की शर्तों का उल्लंघन करती हैं,” उसने कहा। प्लैटनिक ने हमें बताया कि अमेज़ॅन ने इस पर गौर किया वायर्ड मीडिया जांच केवल अपने संसाधनों के दुरुपयोग की रिपोर्ट की जांच के लिए एक मानक प्रोटोकॉल के हिस्से के रूप में है। कंपनी ने स्पष्ट रूप से अमेज़ॅन से पहले किसी भी प्रकार की जांच के बारे में नहीं सुना है वायर्ड कंपनी से संपर्क किया। प्लैटनिक ने स्वीकार किया वायर्डहालाँकि, जब कोई उपयोगकर्ता अपनी चैटबॉट पूछताछ में एक विशिष्ट URL शामिल करता है, तो PerplexityBot robots.text को अनदेखा कर देगा।

पेरप्लेक्सिटी के सीईओ अरविंद श्रीनिवास ने भी पहले इस बात से इनकार किया था कि उनकी कंपनी “रोबोट एक्सक्लूजन प्रोटोकॉल की अनदेखी कर रही है और फिर इसके बारे में झूठ बोल रही है।” श्रीनिवास ने यह बात स्वीकार की थी। फास्ट कंपनी कि पेरप्लेक्सिटी अपने स्वयं के शीर्ष पर तीसरे पक्ष के वेब क्रॉलर का उपयोग करता है, और यह कि बॉट वायर्ड उनमें से एक की पहचान की गई।

अपडेट, 28 जून, 2024, 2:20 अपराह्न ET: हमने इस पोस्ट को अपडेट कर दिया है, तथा इसमें एनगैजेट पर पेरप्लेक्सिटी का बयान जोड़ दिया है।

अपडेट, 28 जून, 2024, 8:27PM ET: हमने इस पोस्ट को अमेज़न वेब सर्विसेज़ के एक बयान के साथ अपडेट कर दिया है।



Source link