यह लेख अंतिम बार अपडेट किया गया था अगस्त 14, 2024
Table of Contents
स्टिचिंग ब्रिन ऑफ़लाइन एआई प्रशिक्षण के लिए बड़ी मात्रा में अवैध डेटा लेता है
स्टिचिंग ब्रिन ऑफ़लाइन एआई प्रशिक्षण के लिए बड़ी मात्रा में अवैध डेटा लेता है
कॉपीराइट संगठन स्टिचिंग ब्रिन ने एक डच डेटासेट, डेटा का एक संग्रह ऑफ़लाइन ले लिया है, जिसका उद्देश्य कृत्रिम बुद्धिमत्ता (एआई) का प्रशिक्षण देना था। संस्था के मुताबिक, नीदरलैंड में ऐसा पहली बार हुआ है।
ब्रिन स्वयं एक “बड़े डेटासेट” की बात करते हैं, जिसमें संगठन के अनुसार, हजारों पुस्तकों की अवैध प्रतियां, Nu.nl जैसी वेबसाइटों के समाचार लेखों की लाखों लाइनें और अनगिनत फिल्मों और टीवी श्रृंखलाओं के उपशीर्षक शामिल हैं। स्रोत. निर्देशक बस्तियान वान रामशोर्स्ट का भी कहना है कि वह जानते हैं कि निर्माता कौन है, लेकिन गोपनीयता कारणों से नहीं कह सकते।
डेटा सेट का उपयोग करें
डेटासेट का उद्देश्य एक तथाकथित भाषा मॉडल को प्रशिक्षित करना है, शब्दजाल में इन्हें बड़े भाषा मॉडल कहा जाता है। डेटासेट के निर्माता ने ब्रिन को लिखित रूप में इसका उपयोग न करने का वादा किया है और यह भी जानकारी दी है कि इसे किसने प्राप्त किया। फाउंडेशन अब जांच कर रहा है कि डेटा का उपयोग वास्तव में एआई मॉडल द्वारा किया गया है या नहीं। यदि ऐसा है, तो पार्टियों को जवाबदेह ठहराया जाएगा।
एआई को प्रशिक्षित करते समय कॉपीराइट का उल्लंघन करने वाली सामग्री एक बड़ी समस्या है। हाल ही में, शोध से यह दृढ़ता से पता चला है कि DALL-E और मिडजर्नी सहित प्रसिद्ध AI छवि जनरेटर को प्रशिक्षित करने के लिए डच छवि निर्माताओं के कार्यों का उपयोग उनकी अनुमति के बिना किया गया है।
अमेरिका में, वर्तमान में द न्यूयॉर्क टाइम्स और चैटजीपीटी के निर्माता ओपनएआई के बीच मुकदमा चल रहा है। अखबार ने कंपनी पर बिना अनुमति के एआई को प्रशिक्षित करने के लिए भारी मात्रा में अखबार के लेखों का उपयोग करने का आरोप लगाया है। OpenAI का मानना है कि डेटा का उपयोग करने की अनुमति है।
स्टिचिंग ब्रेन
Be the first to comment