स्टिचिंग ब्रिन ऑफ़लाइन एआई प्रशिक्षण के लिए बड़ी मात्रा में अवैध डेटा लेता है

यह लेख अंतिम बार अपडेट किया गया था अगस्त 14, 2024

स्टिचिंग ब्रिन ऑफ़लाइन एआई प्रशिक्षण के लिए बड़ी मात्रा में अवैध डेटा लेता है

Stichting Brein

स्टिचिंग ब्रिन ऑफ़लाइन एआई प्रशिक्षण के लिए बड़ी मात्रा में अवैध डेटा लेता है

कॉपीराइट संगठन स्टिचिंग ब्रिन ने एक डच डेटासेट, डेटा का एक संग्रह ऑफ़लाइन ले लिया है, जिसका उद्देश्य कृत्रिम बुद्धिमत्ता (एआई) का प्रशिक्षण देना था। संस्था के मुताबिक, नीदरलैंड में ऐसा पहली बार हुआ है।

ब्रिन स्वयं एक “बड़े डेटासेट” की बात करते हैं, जिसमें संगठन के अनुसार, हजारों पुस्तकों की अवैध प्रतियां, Nu.nl जैसी वेबसाइटों के समाचार लेखों की लाखों लाइनें और अनगिनत फिल्मों और टीवी श्रृंखलाओं के उपशीर्षक शामिल हैं। स्रोत. निर्देशक बस्तियान वान रामशोर्स्ट का भी कहना है कि वह जानते हैं कि निर्माता कौन है, लेकिन गोपनीयता कारणों से नहीं कह सकते।

डेटा सेट का उपयोग करें

डेटासेट का उद्देश्य एक तथाकथित भाषा मॉडल को प्रशिक्षित करना है, शब्दजाल में इन्हें बड़े भाषा मॉडल कहा जाता है। डेटासेट के निर्माता ने ब्रिन को लिखित रूप में इसका उपयोग न करने का वादा किया है और यह भी जानकारी दी है कि इसे किसने प्राप्त किया। फाउंडेशन अब जांच कर रहा है कि डेटा का उपयोग वास्तव में एआई मॉडल द्वारा किया गया है या नहीं। यदि ऐसा है, तो पार्टियों को जवाबदेह ठहराया जाएगा।

एआई को प्रशिक्षित करते समय कॉपीराइट का उल्लंघन करने वाली सामग्री एक बड़ी समस्या है। हाल ही में, शोध से यह दृढ़ता से पता चला है कि DALL-E और मिडजर्नी सहित प्रसिद्ध AI छवि जनरेटर को प्रशिक्षित करने के लिए डच छवि निर्माताओं के कार्यों का उपयोग उनकी अनुमति के बिना किया गया है।

अमेरिका में, वर्तमान में द न्यूयॉर्क टाइम्स और चैटजीपीटी के निर्माता ओपनएआई के बीच मुकदमा चल रहा है। अखबार ने कंपनी पर बिना अनुमति के एआई को प्रशिक्षित करने के लिए भारी मात्रा में अखबार के लेखों का उपयोग करने का आरोप लगाया है। OpenAI का मानना ​​है कि डेटा का उपयोग करने की अनुमति है।

स्टिचिंग ब्रेन

दोस्तों के साथ बांटें

Be the first to comment

Leave a Reply

Your email address will not be published.


*