कावासोती । चिनियाँ आर्टिफिसियल इन्टेलिजेन्स (एआई) कम्पनी डिपसिकले अत्यन्त प्रभावकारी एआई मोडेल सार्वजनिक गर्दै प्रविधि क्षेत्रलाई चकित बनाएको छ । यसले ओपनएआई र एन्थ्रोपिकजस्ता अमेरिकी कम्पनीका अत्याधुनिक उत्पादनसँग प्रतिस्पर्धा गर्न सक्छ । सन् २०२३ मा स्थापित डिपसिकले आफ्ना प्रतिस्पर्धीका तुलनामा धेरै कम लागत र कम्प्युटिङ स्रोत प्रयोग गरेर यो उपलब्धि हासिल गरेको हो । गत साता सार्वजनिक भएको डिपसिकको ‘रिजनिङ’ आर १ मोडेलले अनुसन्धानकर्तामाझ उत्साह, लगानीकर्तामाझ आश्चर्य र एआई क्षेत्रका ठुला कम्पनीबाट प्रतिक्रिया उत्पन्न गराउन सफल भयो । कम्पनीले यसलाई पछ्याउँदै २८ जनवरीमा टेक्स्ट (पाठ) मात्र नभई चित्रसँग पनि काम गर्न सक्ने मोडेल सार्वजनिक गरेको छ ।
गत डिसेम्बरमा डिपसिकले आफ्नो भी ३ मोडेल सार्वजनिक गरेको थियो । यो एक अत्यन्त शक्तिशाली ‘मानकीय’ लार्ज ल्यांग्वेज मोडेल हो, जसले ओपनएआईको जिपिटी–४ ओ र एन्थ्रोपिकको क्लाउड ३.५ को स्तरमा प्रदर्शन गर्छ । उसो त यी मोडेल गल्ती गर्न सक्ने र यिनले कहिलेकाहीँ आफैँले तथ्य बनाउने प्रवृत्ति भए पनि प्रश्नको उत्तर दिनु, निबन्ध लेख्नु र कम्प्युटर कोड उत्पादनजस्ता कार्य गर्न सक्षम छन् । समस्या समाधान र गणितीय तर्कका केही परीक्षणले यिनले औसत मानिसको तुलनामा राम्रो अंक ल्याउँछन् । भी ३ लाई करिब ५५ लाख ८० हजार अमेरिकी डलर लागतमा प्रशिक्षण दिइएको थियो । यो जिपिटी–४ को तुलनामा उल्लेखनीय रूपमा सस्तो छ । यसको विकास लागत १० करोड अमेरिकी डलरभन्दा बढी परेको थियो । डिपसिकले भी ३ मोडेललाई एच ८०० जिपियू चिप भएको दुई हजार कम्प्युटरको प्रयोगबाट प्रशिक्षण दिइएको दाबी गरेको छ । यो अन्य कम्पनीका तुलनामा एकदमै न्यून हो किनभने अन्य कम्पनीले अधिक शक्तिशाली एच १०० चिप भएका १६ हजारसम्मका कम्प्युटर प्रयोग गरेको हुन सक्ने देखिन्छ । २० जनवरीमा डिपसिकले अर्को मोडेल आर १ सार्वजनिक गरेको छ । यसलाई ‘तर्क गर्ने’ मोडेलको संज्ञा पनि दिइएको छ, जसले जटिल समस्यालाई क्रमशः चरणबद्ध रूपमा समाधान गर्ने प्रयास गर्छ ।
आर १ मोडेल भी ३ को परिमार्जित संस्करण हो, जसलाई रिइन्फोर्समेन्ट लर्निङ नामक प्रविधि प्रयोग गरी परिमार्जन गरिएको हो । आर १ ले गत वर्ष सार्वजनिक गरिएको ओपन एआईको ओ १ जस्तै स्तरमा काम गर्ने देखिन्छ । डिपसिकले यस्तै प्रविधि प्रयोग गरेर घरेलु कम्प्युटरमा चलाउन सकिने साना ओपन–सोर्स मोडेलको ‘तर्क गर्ने’ संस्करण पनि बनाएको छ । यो सार्वजनिकीकरणले डिपसिकप्रति ठुलो चासो उत्पन्न गरेको छ, जसले भी३मा आधारित च्याटबोट एपको लोकप्रियता बढाएको छ र लगानीकर्ताले एआई उद्योगको पुनर्मूल्यांकन गर्दा प्रविधि बजारमा ठुलो स्तरमा मूल्यको गिरावट निम्त्याएको छ । यो लेख लेखिँदासम्म चिप निर्माता एनभिडियाले करिब ६ खर्ब अमेरिकी डलरबराबरको बजार मूल्य गुमाइसकेको छ ।
डिपसिकको सफलता कम स्रोत प्रयोग गरेर उत्कृष्ट नतिजा प्राप्त गर्ने क्षमतामा केन्द्रित छ । विशेषतः डिपसिकका निर्माताले दुई प्रविधिमा अग्रणी भूमिका खेलेका छन्, जसलाई एआई अनुसन्धानकर्ताले व्यापक रूपमा अपनाउन सक्छन् । पहिलो प्रविधि ‘स्पार्सिटी’ भनिने गणितीय अवधारणासँग सम्बन्धित छ । यो एआई मोडेलसँग धेरै संख्यामा प्यारामिटर छन्, जसले इनपुटमा आधारित प्रतिक्रिया निर्धारण गर्छन् (भी३मा करिब ६ खर्ब ७१ अर्ब प्यारामिटर छन्) र कुनै पनि इनपुटका लागि यी प्यारामिटरमध्ये सानो अंश मात्र प्रयोग गरिन्छ । उसो त कुन प्यारामिटर आवश्यक पर्छ भनेर पूर्वानुमान गर्न सजिलो छैन । तर, डिपसिकले यसका लागि नयाँ प्रविधि प्रयोग ग¥यो र त्यसपछि केवल आवश्यक प्यारामिटरलाई प्रशिक्षण दिएको छ । यसका कारण डिपसिकका मोडेललाई परम्परागत विधिका तुलनामा धेरै कम प्रशिक्षण आवश्यक प¥यो । अर्को चासोको विषय भी३ले कम्प्युटर मेमोरीमा जानकारी कसरी भण्डारण गर्छ भन्ने विषयसँग सम्बन्धित छ । डिपसिकले सम्बन्धित तथ्यांकलाई कुशलतापूर्वक कम्प्रेस गर्ने एक निपुण उपाय फेला पारेको छ । यसले तथ्यांकलाई सजिलै भण्डारण गर्न र छिटो पहुँच पाउन सकिने बनाउँछ ।
डिपसिकका एआई मोडेल र प्रविधि निःशुल्क एमआइटी लाइसेन्सअन्तर्गत सार्वजनिक गरिएका छन् । जोसुकैले पनि ती मोडेल डाउनलोड गरी परिमार्जन गर्न सक्छन् । यो केही एआई कम्पनीका लागि नराम्रो खबर हुन सक्छ, किनभने शक्तिशाली मोडेल निःशुल्क उपलब्ध हुँदा तिनको मुनाफामा ह्रास आउन सक्छ । तर, यो बृहत् एआई अनुसन्धान समुदायका लागि निकै राम्रो खबर हो । हालका अवस्थामा धेरैजसो एआई अनुसन्धानका लागि अत्यधिक कम्प्युटिङ स्रोतको पहुँच आवश्यक पथ्र्यो । विश्वविद्यालयमा आधारित अनुसन्धानकर्ता (वा ठुला प्रविधि कम्पनीबाहेक अन्य स्थानमा रहेका अनुसन्धानकर्ता) अर्थात् मजस्ताले परीक्षण र प्रयोग सञ्चालन गर्न सीमितता झेलिरहेका छन् ।
यस अवस्थामा अधिक प्रभावकारी मोडेल र प्रविधिले परिस्थितिलाई परिवर्तन गरिरहेको छ । अब हामीलाई परीक्षण र विकास गर्न निकै सहज हुन सक्छ । उपभोक्ताका लागि पनि एआईको पहुँच सस्तो हुने सम्भावना छ । धेरै एआई मोडेल अब ‘क्लाउड’मा सदस्यता शुल्क तिर्नुको सट्टा प्रयोगकर्ताकै ल्यापटप वा फोनजस्ता उपकरणमा सञ्चालन गर्न सकिनेछ । यद्यपि जोसँग पहिल्यै पर्याप्त स्रोत छ, तिनका लागि यो प्रभावकारिता खासै उपयोगी नहुन सक्छ । डिपसिकको दृष्टिकोणले समग्रमा थप राम्रो प्रदर्शन गर्ने मोडेल बनाउन मद्दत गर्नेछ वा केवल प्रभावकारी मोडेल निर्माणमा सीमित रहनेछ भन्ने कुरा अझै अस्पष्ट छ ।
(लिउ सिड्नी विश्वविद्यालयको मेसिन लर्निङका सह–प्राध्यापक तथा सिड्नी एआई केन्द्रका निर्देशक हुन्)
द कन्भर्सेसनबाट
प्रकाशित : २०८१ माघ १७ गते २२:००
Facebook Comment