- Advertisement -

‘Luna’ बोले, गाए और महसूस भी करे! 25 वर्षीय आईआईटियन ने बनाया दुनिया का पहला इमोशनल वॉइस-टू-वॉइस एआई मॉडल

आईआईटी-बीएचयू के पूर्व छात्र स्पर्श अग्रवाल ने “Luna” नाम का एआई मॉडल बनाया है, जो इंसानों की तरह बोल सकता है, रुक सकता है, गा सकता है और भावनाएं दिखा सकता है। यह Pixa AI का अनोखा प्रोजेक्ट है।

4 Min Read

आर्टिफिशियल इंटेलिजेंस के क्षेत्र में हर दिन कुछ नया होता है, लेकिन आईआईटी-बीएचयू के 25 वर्षीय स्पर्श अग्रवाल ने जो किया है, वह खास है। उन्होंने “Luna” नाम का एक एआई मॉडल बनाया है जो सिर्फ मशीन की तरह नहीं, बल्कि भावनाओं को समझ और व्यक्त भी कर सकता है। इसे जयपुर की स्टार्टअप Pixa AI के साथ मिलकर तैयार किया गया है और इसे दुनिया का पहला इमोशनल वॉइस-टू-वॉइस एआई मॉडल माना जा रहा है। जबकि ज्यादातर एआई जैसे ChatGPT या Google Gemini केवल टेक्स्ट पर काम करते हैं, Luna वॉइस इनपुट लेता है और वॉइस में ही जवाब देता है। इसका मतलब है कि आप इसके साथ इंसानों की तरह सीधे बात कर सकते हैं।

- Advertisement -
Ad image

Luna कैसे काम करता है?

मीडिया रिपोर्ट के अनुसार, Luna एक ऐसा एआई मॉडल है जो सीधे ऑडियो को प्रोसेस कर सकता है। इसकी खासियत यह है कि यह इंसानों जैसी भावनाओं वाला नेचुरल स्पीच आउटपुट देता है। Luna टोन, पिच और रिदम को समझ सकता है, बोल सकता है, फुसफुसा सकता है, गा सकता है और बीच में सोचने के लिए रुक भी सकता है, जिससे बातचीत बिल्कुल जीवंत लगती है। स्पर्श अग्रवाल के अनुसार, Luna का इस्तेमाल इमोशनल कम्युनिकेशन, वर्चुअल असिस्टेंट, एंटरटेनमेंट और वॉइस ट्रेनिंग जैसे कई क्षेत्रों में किया जा सकता है। इसकी आवाज़ इतनी नेचुरल है कि सुनने वाला इसे मशीन नहीं बल्कि इंसान की आवाज़ महसूस करता है।

बिना भारी इंफ्रास्ट्रक्चर के बना यह कमाल

दिलचस्प बात यह है कि Luna बनाने के लिए स्पर्श अग्रवाल को किसी बड़े कॉरपोरेट सेटअप या मल्टी-मिलियन डॉलर की लैब की जरूरत नहीं पड़ी। उन्होंने बस कुछ GPU (Graphics Processing Units) उधार लेकर इसे विकसित किया। यह इस प्रोजेक्ट को और भी प्रेरणादायक बनाता है क्योंकि आमतौर पर ऐसे एआई मॉडल बनाने के लिए लाखों डॉलर और विशाल टेक्निकल इंफ्रास्ट्रक्चर चाहिए होता है। स्पर्श अग्रवाल ने अपने X (Twitter) हैंडल पर Luna का वीडियो शेयर किया, जिसमें यह मॉडल भावनाओं के साथ बात करता और संगीत जैसी धुन में गाते हुए दिखा। Luna ने इस प्रदर्शन में OpenAI के GPT-4 TTS और ElevenLabs जैसे बड़े मॉडलों को 50% कम लैटेंसी और नेचुरल वॉइस आउटपुट के साथ पीछे छोड़ दिया।

- Advertisement -
Ad image

आर्टिफीसियल इंटेलिजेंस का भविष्य

Luna का आना यह दिखाता है कि भविष्य का AI सिर्फ “स्मार्ट” नहीं, बल्कि “सेंसिटिव” भी होगा। यह तकनीक हेल्थकेयर, कस्टमर सर्विस और कई क्षेत्रों में इमोशनल इंटेलिजेंस को नई दिशा दे सकती है। सोचिए, एक वर्चुअल असिस्टेंट आपकी आवाज़ से मूड समझे और उसी टोन में जवाब दे, यही Luna की खासियत है। स्पर्श अग्रवाल का यह इनोवेशन भारत में एआई रिसर्च में नई लहर ला सकता है। सीमित संसाधनों में इतना उन्नत मॉडल बनाकर उन्होंने साबित किया कि क्रिएटिविटी और पैशन बड़े बजट से भी ज्यादा महत्व रखते हैं।

Keywords: Luna AI, Sparsh Agrawal, IIT BHU, Pixa AI, Emotional AI, Voice To Voice AI, Indian Innovation

TAGGED:
Share This Article
कोई टिप्पणी नहीं

- Advertisement -

- Advertisement -

- Advertisement -

लेटेस्ट
चुटकी शॉट्स
वीडियो
वेबस्टोरी
मेन्यू