आर्टिफिशियल इंटेलिजेंस के क्षेत्र में हर दिन कुछ नया होता है, लेकिन आईआईटी-बीएचयू के 25 वर्षीय स्पर्श अग्रवाल ने जो किया है, वह खास है। उन्होंने “Luna” नाम का एक एआई मॉडल बनाया है जो सिर्फ मशीन की तरह नहीं, बल्कि भावनाओं को समझ और व्यक्त भी कर सकता है। इसे जयपुर की स्टार्टअप Pixa AI के साथ मिलकर तैयार किया गया है और इसे दुनिया का पहला इमोशनल वॉइस-टू-वॉइस एआई मॉडल माना जा रहा है। जबकि ज्यादातर एआई जैसे ChatGPT या Google Gemini केवल टेक्स्ट पर काम करते हैं, Luna वॉइस इनपुट लेता है और वॉइस में ही जवाब देता है। इसका मतलब है कि आप इसके साथ इंसानों की तरह सीधे बात कर सकते हैं।
Luna कैसे काम करता है?
मीडिया रिपोर्ट के अनुसार, Luna एक ऐसा एआई मॉडल है जो सीधे ऑडियो को प्रोसेस कर सकता है। इसकी खासियत यह है कि यह इंसानों जैसी भावनाओं वाला नेचुरल स्पीच आउटपुट देता है। Luna टोन, पिच और रिदम को समझ सकता है, बोल सकता है, फुसफुसा सकता है, गा सकता है और बीच में सोचने के लिए रुक भी सकता है, जिससे बातचीत बिल्कुल जीवंत लगती है। स्पर्श अग्रवाल के अनुसार, Luna का इस्तेमाल इमोशनल कम्युनिकेशन, वर्चुअल असिस्टेंट, एंटरटेनमेंट और वॉइस ट्रेनिंग जैसे कई क्षेत्रों में किया जा सकता है। इसकी आवाज़ इतनी नेचुरल है कि सुनने वाला इसे मशीन नहीं बल्कि इंसान की आवाज़ महसूस करता है।
बिना भारी इंफ्रास्ट्रक्चर के बना यह कमाल
दिलचस्प बात यह है कि Luna बनाने के लिए स्पर्श अग्रवाल को किसी बड़े कॉरपोरेट सेटअप या मल्टी-मिलियन डॉलर की लैब की जरूरत नहीं पड़ी। उन्होंने बस कुछ GPU (Graphics Processing Units) उधार लेकर इसे विकसित किया। यह इस प्रोजेक्ट को और भी प्रेरणादायक बनाता है क्योंकि आमतौर पर ऐसे एआई मॉडल बनाने के लिए लाखों डॉलर और विशाल टेक्निकल इंफ्रास्ट्रक्चर चाहिए होता है। स्पर्श अग्रवाल ने अपने X (Twitter) हैंडल पर Luna का वीडियो शेयर किया, जिसमें यह मॉडल भावनाओं के साथ बात करता और संगीत जैसी धुन में गाते हुए दिखा। Luna ने इस प्रदर्शन में OpenAI के GPT-4 TTS और ElevenLabs जैसे बड़े मॉडलों को 50% कम लैटेंसी और नेचुरल वॉइस आउटपुट के साथ पीछे छोड़ दिया।
Where is India's AI?
— Sparsh Agrawal (@sparsh_17) October 29, 2025
Every WhatsApp group, every conference hallway, every founder call asks the same question
Today, we’re sharing the answer
Meet Luna, world’s first speech-to-speech foundational AI model to unify audio, music and speech. pic.twitter.com/3GAM6DgnAk
आर्टिफीसियल इंटेलिजेंस का भविष्य
Luna का आना यह दिखाता है कि भविष्य का AI सिर्फ “स्मार्ट” नहीं, बल्कि “सेंसिटिव” भी होगा। यह तकनीक हेल्थकेयर, कस्टमर सर्विस और कई क्षेत्रों में इमोशनल इंटेलिजेंस को नई दिशा दे सकती है। सोचिए, एक वर्चुअल असिस्टेंट आपकी आवाज़ से मूड समझे और उसी टोन में जवाब दे, यही Luna की खासियत है। स्पर्श अग्रवाल का यह इनोवेशन भारत में एआई रिसर्च में नई लहर ला सकता है। सीमित संसाधनों में इतना उन्नत मॉडल बनाकर उन्होंने साबित किया कि क्रिएटिविटी और पैशन बड़े बजट से भी ज्यादा महत्व रखते हैं।
Keywords: Luna AI, Sparsh Agrawal, IIT BHU, Pixa AI, Emotional AI, Voice To Voice AI, Indian Innovation

