एसआरआई-बी ने गैलेक्सी एआई के लिए हिंदी भाषा को विकसित किया, बेहतरीन नतीजों के लिए 20 क्षेत्रीय बोलियों को भी इसमें शामिल किया गया
गुरुग्राम, भारत, 1 जुलाई 2024 : गैलेक्सी एआई के विकास में दुनिया के कई देशों और सांस्कृतिक माहौल में काम कर रही कई अनुसंधान और विकास (आरएंडडी) टीमें शामिल हैं। कोरिया के बाहर सैमसंग के सबसे बड़े आरएंडडी सेंटर, एसआरआई बेंगलुरू ने ब्रिटिश, भारतीय और ऑस्ट्रेलियन इंग्लिश के साथ थाई, वियतनामी और इंडोनेशियाई भाषा के लिए एआई लैंग्वेज मॉडल के विकास के लिए भी टीमों के साथ भागीदारी की है।
हाल ही में, दूसरे सैमसंग रिसर्च सेंटर्स के प्रमुख इंजीनियरों ने भारत में बेंगलुरु का दौरा किया। यहां पर एसआरआई-बी की टीम ने वियतनामी, थाई और इंडोनेशियाई भाषा को गैलेक्सी एआई में शामिल करने के लिए तकनीक को अपग्रेड करने में मदद की।
एसआरआई-बी ने गैलेक्सी एआई के लिए हिंदी भाषा का भी विकास किया। हिंदी के एआई मॉडल का विकास आसान नहीं था। टीम को यह सुनिश्चित करना पड़ा कि इसमें 20 से ज्यादा क्षेत्रीय बोलियां, उनके बोलने का लहजा, विराम चिन्ह और बोलचाल की भाषाओं को शामिल किया जाए। हिंदी बोलने वाले लोगों का अपनी बातचीत में अक्सर अंग्रेजी शब्दों में शामिल करना आम बात है। इसके लिए टीम को अनुवादित और ट्रांसलेशन एवं ट्रांसलिटरेटेड डेटा के संयोजन के साथ एआई मॉडल ट्रेनिंग के कई दौर पूरे करने की जरूरत पड़ी।
बेंगलुरु में एसआरआई-बी के सैंमसंग आरएंडडी इंस्टिट्यूट के हेड गिरिधर जक्की ने कहा, “हर भाषा की अपनी चुनौतियां होती हैं, लेकिन जब आप लोगों में दूसरी भाषाओं को बोलने की क्षमता का विकास करने पर विचार करते हैं तो इसके लिए हर प्रयास करने की जरूरत होती है। हम हिंदी को गैलेक्सी एआई में लाने के लिए बहुत उत्सुक थे।’’
उन्होंने कहा, “हिंदी में ध्वनि की जटिल संरचना है, जिसमें मुंह में जीभ को पीछे मोड़कर बनाई गई कुछ ध्वनियां शामिल है, जो अन्य भाषाओं में मौजूद नहीं है। एआई सोल्यूशन में भाषा के संयोजन का तत्व विकसित करने के लिए हमने क्षेत्रीय भाषाविदों के साथ सभी अनोखी ध्वनियों की समीक्षा की और भाषा की कुछ विशिष्ट बोलियों को सपोर्ट करने के लिए ध्वनि की सबसे छोटी इकाई का एक सेट तैयार किया।’’
एआई मॉडल विकसित करने में सैससंग और शिक्षण संस्थानों के बीच भागीदारी काफी कारगर रही, जिससे भारत के अलग-अलग क्षेत्रों के भाषाओं की सांस्कृतिक बारीकियों की झलक मिली। वेल्लोर इंस्टिट्यूट ऑफ टेक्नोलॉजी ने सैमसंग को बोलचाल में बोली जाने वाली भाषा, शब्दों और कमांड की अलग-अलग दस लाख लाइनों को संग्रह करने में मदद की और इससे उन्होंने ऑडियो डेटा बनाया। गैलेक्सी एआई में दुनिया की चौथी सबसे ज्यादा बोली जाने वाली भाषा को शामिल करने के महत्वपूर्ण कार्य में डेटा एक महत्वपूर्ण घटक था। यूनिवर्सिटीज के साथ साझेदारी कर सैमसंग ने यह सुनिश्चित किया कि वह उच्च गुणवत्ता के आंकड़ों का प्रयोग कर रही है।
अब गैलेक्सी एआई 16 भाषाओं को सपोर्ट कर रहा है। इससे ज्यादा से ज्यादा लोग अपनी भाषा संबंधी क्षमताओं का विस्तार कर सकते हैं। यहां तक कि ऑफ लाइन रहते हुए डिवाइस में शामिल अनुवाद के फीचर्स का लाभ उठा सकते हैं, जिसमें लाइव ट्रांसलेटर, इंटरप्रेटर, नोट असिस्ट और ब्राउजिंग असिस्ट शामिल है।
यह परियोजना पूरी तरह से सैसमंग की साझेदारी के खुले सिद्धांत और कंपनी के विश्वास को दर्शाती है कि विशेषज्ञता और अपने दृष्टिकोण को साझा कर हम सार्थक ढंग से तकनीक को अपग्रेड कर सकते हैं। एसआरआई-बी न सिर्फ शिक्षाविदों का सहयोग करती है, जबकि इससे दुनिया के दूसरे सैमसंग रिसर्च सेंटर्स से अपने आइडियाज और काम करने का बेहतरीन तरीका शेयर किया जा सकता है।
जक्की ने कहा, “अपने साझीदारों की मदद से हमने जो हासिल किया, उस पर हमें गर्व है। साझेदारी से तकनीक का अपग्रेडेशन हमारे उस काम का प्रमुख हिस्सा है, जो हम कर रहे हैं। हम भाषा संबंधी आंकड़ों को बेहतर ढंग से समझना, उसका संग्रह करना और उसका विश्लेषण करना जारी रखेंगे, जिससे भविष्य में ज्यादा से ज्यादा लोगों को एआई टूल्स तक पहुंच मिल सके।“