मुख्य: एआई वॉयस क्लोनिंग और स्थानीयकरण
वक्ता: डॉ. विन्न वोरावुत्कुंचाई, संस्थापक और सीईओ बोटनोई समूह
घटना: SCBX AI EP1 को अनलॉक करना, AI अवसरों के लिए थाईलैंड पथ
सहयोग: एससीबीएक्स और Insiderly.ai
कार्यक्रम-स्थल: एससीबीएक्स नेक्स्टटेक, सियाम पैरागॉन, चौथी मंजिल
आज के एआई में कई शक्तियां हैं, न केवल सवाल पूछना और अचानक जवाब पाना।
लेकिन यह चित्र भी बना सकता है। आप कुछ कीवर्ड दर्ज करके चीजें बना सकते हैं।
आवाज भी अपने आप में कुछ ऐसा है जो एआई बना सकता है, जो कठिन लग सकता है, लेकिन अगर इसका उपयोग दूसरों की मदद करने के लिए सकारात्मक रूप से किया जाता है, तो इससे बहुत फायदा हो सकता है।
BOTNOI एक उद्यमी है जो अच्छी चीजें बनाने के लिए आवाज, क्लोन या वॉयस क्लोन बनाने के लिए AI का उपयोग करता है।

BOTNOI Group के संस्थापक और CEO डॉ व्यान वोरावुत्चाई ने AI विशेषज्ञ एंड्रयू एनजी का उदाहरण देकर वॉयस क्लोनिंग के विकास की शुरुआत की, जिन्होंने पाया कि किसी ने लिंक्डइन पर अपनी आवाज क्लोन की है। एआई द्वारा किस आवाज का क्लोन बनाया जाता है?
नतीजतन, लोग शायद ही भेद कर सकते हैं कि कौन सी आवाज असली एंड्रयू एनजी की आवाज है।
वर्तमान में कुछ वेबसाइटों पर, जैसे: थाईपीबीएस "रीड टू लिसन" सेवा की पेशकश करके आगे बढ़ें, जो समाचार एंकर की आवाज को क्लोन करता है और समाचार पढ़ने के लिए दबाता है। यह उन लोगों के लिए उपयुक्त है जो पाठ पढ़ने के बजाय ध्वनि सुनना चाहते हैं।
BOTNOI ने ThaiPBS के एक रिपोर्टर की आवाज़ का क्लोन बनाया और वेबसाइट पर समाचार पढ़ने के लिए उस पर क्लिक किया जैसे कि वह वास्तव में इस समाचार को पढ़ रहा हो।
चाल आश्चर्यजनक है, लेकिन थाईपीबीएस की भी व्यापक रूप से आलोचना की गई है क्योंकि भले ही यह एआई को समाचार पढ़ने के लिए बीओटीओआई का उपयोग करता है, एआई अभी भी संक्षिप्त शब्दों को नहीं पढ़ सकता है, जैसे कि महानिरीक्षक लोगों को गलत तरीके से पढ़ा जाता है।
लेकिन यह दिखाता है कि ध्वनि की क्लोनिंग कितनी चिकनी है, इसलिए अंत में, मुझे एक अस्वीकरण शामिल करना पड़ा कि यह एआई-जनित आवाज है, वास्तविक उद्घोषक नहीं। गलतफहमी को रोकें
पिछला मनुष्य ने हमेशा प्रकृति की नकल करने की कोशिश की है, जिसमें बाघों के आकार में पक्षियों, तलवारों और चाकू के आकार में हवाई जहाज बनाना शामिल है।
कुछ चीजें जिनकी सीमाएं हुआ करती थीं, जैसे कि एक कार बनाना जो खुद ड्राइव नहीं कर सकती है, आज कोई बाधा नहीं है जो कार के लिए मस्तिष्क बना सकती है और फिर इसे बिना बल के अपने दम पर चला सकती है।

BOTNOI इस अवधारणा को ध्वनि पीढ़ी पर लागू करता है। यह मानव मस्तिष्क की संरचना की नकल करने की कोशिश करता है जब तक कि यह इनपुट आउटपुट समीकरण तक नहीं आता है जो वास्तविकता से मेल खाने वाली ध्वनियों का उत्पादन करता है।
डॉ. व्यान ने कहा कि हम इंसानों को 4 साल की उम्र से पहले कुछ भी याद नहीं है।
उन्होंने खुद यह देखने की कोशिश की कि उनके बेटे ने अपने आस-पास की आवाज़ों के साथ कैसे बातचीत की। उस उम्र में उन्होंने जो सीखा वह यह था कि जो बच्चे अपनी मां की आवाज सुनते हैं, उनके दिमाग जो सुनते हैं और देखते हैं, उन्हें जोड़ने की कोशिश करेंगे, और यह एक सीख होगी कि वह बोटनोई के काम पर लागू होता है।
यदि BOTNOI किसी की आवाज़ का क्लोन बनाना चाहता है, तो उस व्यक्ति को पाठ के लगभग 200 वाक्यों को पढ़ना होगा और फिर AI को सीखने के लिए सिस्टम में अपनी आवाज़ और पाठ आयात करना होगा।
हालांकि शुरुआती प्रयोगों के परिणामों को अच्छी आवाज नहीं मिली। हालांकि, जब इसमें सुधार किया जाता है, तो गुणवत्ता में काफी सुधार होता है।
वॉयस क्लोनिंग के अलावा, डीपफेक भी है, या किसी व्यक्ति के वॉयस क्लोन फेस को क्लोन करना है जो व्यक्ति के मुंह की गति की नकल कर सकता है। हो सकता है कि व्यक्ति ने शब्द भी न कहा हो, जो बहुत सूक्ष्म है।
BOTNOI ने किसी व्यक्ति की आवाज बनाने के बिंदु पर तकनीक भी विकसित की है उच्चारण बनाए रखते हुए और अपनी पहचान बनाए रखते हुए दूसरी भाषा बोलना, जिस पर गर्व होना और निर्माण करना कुछ है। इसका उपयोग मूवी डबिंग में किया जा सकता है।
यदि तकनीक आगे बढ़ती है, तो हॉलीवुड फिल्म में नायक की आवाज बनाना संभव हो सकता है। अपने स्वयं के उच्चारण आदि को बनाए रखते हुए थाई बोलने में सक्षम हो।
एक और केस स्टडी जो हमने पाया वह यह था कि COVID-19 महामारी के दौरान, छोटी दुकानों की बिक्री में गिरावट आई, इसलिए कैडबरी ने एक मॉडल का आविष्कार किया, जिसने बिक्री बढ़ाने के लिए दुकानों के विज्ञापन में मदद करने के लिए प्रसिद्ध बॉलीवुड अभिनेताओं का उपयोग किया।
हुआ यह कि मशहूर अभिनेता शाहरुख खान की आवाज ली गई और लोगों को खूब तवज्जो दी गई। क्योंकि यह ध्वनि को संशोधित कर सकता है और विभिन्न उत्पादों को बिना सीमा के बेचने में विशिष्ट होने के लिए छवि को अनुकूलित कर सकता है।
हालांकि, हमें दुरुपयोग के मामलों से भी सावधान रहना चाहिए। स्वयं निर्माता होने के बावजूद, डॉ. व्यान को दूसरों द्वारा दूसरों को धोखा देने के लिए क्लोन किया गया है।
यह बोटनोई के लिए एक सबक बन गया है। यह कैसा होगा? खासकर ऐसे दौर में जब हर दिन कॉल सेंटर गैंग बड़े पैमाने पर होते हैं।
रोकथाम आज भी मुश्किल हो सकती है और इसे करने के कुछ प्रभावी तरीके हैं। ऐसा करने के तरीकों में से एक एआई आवाज में वॉटरमार्क को एक आवृत्ति तक छिपाना हो सकता है जिसे मनुष्य सुन नहीं सकते हैं, लेकिन इसे एक आसान तरीका खोजने की भी आवश्यकता है। क्योंकि अगर वह व्यक्ति जो किसी घोटाले में आवाज का उपयोग करने का इरादा रखता है, पहले से ही आवृत्ति को हटाने और वैसे भी इसका दुरुपयोग करने में सक्षम है।
डॉ. व्यान को उम्मीद है कि सभी संबंधित एजेंसियां या एआई डेवलपर्स इसके बारे में जागरूक होंगी और क्लोन की गई आवाज को सही तरीके से उपयोग करने में मदद करेंगी। साथ ही अपराध में अंतर को यथासंभव भरना।
छवि क्रेडिट : एससीबीएक्स