"डीपफेक", एआई तकनीक और विभिन्न उद्योगों में इसका अनुप्रयोग
आर्टिफिशियल इंटेलिजेंस (एआई) चैटबॉट्स के विकास के बीच में जो दुनिया के सूचनाओं से भरे इंटरनेट के युग में प्रवेश करने के बाद छलांग और सीमा से बेहतर हो गए हैं। एआई की देखने की एक अन्य क्षमता वीडियो और ऑडियो का विकास है, जो इस बिंदु तक विकसित हो गया है कि एआई अब ऐसे वीडियो बना सकता है जो वास्तविकता के विरोध में लोगों के कार्यों की नकल करते हैं, या "डीपफेक" (जिसे डिजिटल ह्यूमन, एआई अवतार और एआई क्लोन के रूप में भी जाना जाता है)।
ऐसी तकनीक की परिभाषा काफी सीधी है, जब एआई किसी व्यक्ति के वीडियो को एक संकेत के अनुसार कार्य करने या कहने के लिए अनुकरण करता है जो उपयोगकर्ता चाहता है, जब वास्तव में व्यक्ति को वास्तव में ऐसी कार्रवाई नहीं करनी होती है।
उदाहरण के लिए "बी द स्का" विल्सन की डीपफेक तकनीक के माध्यम से चीजों को बेचने के लिए "पिमरी पाई" के चेहरे के साथ मिश्रित खुद का एक वीडियो पोस्ट किया। सॉफ्टवेयर ने एआई के विकास के बारे में आश्चर्यजनक मात्रा में सकारात्मक प्रतिक्रिया उत्पन्न की है।
या व्यापार क्षेत्र में। एससीबीएक्स पब्लिक कंपनी लिमिटेड कंपनी द्वारा शेयरधारकों को प्रस्तुत की जाने वाली सामग्री और वीडियो तैयार करने के लिए जनरेटिव एआई का उपयोग करना। यह ऐतिहासिक बैठक अनुक्रमों को प्रशिक्षित करने के लिए एक बड़े भाषा मॉडल (एलएलएम) का उपयोग करता है, और फिर एआई को अंतिम बैठक के लिए स्क्रिप्ट लिखने का निर्देश देता है।
इसके अलावा, सिस्टम पिछले शेयरधारकों की बैठक के वीडियो प्रस्तुति प्रारूप को समझने के लिए एआई को सिखाने के लिए जनरेटिव वीडियो का उपयोग करता है, और फिर सिस्टम नवीनतम व्यावसायिक परिणाम विवरण का एक वीडियो बनाता है।

डीपफेक बनाने के चरण
फिर भी डीपफेक बनाने के कई तरीके हैं, लेकिन सबसे आम गहरे तंत्रिका नेटवर्क का उपयोग करना है जो फेस-स्वैपिंग तकनीक का उपयोग करते हैं, या सीधे शब्दों में कहें, तो उपयोगकर्ता के पास डीपफेक के आधार के रूप में "लक्ष्य वीडियो" होना चाहिए, और फिर संकलित करें उस व्यक्ति की वीडियो क्लिप जिसे आप लक्ष्य वीडियो में सम्मिलित करना चाहते हैं।
जबकि लक्ष्य वीडियो हॉलीवुड फिल्म की क्लिप या उस व्यक्ति का वीडियो हो सकता है जिसे आप फिल्म में अपना चेहरा डालना चाहते हैं, या यह किसी भी वीडियो प्लेटफॉर्म से डाउनलोड की गई एक यादृच्छिक क्लिप हो सकती है।
बाद में, प्रत्येक कार्यक्रम में एआई भविष्यवाणी करेगा कि एक व्यक्ति कई कोणों और स्थितियों से कैसा दिखता है जो सभी उपलब्ध हैं। सिस्टम तब व्यक्ति को लक्ष्य वीडियो में किसी अन्य व्यक्ति के साथ समान सुविधाओं को ढूंढकर और उपयोगकर्ता द्वारा वांछित डीपफेक वीडियो बनाकर मिलान करेगा।
इसके अलावा, डेवलपर्स ने एक अन्य प्रकार की मशीन लर्निंग*, जनरेटिव एडवरसैरियल नेटवर्क्स (GAN)* को जोड़ने की कोशिश की है, जो डीपफेक वीडियो में होने वाली खामियों का सावधानीपूर्वक पता लगाता है और उनमें सुधार करता है, जिससे वीडियो स्पूफिंग डिटेक्टरों के लिए इसे समझना अधिक कठिन हो जाता है।
यद्यपि संपूर्ण निर्माण प्रक्रिया जटिल लगती है, वर्तमान सॉफ़्टवेयर का उपयोग करना काफी आसान है और कई मौजूदा एप्लिकेशन कुछ ही क्लिक के साथ डीपफेक बना सकते हैं, जैसे कि चीन, ज़ाओ, डीपफेस लैब, फेकऐप, फेस स्वैप, हेजेन, डी-आईडी, स्टेबलडिफ्यूजन, आदि। Deepfake-as-a-Service ของ Tencent कई और डीपफेक सॉफ़्टवेयर GitHub पर पाए जा सकते हैं, जो एक ओपन-सोर्स डेवलपर समुदाय है।
डीपफेक तकनीक के लाभ
1. डबिंग और अनुवाद
डीपफेक तकनीक का उपयोग कई अन्य उद्योगों को लाभ पहुंचाने के लिए भी किया जा सकता है, उदाहरण के लिए, उपयोगकर्ता डेविड बेकहम द्वारा वीडियो बनाने के लिए डीपफेक तकनीक का उपयोग करते हैं। मलेरिया को खत्म करने के अभियान के लिए बोलें โครงการ "मलेरिया मस्ट डाई वीडियो में, बेकहम नौ भाषाओं में एक मुंह के आकार के साथ अभियान स्क्रिप्ट बोलता है जो बोली जाने वाली प्रत्येक भाषा के साथ पूरी तरह से सद्भाव में चलता है।
बेकहम का वीडियो मूवी डबिंग के लिए डीपफेक तकनीक का उपयोग करने की क्षमता को प्रदर्शित करता है। एक अभिनेता के चेहरे की गति में हेरफेर से ऐसा लग सकता है कि वे एक वाक्य कह रहे हैं जो उन्होंने वास्तविक जीवन में नहीं कहा था।
इससे भी महत्वपूर्ण बात यह है कि सामान्य वॉयस-ओवर के बजाय कई भाषाओं में एक अभिनेता की आवाज को नियंत्रित करने के लिए एआई का उपयोग करके इस अवधारणा को बढ़ाया जा सकता है, जो इसे और अधिक रोचक बना देगा क्योंकि व्यक्ति की आवाज मूल है।
महत्वपूर्ण रूप से, आवाज को प्रबंधित करने के लिए अब तकनीक है, उदाहरण के लिए, Lyrebird AI जो मानव भाषण को क्लोन करने के लिए AI का उपयोग करता है। डीपफेक की तकनीक के साथ जोड़ा गया, परिणाम एक "वॉयस-ओवर टूल" है जिसमें उपयोगकर्ता की पसंदीदा भाषा के आधार पर भारी क्षमता है।
2. फिल्म उद्योग
पारंपरिक वीडियो उत्पादन में अक्सर वास्तविक दृश्य बनाने का व्यस्त काम शामिल होता है, जिसमें सामग्री के लिए पैसे खर्च होते हैं। लेकिन दृश्य प्रभावों के लिए डीपफेक तकनीक का उपयोग करके, फिल्म निर्माता आसानी से आभासी दृश्य और पृष्ठभूमि बना सकते हैं। प्रौद्योगिकी फिल्म निर्माताओं को पृष्ठभूमि बदलने और परिवहन चुनौतियों के बिना विभिन्न पटकथाओं के अनुकूल होने में मदद करेगी। श्रम या अतिरिक्त लागत
इसके अलावा, डीपफेक तकनीक फिल्म निर्माताओं को उन अभिनेताओं के साथ नई स्थितियों की कल्पना करने की अनुमति देती है जो अब फिल्मों में लौटने में सक्षम नहीं हैं। उदाहरण के लिए, एक आश्चर्यजनक उपस्थिति। ल्यूक स्काईवॉकर का मंडलोरियन सीज़न दो के समापन में, जिसके कारण प्रशंसक आधार एक के बाद एक बाढ़ आ गया।
महत्वपूर्ण रूप से, कृत्रिम बुद्धिमत्ता तकनीक अब बना सकती है एक प्रसिद्ध हॉलीवुड अभिनेता का क्लोन। या यहां तक कि चार चरणों में व्यक्ति के मूल भंडारण के माध्यम से किसी व्यक्ति के डिजिटल क्लोन को बड़े करीने से स्केच करें: ऑडियो रिकॉर्डिंग, ऑडियो रिकॉर्डिंग और डिजिटल क्लोनिंग। "डोरोथी" जैसे डिजिटल स्कैनिंग टूल के साथ, मूल को लक्ष्य वीडियो के साथ जोड़ा जा सकता है और विभिन्न पात्रों में बनाया जा सकता है।
इससे भी महत्वपूर्ण बात यह है कि यह 360-डिग्री कैमरा लगभग हर मुद्रा में लोगों के चेहरे की छवियों को कैप्चर करता है, चाहे वह मुस्कुरा रहा हो, अपना मुंह खोल रहा हो, अपनी जीभ चिपका रहा हो, या डीपफेक वीडियो को यथासंभव आभासी बनाने के लिए अपनी आँखें आगे-पीछे घुमा रहा हो, और क्लोन द्वारा कहा गया हर शब्द सही मुंह के आकार के साथ चलता है।
3. थॉट लीडर्स (KOLs)
डीपफेक तकनीक के विचारक नेता बहुत उपयोगी हैं, विशेष रूप से डेवलपर्स द्वारा डिजाइन की गई स्क्रिप्ट के अनुसार सीधे संचार के संदर्भ में, साथ ही कर्मियों की लागत को कम करने के लिए, और वे दिन में 24 घंटे काम कर सकते हैं।
एक दिलचस्प उदाहरण डीपफेक की तकनीक है। जिओइस इन डीपफेक केओएल ने कंपनी की लागत को कम करने और विचारशील नेताओं के माध्यम से ब्रांड पहचान बनाने के माध्यम से व्यवसाय क्षेत्र को और अधिक कुशल बनाने में योगदान दिया है, जिनके पास नौकरी बदलने या वास्तविक लोगों की तरह खरीदे जाने का अवसर नहीं है।
4. शिक्षा
1 9 63 में, राष्ट्रपति जॉन एफ कैनेडी डलास, संयुक्त राज्य अमेरिका में भाषण देने के लिए अपने रास्ते पर थे। आखिरकार, कैनेडी ने वह भाषण नहीं दिया जो उसने तैयार किया था। हालांकि, आधुनिक तकनीक और एआई के विकास के साथ, हम आज कैनेडी के बयान को सुन सकते हैं। CereProc टीम ने "कैनेडी आवाज बनाने" के लिए अपने भाषणों की 831 रिकॉर्डिंग का विश्लेषण किया।
ध्वनि को ध्वनि की 116,177 इकाइयों में विभाजित किया गया है, जो काफी चुनौतीपूर्ण है क्योंकि रिकॉर्ड की गई ध्वनियाँ अलग-अलग समय पर विभिन्न प्रकार के उपकरणों पर बनाई जाती हैं। लेकिन अंत में, CereProc कैनेडी की यथार्थवादी आवाज को पूरी तरह से बनाने के लिए AI का उपयोग करने में सक्षम था।
उदाहरण के लिए, डेवलपर्स अपनी कहानियों को बताने के लिए ऐतिहासिक आंकड़ों के नए वीडियो बना सकते हैं, उदाहरण के लिए, पिछले साल, इलिनोइस स्टेट म्यूजियम और सेंटर फॉर द स्टडी ऑफ द होलोकॉस्ट ने 15 होलोकॉस्ट बचे लोगों के घूर्णन होलोग्राम का प्रदर्शन किया। आगंतुकों के पास बचे लोगों के होलोग्राम से सवाल पूछने का अवसर है। एक गोलाकार कैमरे से मूल वीडियो से, जिसने बचे लोगों के साथ साक्षात्कार रिकॉर्ड किए, जिनमें से प्रत्येक को फिल्माने में 5 दिन लगे।
5. व्यापार
व्यापार क्षेत्र डीपफेक तकनीक के सबसे बड़े लाभार्थियों में से एक है, जिसका एक उल्लेखनीय उदाहरण एससीबीएक्स की सबसे हालिया शेयरधारक बैठक में जनरेटिव एआई की शुरूआत है।
हालाँकि, व्यावसायिक क्षेत्र में अभी भी डीपफेक तकनीक के उपयोग के कई उदाहरण हैं। Heygen, एक AI अवतार निर्माण मंच उदाहरण के लिए, व्यावसायिक परिणामों की रिपोर्ट करने के लिए AI अवतारों का उपयोग करना, नए कर्मचारियों को प्रशिक्षित करने के लिए अवतार तकनीक का उपयोग करना, या ग्राहकों को नौकरी बेचने के लिए वीडियो बनाना आदि। ऐसी तकनीक का लाभ यह है कि कुछ ही क्लिक के साथ ग्राहकों के लिए एक बार में सैकड़ों या हजारों वीडियो बनाए जाते हैं।

व्यापार क्षेत्र में एआई के उपयोग का एक उदाहरण आज एक तेजी से अलग-थलग समाज के बीच में है। इसलिए, हाल के वर्षों में, डेटिंग एप्लिकेशन अधिक से अधिक लोकप्रिय हो गए हैं। जब डेटिंग एप्लिकेशन की अवधारणा को डीपफेक तकनीक के साथ जोड़ा गया, तो इसका जन्म हुआ। Candy.ai एक ऐसा प्लेटफॉर्म जो उपयोगकर्ताओं के लिए एआई से बात करने के लिए एक अवतार का अनुकरण करता है जैसे कि वे दोस्त या प्रेमी थे। यदि भविष्य में तकनीक अधिक विकसित होती है, तो उपयोगकर्ता एआई अवतारों के साथ वॉयस का उपयोग करके या वीडियो कॉल के माध्यम से कॉल करने में सक्षम हो सकते हैं जो उपयोगकर्ता चाहते हैं और अधिक आभासी हैं।
इसके अलावा, शिक्षण या प्रशिक्षण के माध्यम से पैसा कमाने वाले व्यवसाय डीपफेक वीडियो ले सकते हैं और कमांड दर्ज कर सकते हैं और स्टूडियो में स्वयं वीडियो रिकॉर्ड करने की आवश्यकता के बिना निर्देशात्मक वीडियो बना सकते हैं। "चांस द रैपर" जो दर्शकों को डीप आर्टिफिशियल इंटेलिजेंस के काम के बारे में सिखाने आए थे।
डीपफेक का डार्क साइड
हालाँकि, हालाँकि इस तकनीक ने कई उद्योगों और व्यवसायों के लिए लाभ पैदा किया है, दूसरी ओर, बहुत परेशानी पैदा करने के लिए डीपफेक तकनीक का उपयोग किया गया है। उदाहरण के लिए, धोखेबाज थाईलैंड में स्टॉक विशेषज्ञों के वीडियो या ऑडियो क्लोन बनाने के लिए ऐसी तकनीक का उपयोग करते हैं। उनमें से एक है "डॉ।
निवेत मेवाचिरावारकोर्न" और फिर आम जनता को निवेश में धोखा दिया।
इसके अलावा, हाल के वर्षों में, कई धोखेबाजों ने अवैध उद्देश्यों के लिए डीपफेक तकनीक का उपयोग किया है, जिसमें उनकी सहमति के बिना पोर्नोग्राफी बनाना भी शामिल है, जब तक कि यूएस फेडरल ब्यूरो ऑफ इन्वेस्टिगेशन को जनरेटिव एआई के खतरों और नग्न सामग्री बनाने के लिए उन उपकरणों के उपयोग के बारे में जनता को चेतावनी देने के लिए जून 2023 में एक सार्वजनिक नोटिस जारी करना पड़ा। साइबर यौन जबरन वसूली और उत्पीड़न
2017 में, "डीपफेक" नाम के एक Reddit उपयोगकर्ता ने मशहूर हस्तियों के चेहरों का उपयोग करने वाली पोर्नोग्राफी फैलाने के लिए एक खाता बनाया। डीपट्रेस के अनुसार, 96 में ऑनलाइन पाए गए डीपफेक वीडियो में पोर्नोग्राफी का 2019% हिस्सा था।
इसके अलावा, गैर-यौन आपराधिक गतिविधियों के लिए डीपफेक का उपयोग किया जा रहा है, जैसे कि 2023 में डीपफेक तकनीक का उपयोग शामिल है: एक महिला के बच्चे की आवाज की नकल करना उसे डराना और जबरन वसूलना।
तकनीक का इस्तेमाल राजनीति में भी किया जाता है। उदाहरण के लिए, 2018 में, बेल्जियम के एक राजनीतिक दल ने पूर्व अमेरिकी राष्ट्रपति डोनाल्ड ट्रम्प का एक वीडियो प्रकाशित किया। एक भाषण में बेल्जियम को पेरिस जलवायु समझौते से वापस लेने का आह्वान किया। हालांकि, ट्रम्प ने वह भाषण कभी नहीं दिया, और यह सब नकली था।
इसी तरह की घटना पर हुआ यूजर्स राष्ट्रीय नेताओं के वीडियो बनाते हैं। जैसे बराक ओबामा, डोनाल्ड ट्रंप, जो बाइडेन या व्लादिमीर पुतिन। उपरोक्त बिंदुओं ने कई विश्लेषकों को यह विश्वास दिलाया है कि डीपफेक तकनीक वैश्विक राजनीति के परिदृश्य को बदल देगी क्योंकि लोगों को अधिक से अधिक सवाल करना होगा कि कैसे फर्क किया जाए। क्या वे चित्र और वीडियो वास्तविक हैं जो वे देखते हैं या सुनते हैं?
डीपफेक का पता कैसे लगाएं
1. क्या वीडियो का विवरण धुंधला या अस्पष्ट दिखता है? डीपफेक का पता लगाने की तकनीकों में से एक त्वचा, बाल या चेहरे की तलाश करना है जो वीडियो में पर्यावरण की तुलना में धुंधली दिख सकती है, या अस्वाभाविक रूप से नरम दिखने वाली त्वचा पर विचार करना है।
2. प्रकाश प्राकृतिक नहीं दिखता है, है ना? शुरुआत से ही यह समझाया गया था कि एक डीपफेक वीडियो दो या दो से अधिक वीडियो से मिलकर बना होता है, इसलिए हर वीडियो में लाइटिंग एक जैसी नहीं होगी। इसलिए, वीडियो की जांच करने का ऐसा तरीका प्रकाश की दिशा में एक विसंगति की तलाश करना है।
3. क्या शब्द या ध्वनियाँ चित्र से मेल खाती हैं? ऑडियो वीडियो में व्यक्ति के मुंह के आकार से मेल नहीं खा सकता है, खासकर अगर वीडियो नकली है, और उच्चारण अक्सर मेल नहीं खाता है।
4. क्या स्रोत विश्वसनीय दिखता है? एक तकनीक जो पत्रकार और शोधकर्ता अक्सर एक छवि के वास्तविक स्रोत को निर्धारित करने के लिए उपयोग करते हैं यह Google लेंस जैसे वेब पर पीछे की ओर की छवि की खोज करके तुरंत किया जा सकता है, साथ ही यह भी जांचकर कि छवि किसने पोस्ट की है। इसे कहां पोस्ट करें, और क्या वीडियो पोस्ट करना समझ में आता है?
हालांकि, डीपफेक वीडियो का पता लगाने का मुद्दा अभी भी टेक इंडस्ट्री के लोगों के बीच बहस का विषय है क्योंकि एआई का विकास लगातार इस हद तक बढ़ रहा है कि वॉल स्ट्रीट जर्नल रिपोर्टर अपना खुद का अवतार बनाएं और अपना पहला और अंतिम नाम बताकर बैंक के वॉयस बायोमेट्रिक सिस्टम के साथ इसका परीक्षण करें, इसके बाद अपने अवतार के साथ पत्रकार का ईमेल करें। आखिरकार, डीपफेक तकनीक से उत्पन्न होने वाली आवाज आवाज प्रमाणीकरण प्रणाली से भी गुजर सकती है।
इस मुद्दे ने कई विश्लेषकों को चिंता करने के लिए प्रेरित किया है कि अगर भविष्य में कृत्रिम बुद्धिमत्ता प्रणाली लोगों के क्लोन बना सकती है और चेहरे की पहचान और आवाज की पहचान के माध्यम से उनकी पहचान को सत्यापित कर सकती है, तो यह धोखेबाजों के लिए भविष्य में अवैध गतिविधियों को करने के लिए उपयोग करने का एक उपकरण हो सकता है। उदाहरण के लिए, वीडियो या ऑडियो क्लोनिंग के माध्यम से मशहूर हस्तियों को धोखा देना या प्रतिरूपण करना और फिर निर्दोष लोगों से पैसे धोना।
डीपफेक नियामक उपाय
पिछले साल कृत्रिम बुद्धिमत्ता प्रौद्योगिकी की प्रगति से होने वाले संभावित नुकसान को रोकने के लिए, चीनी सरकार ने डीपफेक के उपयोग को विनियमित करने वाले कानून बनाए, जिनमें शामिल हैं: मॉडल की सहमति प्राप्त की जानी चाहिए, वीडियो का उपयोग नकली समाचारों को प्रसारित करने के लिए नहीं किया जाना चाहिए, नकली वीडियो बनाने से पहले सिस्टम को सख्ती से सत्यापित किया जाना चाहिए, निर्माता को वीडियो को नकली वीडियो के रूप में स्पष्ट रूप से वॉटरमार्क करना चाहिए, और यह है राष्ट्रीय सुरक्षा कानूनों का उल्लंघन करने वाली वीडियो सामग्री बनाने के लिए मना किया गया।
में थाईलैंड का मामला कानूनी विद्वानों की राय है कि कंप्यूटर अपराध अधिनियम का उपयोग किया जा सकता है। धारा 14 और 16 में, यह निर्धारित किया गया है कि किसी अन्य व्यक्ति की तस्वीर का उपयोग, भले ही छवि बनाई गई हो, संपादित की गई हो या जोड़ी गई हो, या किसी भी तरह से। यदि इसे पुनर्प्रकाशित किया जाता है और शर्मिंदगी का कारण बनता है, तो यह 3 साल तक के कारावास और 200,000 baht से अधिक नहीं के जुर्माने से दंडनीय होगा।
इस बीच, यूरोपीय संघ (ईयू) सामान्य रूप से एआई के उपयोग को विनियमित करने के लिए कानून बनाने वाला पहला देश था, जो पहचान को सत्यापित करने और वास्तविक लोगों की ओर से लेनदेन करने के लिए डीपफेक तकनीक के उपयोग के बारे में चिंताओं को नियंत्रित करने के लिए आया है।
यूरोपीय संघ का एआई एसीटी कानून छह प्रमुख प्रतिबंधों को प्रतिबंधित करता है: बायोमेट्रिक वर्गीकरण प्रणाली, चेहरे की छवियों का अलक्षित स्क्रैपिंग, भावना पहचान, सामाजिक स्कोरिंग, एआई को मानव कार्यों का मार्गदर्शन करने और स्वतंत्रता को प्रतिबंधित करने के लिए डिज़ाइन किया गया है, और एआई किसी व्यक्ति की खामियों और कमजोरियों का फायदा उठाने के उद्देश्य से।
पारिभाषिक शब्दावली
- डीप न्यूरल नेटवर्क = कृत्रिम बुद्धिमत्ता की सीखने की विशेषताएं जो डेटा मान्यता के माध्यम से मानव सीखने की नकल करती हैं। सिस्टम भविष्य के रुझानों की भविष्यवाणी करने के लिए एक प्रशिक्षित डेटासेट के पैटर्न को दोहराता है।
- मशीन लर्निंग = मशीन बनाना, जो कंप्यूटर या इलेक्ट्रॉनिक उपकरण हैं, बड़े डेटा के साथ प्रशिक्षण के माध्यम से अपने दम पर जानकारी सीखने में सक्षम हैं।
- जनरेटिव एडवरसैरियल नेटवर्क (GAN) मूल छवियों और मशीन मस्तिष्क की गहरी शिक्षा के संयोजन के माध्यम से कृत्रिम बुद्धिमत्ता का सीखने और मीडिया निर्माण है और फिर बनाया गया है फ़ोटो, वीडियो या गीतों का एक नया सेट।