Voice Cloning: क्या है वॉयस क्लोनिंग और कैसे होता है इसका उपयोग
Voice Cloning: आपके परिवार वालों, दोस्तों, रिश्तेदारों, बच्चों या परिचितों की तो छोड़िए आपकी आवाज का इस्तेमाल भी आपके हक में या खिलाफ किया जा सकता है। देश के कई शहरों में अपनों की आवाज में आए फोन पर फाइनेंशियल फ्रॉड का शिकार बने लोगों की खबर नई नहीं है। हाल ही में सामने आई McAfee की रिपोर्ट के मुताबिक भारत में करीब 83 प्रतिशत लोग जब ऐसे हालात का सामना करते हैं तो अपने पैसे गंवा देते हैं।
सर्वे में शामिल देश के कुल लोगों में 69 प्रतिशत लोगों ने ऑरिजिनल और जेनरेटेड आवाज में फर्क करने में नाकामी का सामना किया। इसकी वजह है आर्टिफिशियल इंटेलिजेंस या कृत्रिम बुद्धिमत्ता या एआई तकनीक के सहारे आवाज की नकल या वॉयस क्लोनिंग। एआई वॉयस क्लोनिंग को वॉयस सिंथेसिस और वॉयस मिमिक्री के नाम से भी जाना जाता है। इस तकनीक में मशीन लर्निंग या आर्टिफिशियल इंटेलिजेंस का इस्तेमाल किसी की आवाज की नकल उतारने यानी वॉयस क्लोनिंग के लिए किया जाता है।

इन दिनों वॉयस क्लोनिंग के लिए काफी सारे पेड और फ्री टूल्स या सॉफ्टवेयर हैं, जिनका इस्तेमाल कर आसानी से वॉयस क्लोनिंग की जा सकती है। वॉयस क्लोनिंग का खतरा अब महज व्यक्तिगत या आर्थिक नुकसान तक ही नहीं रह गया है। हाल ही में सूडान सिविल वॉर में इसका सबसे बड़ा और खतरनाक दुरुपयोग सामने आया है।
सूडान सिविल वॉर में पूर्व राष्ट्रपति की वॉयस क्लोनिंग
सूडान सिविल वॉर में सामने आए ताजा समाचारों और पुख्ता तथ्यों के बीच एआई के जरिए वॉयस क्लोनिंग यानी आवाज की लगभग हूबहू नकल का बड़ा मामला दुनिया को दंग करने वाला है। बीबीसी की रिपोर्ट के मुताबिक सूडान के पूर्व राष्ट्रपति उमर अल-बशीर की कॉपी करने के लिए कृत्रिम बुद्धिमत्ता का इस्तेमाल करने वाले एक अभियान को टिकटॉक पर हजारों बार देखा गया है। इससे गृह युद्ध से टूटे हुए देश सूडान में ऑनलाइन भ्रम काफी बढ़ गया है।
टिकटॉक पर एक अनजान अकाउंट अगस्त के आखिरी दिनों से लगातार पूर्व राष्ट्रपति अल-बशीर की लीक हुई रिकॉर्डिंग का दावा करते हुए ऑडियो मैसेज पोस्ट कर रहा है। अकाउंट ने ऐसी दर्जनों क्लिप पोस्ट की हैं, लेकिन उन सबमें आवाज नकली है। बीबीसी मॉनिटरिंग टीम ने सूडान के विशेषज्ञों की एक टीम से परामर्श के दौरान सबूतों के दम पर पाया कि अल-बशीर के आवाज की नकल करने के लिए एआई से लैस ध्वनि रूपांतरण सॉफ़्टवेयर का इस्तेमाल किया गया है।
वॉयस क्लोनिंग कैसे होती है?
साइंस डिक्शनरी के अर्थ को सरल शब्दों में समझने की कोशिश करें तो वॉयस क्लोनिंग सॉफ़्टवेयर शक्तिशाली टूल होते हैं जो ऑडियो का एक टुकड़ा अपलोड होने के बाद उसे अलग-अलग या मनचाहे आवाज में बदल सकता है। एआई सॉफ्टवेयर ऑडियो तरंगों की तुलना कर ध्वनि और मौन में समान पैटर्न बना देता है।
एक बार जब आप वास्तविक वॉयस रिकॉर्डिंग का पर्याप्त बड़ा डेटा सेट इकट्ठा कर लेते हैं, तो वॉयस क्लोनिंग ऐप इस डेटा को संपादित या परिष्कृत करना शुरू कर देता है। डेटा को अलग-अलग ध्वनि तरंगों में विभाजित किया गया है ताकि एआई इसे समझकर उस पर प्रतिक्रिया कर सके। एआई फिर इन ध्वनि तरंगों को उनके संबंधित स्वर, भाषा में ध्वनि की सबसे छोटी इकाई, के साथ लेबल करता है।
तकनीकी शब्दावली में वॉयस क्लोनिंग को एक ऑडियो डीपफेक के रूप में भी जाना जाता है। यह एक प्रकार की एआई तकनीक है जिसका इस्तेमाल कई बार उन भाषणों के लिए वाक्य बनाने के लिए किया जाता है जो विशिष्ट लोगों द्वारा कही गई लगती है, जिसे उन्होंने नहीं कहा होता है। यह तकनीक प्रारंभ में मानव जीवन को बेहतर बनाने के लिए विभिन्न अनुप्रयोगों के लिए विकसित की गई थी। लेकिन जैसा ज्यादातर वैज्ञानिक आविष्कारों के साथ होता है, वॉयस क्लोनिंग के भी दुरुपयोग और उससे पैदा होने वाली चुनौतियां बढ़ गई हैं।
वॉयस क्लोनिंग से क्यों बढ़ रही हैं चुनौतियां
तकनीक के विशेषज्ञों का कहना है कि एआई तकनीक के मौजूदा दौर में इस तरह के वॉयस क्लोनिंग अभियान बेहद अहम हो गए हैं। क्योंकि वे दिखाते हैं कि कैसे नए उपकरण सोशल मीडिया के माध्यम से नकली सामग्री या फेक कंटेंट को बेहद सस्ती लागत में और काफी तेजी से चारों और फैला सकते हैं। अमेरिका में कैलिफोर्निया विश्वविद्यालय, बर्कले में डिजिटल फोरेंसिक पर शोध करने वाले हनी फरीद कहते हैं कि वॉयस क्लोनिंग परिष्कृत या संपादित ऑडियो और वीडियो हेरफेर तकनीक तक पहुंच का लोकतंत्रीकरण या सामान्यीकरण है, जिसने मुझे सबसे ज्यादा चिंतित किया है।
पहले यहां तकनीकी जानकार या विशेषज्ञ परिष्कृत या संपादित ऑडियो वास्तविकता को विकृत करने में सक्षम रहे हैं, लेकिन अब कम तकनीकी विशेषज्ञता वाला औसत व्यक्ति भी जल्दी और आसानी से नकली सामग्री बना सकता है। इन सब मामले को लेकर एआई विशेषज्ञ लंबे समय से चिंतित हैं कि नकली वीडियो और ऑडियो से गलत सूचना या फेक न्यूज की लहर पैदा होगी, जिससे दुनिया के कई देशों में अशांति फैल सकती है और लोकतांत्रिक चुनाव बाधित हो सकते हैं।
कैसे कर सकते हैं वॉयस क्लोनिंग की पहचान
नॉर्थईस्टर्न यूनिवर्सिटी के सिविक एआई लैब के शोधकर्ता मोहम्मद सुलेमान कहते हैं कि चिंताजनक बात यह है कि इस तरह की वॉयस क्लोनिंग या ऑडियो रिकॉर्डिंग या मिक्सिंग एक ऐसा माहौल भी बना सकती हैं जहां ज्यादातरक लोग वास्तविक रिकॉर्डिंग पर भी विश्वास नहीं कर पाएंगे। इसलिए वॉयस क्लोनिंग के जरिए ऑडियो-आधारित दुष्प्रचार का पता लगाने की तकनीकों का सामान्य लोगों तक पहुंच सुनिश्चित करना आवश्यक हो गया है।
वॉयस क्लोनिंग की पहचान करने का सबसे पहला कदम उस पर शक करना है। यह देखना जरूरी है कि उसको जारी करने वाला मूल स्त्रोत क्या है। ऐसे किसी क्लिप को व्यक्तिगत या समूह में साझा करने से पहले खुद से यह सवाल करना चाहिए कि क्या यह वॉयस रिकॉर्डिंग विश्वसनीय लगती है। निजी तौर पर तो अनजाने लिंक्स वगैरह पर क्लिक नहीं करने और पैसे की लेनदेन वगैरह की बातों में अतिरिक्त सावधान रहने से बचा जा सकता है। हालांकि, ऑडियो या वॉयस को तब वेरिफाई करना मुश्किल हो जाता है, जब वह किसी मैसेजिंग ऐप्स पर ब्रॉडकास्ट होती है।
सिंथेटिक ऑडियो को पहचानने के लिए प्रशिक्षित एल्गोरिदम बनाने की तकनीक फिलहाल अपने विकास के शुरुआती चरण में है, जबकि वॉयस क्लोनिंग की तकनीक पहले से ही काफी विकसित और उन्नत है। इसलिए सामाजिक अशांति के समय में यह और भी अधिक चुनौतीपूर्ण हो जाता है। आखिर में अहम बात, इंसान की तरह मशीनी आवाज में इमोशन क्रिएट करने का काम वॉयस क्लोनिंग से नहीं हो पाता है।












Click it and Unblock the Notifications