অ্যালেক্সায় আসছে কণ্ঠ নকলের সক্ষমতা, অপরাধীদের পোয়াবারো!
২০১৯ সালে ওয়ার্ল্ড স্ট্রিট জার্নালে প্রকাশিত একটি ঘটনা: ব্রিটেনের একটি প্রতিষ্ঠানের এক কর্মীর কাছে তার বসের একটি নির্দেশনা এলো। সে মোতাবেক তিনি দুই লাখ বিশ হাজার ইউরো (দু লাখ ৬০ হাজার ডলার) একজন ব্যাক্তিতে পাঠিয়েছেন। পরে জানা গেল যার কাছে টাকা পাঠানো হয়েছে তিনি একজন প্রতারক। তিনি তার বসের ভয়েস ক্লোনিং করে করে অর্থ প্রেরণের নির্দেশ দিয়েছিলেন।
বিবিসির বাণিজ্য বিষয়ক সংবাদদাতা কিট্টি পালমাই-এর একটি প্রতিবেদন থেকে এ সংক্রান্ত আরও একটি ঘটনার কথা জানা যায়। ঘটনাটি এমন: টিম হেলার ছিলেন অ্যামেরিকার টেক্সাসের একজন ভয়েস আর্টিস্ট এবং অভিনেতা। প্রথম যখন তিনি তার নিজের কণ্ঠের ক্লোনিং শোনেন বিস্ময়ে তিনি বলেন, ‘আমার চোয়াল মাটিতে গিয়ে ঠেকেছিল... অবিশ্বাস্যরকম মিল দেখে আমার মাথা ঘুরে গিয়েছিল।’
ভয়েস ক্লোনিংয়ের মাধ্যমে প্রতারণার এমন ঘটনা মোটেও কম নয়। প্রযুক্তির উন্নয়নের সঙ্গে পাল্লা দিয়ে ডিজিটাল এসব প্রতারণার মাত্রা দিন দিন বেড়েই চলেছে। ডিজিটাল প্রযুক্তি ব্যবহার করে যেসব ভুয়া ভিডিও তৈরি করা হয়, সেগুলোর মতো এভাবে হুবহু নকল করা কণ্ঠকেও ‘ডিপফেক’ বলা হয়।
ভয়েস ক্লোনিং বিষয়ে ভোকালআইডি প্রতিষ্ঠানের প্রধান নির্বাহী রুপাল প্যাটেল জানান, চিকিৎসা কাজকে আরও এগিয়ে নিতে তিনি ২০১৪ সালে ভয়েস ক্লোনিং ব্যবসা গড়ে তোলেন।
তিনি বলেন, ‘অসুস্থতা কিংবা কোনো বড় ধরনের অপারেশনের পর যারা কথা বলার ক্ষমতা হারিয়েছেন তাদের উপর ভিত্তি করেই এই প্রযুক্তি প্রতিষ্ঠান তৈরি করেন তিনি। গত কয়েক বছরে এই প্রযুক্তির উন্নয়ন সাধিত হওয়ায় মানুষের কণ্ঠস্বর হুবহু নকল করা সম্ভব বলে জানান তিনি।’
নতুন করে এই আলোচনার পারদকে আরও একটু বাড়ালেন অ্যালেক্সা। রয়টার্সের প্রতিবেদনে বলা হয়েছে, ‘অ্যামাজন নাকি ভয়েস অ্যাসিস্টেন্ট অ্যালেক্সাকে যে কারও কণ্ঠ নকল করার সক্ষমতা দিতে যাচ্ছে। যদি এই খবর সত্য হয়, তবে এক মিনিটেরও কম সময়ে অডিও ফাইল শুনে তার অনুকরণে কন্ঠস্বর পাল্টাতে পারবে অ্যালেক্সা।’
রয়টার্স বলছে, ‘অ্যামাজনের এই প্রজেক্ট সফল হলে বিষয়টি এক প্রকার এমন হবে যেন পরিবারের প্রয়াত সদস্যদের কন্ঠ নিয়মিতই শোনার সুযোগ পাবেন অন্য সদস্যরা।’
বিষয়টির সত্যতা নিশ্চিত করেছেন অ্যামাজনের জ্যেষ্ঠ ভাইস প্রেসিডেন্ট রোহিত প্রাসাদ। বুধবার (২২ জুন) যুক্তরাষ্ট্রের লাস ভেগাসে অনুষ্ঠিত এক সম্মেলনে তিনি বলেন, ‘অতিমারী করোনায় যারা তাদের পরিবারের সদস্যদের হারিয়েছে, তাদের স্মৃতি ধরে রাখতে এই উদ্দ্যোগ।’
এর মাধ্যমে এক মিনিটেরও কম সময়ে অডিও শুনে যে কোনো কণ্ঠ নকল করতে পারে এমন সক্ষমতা দিয়েই অ্যামাজন নতুন প্রযুক্তি নির্মাণ করা হচ্ছে বলেও জানান তিনি।
রয়টার্সের প্রতিবেদনে লাস ভেগাসের সম্মেলনে অ্যামাজন কণ্ঠ নকলের ফিচার সংক্রান্ত একটি ভিডিও দেখিয়েছে বলে জানানো হয়েছে।
ভিডিওতে দেখা যায়, এক শিশু প্রশ্ন করছে, ‘অ্যালেক্সা, দাদীমা কি আমাকে উইজার্ড অফ অজ পড়ে শোনানো শেষ করতে পারবে?’
এক মুহূর্ত পরেই অ্যালেক্সা ওই শিশুর নির্দেশ নিশ্চিত করে নিজের কণ্ঠস্বর পাল্টে ফেলে উইজার্ড অফ অজ পড়ে শোনানো শুরু করে।
বাক প্রতিবন্ধীদের সহায়তায় এই প্রযুক্তির প্রয়োগের কথা বলা হলেও সফটওয়্যারটির অপব্যবহার রোধে মাইক্রোসফট এর ক্রেতা নির্বাচনে বিধি-নিষেধ আরোপ করেছে। তবে, ফিচারটি কবে নাগাদ বাজারে আসতে পারে, রয়টার্সের সে প্রশ্নের উত্তর দেয়নি অ্যামাজন।
ভয়েস ক্লোনিং এর বিপদ কোথায়?
বিবিসির এক প্রতিবেদনে সাইবার নিরাপত্তা বিশেষজ্ঞ এডি ববরিটস্কি বলেছেন, ‘এতদিন পর্যন্ত যখন আমরা ফোনে কারো সঙ্গে কথা বলতাম, আমরা অন্তত এটুকু নিশ্চিন্ত থাকতে পারতাম যে যার সঙ্গে কথা বলছি সে আমার পরিচিত কণ্ঠ-তাকে অন্তত বিশ্বাস করা যায়।’ কিন্তু এই প্রযুক্তি সেই বিশ্বাসের জায়গাও দখল করে নিয়েছে। এ ধরনের কৃত্রিম কণ্ঠ ব্যবহারের ‘ব্যাপক নিরাপত্তা ঝুঁকি’ রয়েছে।
সাইবার বিশেষজ্ঞরা বলছেন, ‘এই প্রযুক্তির সহজলভ্যতা সাইবার অপরাধীদের অনেক কাজ সহজ করে দেবে। ভয়েস ক্লোনিং করে বস কিংবা কোনো সংস্থার প্রধান হয়ে স্পর্শকাতর তথ্য নেওয়া আগের যে কোন প্রযুক্তির তুলনায় সহজতর হবে।’
প্রযুক্তিবিষয়ক সাইট এনগ্যাজেট এর প্রতিবেদনে বলা হয়েছে, ‘ভয়েস ক্লোনিং সফটওয়্যারের মাধ্যমে ২০২০ সালে সংযুক্ত আরব আমিরাতে দূষ্কৃতিকারীরা একটি ব্যাংকের ম্যানেজারকে বোকা বানিয়ে ৩৫ মিলিয়ন ডলার ট্রান্সফার করিয়েছিল।’
অপরাধীদের মোকাবেলায় করণীয় কি?
কৃত্রিম বুদ্ধিমত্তা বিষয়ে বিশেষজ্ঞ ওয়েবসাইট ভেনচার বিট তাদের প্রতিবেদনে বলছে, বিশ্বের বড় বড় টেক জায়ান্টরা এই প্রযুক্তির বিপরীতে নতুন প্রযুক্তি তৈরির বিষয়ে কাজ করছে।
জানা গেছে, এই কোম্পানিগুলো এমন প্রযুক্তি তৈরি করছে যা দিয়ে কোনো অডিও ভুয়া কি-না তা পরীক্ষা করা যাবে। কোনো কথা অস্বাভাবিকভাবে একাধিকবার ব্যবহার করা হয়েছে কি-না, কিংবা কণ্ঠের পেছনে এমনকি হালকা ডিজিটার শব্দ আছে কি-না, এছাড়া কিছু শব্দ বা বাক্যের গঠন এসব পরীক্ষা করার ব্যবস্থা দিয়ে এই পাল্টা প্রযুক্তি গড়ে তোলা হচ্ছে।
সাইবার বিশেষজ্ঞ সুমন আহমেদ সাবির বাংলাভিশনকে বলেন, ‘এই প্রযুক্তির পজিটিভ-নেগেটিভ দুটোই বিদ্যামান। আপনি কীভাবে ব্যবহার করছেন সেটাই বিষয়।
প্রযুক্তি জায়ান্টারা ইতোমধ্যে ভবিষ্যত ব্যবসার জন্য এই প্রযুক্তিতে বিনিয়োগ করেছেন। একজন নির্দিষ্ট ব্যাক্তিকে দিয়ে মাল্টি রোল প্লে করতে এই প্রযুক্তি যথেষ্ট ভূমিকা রাখবে বিশেষ ভয়েস আর্টিস্টের ক্ষেত্রে।
সাধারণত মানুষের চোখ দিয়ে দেখে বা শুনে এসব ভয়েস ক্লোনিং শনাক্ত অত্যন্ত দুরুহ। এসব ভূয়া ভয়েস ক্লোনিংকে শনাক্ত করতে বিপরীতধর্মী প্রযুক্তি তৈরি হয়েছে। তবে, এই প্রযুক্তি এখনও সহজলভ্য হয়ে ওঠেনি বলে জানান এই বিশেষজ্ঞ।
ব্যক্তিমাত্রই বিশেষ করে আর্থিক লেনদেন বা স্পর্শকাতর বিষয়ে শুধু অডিও বার্তায় নির্ভর না করাই যুক্তিযুক্ত।
সুত্র: বিবিসি, টেকক্রান্চ, রয়টার্স, এনগ্যাজেট
বিভি/এসএইচ/এনএ
মন্তব্য করুন: