ডিপফেক ভয়েস সম্পর্কে সবকিছু
সাইবারসিকিউরিটি আর মিডিয়া জগতে ডিপফেক এখন গরম আলোচনার বিষয়। এই প্রযুক্তি পর্নোগ্রাফি, ভুয়া খবর, এমনকি অর্থনৈতিক প্রতারণাতেও ব্যবহার হচ্ছে। কারও অনুমতি ছাড়া তার চেহারা আর কণ্ঠস্বর ব্যবহার নতুন চ্যালেঞ্জ তৈরি করেছে, যদিও এটি কৃত্রিম বুদ্ধিমত্তার অগ্রগতির বড় উদাহরণ। তবে বিতর্কও কম নয়।
ডিপফেক ভয়েস কী?
ডিপফেক ভয়েস মানে এমন কণ্ঠ, যা আসল মানুষের কণ্ঠের মতই শোনায়। কৃত্রিম হলেও স্বর, উচ্চারণ, গতি আর আলাদা বৈশিষ্ট্যগুলো খুব নিখুঁতভাবে নকল করতে পারে।
ডিপফেক ভয়েস বা ভয়েস ক্লোনিং তৈরিতে এআই আর শক্তিশালী কম্পিউটিং ক্ষমতা লাগে। কারও কণ্ঠ ক্লোন করতে অনেক সময়, কখনও সপ্তাহও লেগে যেতে পারে। বিশেষ সফটওয়্যারের পাশাপাশি দরকার প্রশিক্ষণ ডেটা, অর্থাৎ টার্গেট ব্যক্তির যথেষ্ট কণ্ঠ রেকর্ডিং।
এটি কিছুটা টেক্সট-টু-স্পিচ সফটওয়্যার এর মত, তবে টিটি এস সাধারণত প্রাকৃতিক কণ্ঠ তৈরি করে, নির্দিষ্ট কারও কণ্ঠ হুবহু অনুকরণ করে না।
নিজের জন্য অডিওবুক, ভয়েসওভার ইত্যাদির কাজে কণ্ঠ ক্লোন করা স্বাভাবিক, কিন্তু অন্যের অনুমতি ছাড়া ডিপফেক ভয়েস বানানো বড় ধরনের সমস্যা।
ডিপফেক ভয়েসের ঝুঁকি
ভয়েস অথেন্টিকেশন একসময় সায়েন্স ফিকশনের গল্পে থাকলেও, এখন বাস্তবতা—কিন্তু খুব একটা নিরাপদ নয়। ডিপফেক প্রযুক্তি যত এগোচ্ছে, স্ক্যামারদের হাতেও তত বেশি অস্ত্র যাচ্ছে।
২০২০ সালে এক ব্যাংক ম্যানেজার পরিচিত এক কোম্পানির ডিরেক্টর ভেবে ফোন রিসিভ করেন। শুধু কণ্ঠ শুনে ৩৫ মিলিয়ন ডলার ট্রান্সফারের অনুমোদনও দেন, টেরই পাননি এটি ছিল ক্লোনড ভয়েস।
ফোর্বসও এমন ঘটনার কথা লিখেছে—ইউকে–র একটি এনার্জি কোম্পানি ডিপফেক কণ্ঠের ফাঁদে পড়ে বড় অঙ্কের প্রতারণার শিকার হয়।
এখন কারও কণ্ঠের পরিষ্কার রেকর্ডিং পাওয়া খুব সহজ—রেকর্ডার, অনলাইন সাক্ষাৎকার, প্রেস কনফারেন্স ইত্যাদির মাধ্যমে। ভয়েস সংগ্রহের প্রযুক্তিও উন্নত হচ্ছে, ফলে ডেটা যত নিখুঁত হচ্ছে, ডিপফেকও তত বেশি বিশ্বাসযোগ্য হয়ে উঠছে।
এখনও কোনো সাইবারসিকিউরিটি টুলই ১০০% নির্ভরযোগ্যভাবে অডিও ডিপফেক শনাক্ত করতে পারে না।
শ্রেষ্ঠ ডিপফেক ভয়েস সফটওয়্যার
Speechify
এই তালিকার অন্য টুলগুলোর মত নয়, Speechify Voice Over কোনো ভয়েস ক্লোনিং অ্যাপ নয়। তবে টেক্সট-টু-স্পিচ সফটওয়্যারটি আধুনিক এআই দিয়ে খুব প্রাকৃতিক আর মানবসদৃশ কণ্ঠ তৈরি করতে পারে। এতে তৈরি কণ্ঠের বড় লাইব্রেরি আছে এবং বিভিন্ন সেটিংস দিয়ে একেবারে নতুন কণ্ঠও বানানো যায়।
টেক্সট থেকে কণ্ঠে রূপান্তর ব্যবহারকারীদের পড়ার পাশাপাশি শুনতেও দেয়, আবার পডকাস্ট বানাতেও সাহায্য করে। আপনি চাইলে এতে মার্কেটিং, গ্রাহক সেবা, বা যেকোনো ধরনের অডিও বার্তা তৈরি করতে পারবেন।
Resemble
Resemble AI অন্যতম শক্তিশালী ডিপফেক অডিও সফটওয়্যার। এর ক্লোনিং টুল খুব কম ডেটা দিয়েই কাজ চালিয়ে নিতে পারে।
Resemble ব্যবহার করে নিজের কণ্ঠ ক্লোন করা যায়। এতে বিজ্ঞাপনের অডিও, পডকাস্ট স্ক্রিপ্ট ইত্যাদি বানানো খুবই সহজ। এটি বহু ভাষা সমর্থন করে, আর কণ্ঠের স্বর, আবেগ, মড্যুলেশনও ইচ্ছেমত নিয়ন্ত্রণ করা যায়।
Descript
Descript একটি ভয়েস ক্লোনিং টুল, যাতে উন্নত এডিটিং সুবিধা আছে। ট্রান্সক্রিপ্ট বা অডিও ক্লিপ থেকে খুব বাস্তবসম্মত কণ্ঠ তৈরি করা যায়।
Descript শেখা একটু কঠিন হলেও, এর উন্নত কাস্টমাইজেশন, স্ক্রিন রেকর্ডার আর মাল্টিট্র্যাক এডিটিং ফিচার দিয়ে দারুণ মানের, প্রায় বাস্তবের মত কণ্ঠ তৈরি করা সম্ভব।
ReSpeecher
রিয়েল মানুষের কণ্ঠের মত এআই কণ্ঠ বানাতে মেশিন লার্নিং ব্যবহার এখন অনেক সম্ভাবনাময় ব্যবসা। ‘দ্য ম্যান্ডালোরিয়ান’ সিরিজে লুক স্কাইওয়াকার চরিত্রের কণ্ঠ বানাতে Lucasfilm ‘ReSpeecher’ ব্যবহার করেছে।
এটা দেখায়, কিছু সফটওয়্যার শুধু ছোট সোশ্যাল ক্লিপের বাইরে গিয়েও কত কিছু করতে পারে। ReSpeecher খুব উচ্চমানের স্পিচ তৈরি করে এবং মানব কণ্ঠ নকল করতে বেশ দক্ষ।
রিয়েল-টাইম ভয়েস ক্লোনিং
সবাই ReSpeecher কিনতে পারেন না, বা লম্বা কিউতে দাঁড়িয়ে থাকতে চান না। রিয়েল-টাইম ভয়েস ক্লোনিং ওপেন-সোর্স, আর GitHub-এ সবার জন্য ফ্রি উন্মুক্ত।
পুরোপুরি অন্য কারও কণ্ঠে সাবলীলভাবে কাজ করানো কিছুটা ঝামেলার হলেও ছোট অডিও ক্লিপে কাজ চলে যায়। মাঝেমধ্যে এতেই আলেক্সাকে বিভ্রান্ত করা যায়, আবার কফি কলেও ব্যবহার করে দেখতে পারেন।
iSpeech
iSpeech আরেকটি ফ্রি ভয়েস জেনারেটর, যা ক্লোনিং–এর দিকেই বেশি ঝুঁকে। এতে উন্নত স্পিচ রিকগনিশন আর টেক্সট-টু-স্পিচ রিডার আছে। এখানে সেলিব্রিটির মত শোনায় এমন কণ্ঠও পাওয়া যায়।
iSpeech দিয়ে নিজের ডিপফেক কণ্ঠ বানানো, টেমপ্লেট তৈরি আর অডিও রেকর্ড করা যায়। এটি বহুমুখী টুল, যদিও সব সময় খুব বেশি বাস্তব মনে নাও হতে পারে। নতুনদের জন্য চেনা–জানা হয়ে ওঠার অ্যাপ হিসেবেও ভালো।
Speechify – মানবসদৃশ স্বর তৈরি করুন
Speechify ডিপ লার্নিং ব্যবহার করে মানবসদৃশ স্বর জেনারেট করে, নির্দিষ্ট কারও কণ্ঠ অনুকরণ না করেই। ডিপফেক নিয়ে সাইবারসিকিউরিটির ঝুঁকি থাকলেও, টিটি এস সাধারণত অনেক বেশি উপকারী।
Speechify Voice Over Studio ব্যবহার করুন পডকাস্ট বা বর্ণনা তৈরিতে, কঠিন লেখা শুনে বোঝার জন্য, নতুন ভাষা শেখা আর আরও নানা কাজে।
প্রায় জিজ্ঞাসিত প্রশ্ন
FakeYou কি ফ্রি?
FakeYou সীমিত ফ্রি এআই ভয়েস জেনারেটর। এখানে অনেক সেলিব্রিটির মত শোনায় এমন কণ্ঠের কালেকশন আছে, যদিও রূপান্তরে অনেক সময় বেশি সময় লাগতে পারে। ব্রাউজারে ব্যবহার করাও বেশ সহজ।
ডিপফেক ভয়েস শনাক্ত করবেন কিভাবে?
ডিপফেক ভয়েস শনাক্তে উন্নত সফটওয়্যার আর হার্ডওয়্যার লাগে, যা স্পিচ প্যাটার্ন, ব্যাকগ্রাউন্ড আর অন্যান্য সূক্ষ্ম উপাদান বিশ্লেষণ করে।
ডিপফেক ও ভয়েস সিন্থেসাইজারে পার্থক্য কী?
ডিপফেক মানে ক্লোন করা কণ্ঠ, যেখানে নির্দিষ্ট একজনের কণ্ঠ নকল করা হয়। আর ভয়েস সিন্থেসাইজার সাধারণত বাণিজ্যিক কাজে ব্যবহারের জন্য মানবসদৃশ, কিন্তু নিরপেক্ষ কণ্ঠ তৈরি করে।

