মাইক্রোসফ্টের গবেষকরা একটি নতুন কৃত্রিম সরঞ্জাম প্রদর্শন করেছেন যা অত্যন্ত প্রাণবন্ত মানব অবতার তৈরি করতে পারে তবে গভীর জাল বিষয়বস্তু প্রচারের বিষয়ে উদ্বেগ উল্লেখ করে জনসাধারণের জন্য এই সরঞ্জামটি উপলব্ধ করার জন্য একটি সময়সূচী প্রদান করেনি।
VASA-1 নামক একটি এআই মডেল (যা “ভিজ্যুয়াল অ্যাফেক্টিভ স্কিল” এর জন্য দাঁড়ায়) একজন ব্যক্তির কথা বলার অ্যানিমেটেড ভিডিও তৈরি করতে পারে, ঠোঁটের নড়াচড়াগুলিকে সিঙ্ক্রোনাইজ করে, সহজভাবে ব্যবহার করে একক চিত্র এবং বক্তৃতার একটি অডিও ক্লিপ।
বিভ্রান্তি গবেষকরা উদ্বিগ্ন যে কৃত্রিম বুদ্ধিমত্তা-চালিত অ্যাপ্লিকেশনগুলি একটি গুরুত্বপূর্ণ নির্বাচনী বছরে “ডিপফেক” ছবি, ভিডিও এবং অডিও ক্লিপ তৈরি করতে অপব্যবহার করা হতে পারে।
মাইক্রোসফ্ট রিসার্চ এশিয়ার এই সপ্তাহে প্রকাশিত VASA-1 প্রতিবেদনের লেখকরা লিখেছেন, “আমরা প্রকৃত মানুষদের সম্পর্কে বিভ্রান্তিকর বা ক্ষতিকারক সামগ্রী তৈরি করার যে কোনও প্রচেষ্টার বিরোধিতা করি।”
“আমরা মানব কল্যাণের অগ্রগতির লক্ষ্যে দায়িত্বের সাথে কৃত্রিম বুদ্ধিমত্তা বিকাশের জন্য প্রতিশ্রুতিবদ্ধ,” তারা বলে।
“আমাদের অনলাইন ডেমো, এপিআই, পণ্য, অন্যান্য বাস্তবায়নের বিশদ, বা সংশ্লিষ্ট কোনো পণ্য প্রকাশ করার কোনো পরিকল্পনা নেই যতক্ষণ না আমরা নিশ্চিত না হচ্ছি যে প্রযুক্তিটি দায়িত্বশীলভাবে এবং যথাযথ নিয়ম মেনে ব্যবহার করা হবে।”
মাইক্রোসফ্ট গবেষকরা বলছেন যে প্রযুক্তিটি মুখের সূক্ষ্মতা এবং প্রাকৃতিক মাথার নড়াচড়ার বিস্তৃত পরিসর ক্যাপচার করতে পারে।
“এটি মানুষের কথোপকথনমূলক আচরণকে অনুকরণ করে এমন প্রাণবন্ত অবতারের সাথে রিয়েল-টাইম মিথস্ক্রিয়া করার পথ প্রশস্ত করে,” গবেষকরা পোস্টে বলেছেন।
মাইক্রোসফটের মতে, VASA শৈল্পিক ছবি, গান এবং অ-ইংরেজি বক্তৃতা পরিচালনা করতে পারে।
গবেষকরা প্রযুক্তির সম্ভাব্য সুবিধার কথা বলেছেন, যেমন শিক্ষার্থীদের জন্য ভার্চুয়াল শিক্ষক প্রদান করা বা যাদের প্রয়োজন তাদের চিকিৎসা সহায়তা প্রদান করা।
“এটি বিভ্রান্তি বা প্রতারণা করার উদ্দেশ্যে সামগ্রী তৈরি করার উদ্দেশ্যে নয়,” তারা বলেছে৷
VASA ভিডিওগুলিতে এখনও “আর্টিফ্যাক্ট” রয়েছে যা পরামর্শ দেয় যে সেগুলি কৃত্রিম বুদ্ধিমত্তা দ্বারা তৈরি করা হয়েছে, পোস্টে বলা হয়েছে।
ProPublica-এর প্রযুক্তি প্রধান বেন ওয়ের্ডমুলার বলেছেন যে তিনি “প্রথমবার জুম মিটিংয়ে তাদের প্রতিনিধিত্ব করার জন্য কেউ এটি ব্যবহার করছেন শুনে রোমাঞ্চিত হয়েছেন।”
“লাইক, এটা কেমন চলছে? কেউ কি লক্ষ্য করেছে?
ChatGPT নির্মাতা ওপেনএআই মার্চ মাসে “স্পিচ ইঞ্জিন” নামে একটি ভয়েস ক্লোনিং টুল প্রকাশ করেছে যা 15-সেকেন্ডের অডিও নমুনার উপর ভিত্তি করে কারো ভয়েস কপি করতে পারে।
কিন্তু কোম্পানি বলেছে যে “সংশ্লেষিত বক্তৃতার অপব্যবহারের সম্ভাবনার কারণে, এটি ব্যাপক প্রকাশের জন্য একটি সতর্ক এবং অবহিত পদ্ধতি গ্রহণ করছে।”
এই বছরের শুরুর দিকে, ডেমোক্র্যাটিক রাষ্ট্রপতি প্রার্থীর পক্ষে কাজ করা একজন পরামর্শদাতা স্বীকার করেছেন যে তিনি নিউ হ্যাম্পশায়ারের ভোটারদের কাছে জো বিডেনের ছদ্মবেশী একটি রোবোকলের পিছনে ছিলেন, তিনি বলেছিলেন যে তিনি কৃত্রিম বুদ্ধিমত্তার বিপদগুলি তুলে ধরার চেষ্টা করছেন।
রাজ্যের জানুয়ারী প্রাইমারিতে ভোট না দেওয়ার জন্য বিডেনের মতো শোনানো এই আহ্বানটি বিশেষজ্ঞদের উদ্বিগ্ন করেছে যারা 2024 সালের হোয়াইট হাউসের দৌড়ে এআই-চালিত প্রচারণার ভয়ে ভয় পায়।
© 2024 এএফপি
উদ্ধৃতি: মাইক্রোসফট লাইফলাইক অবতার এআই প্রযুক্তি টিজ করে কিন্তু রিলিজ ডেট দেয় না (2024, এপ্রিল 20), সংগৃহীত 20 এপ্রিল, 2024 https://techxplore.com/news/2024-04-microsoft- lifelike-avatar-ai-tech। html
এই নথিটি কপিরাইট দ্বারা সুরক্ষিত। ব্যক্তিগত অধ্যয়ন বা গবেষণার উদ্দেশ্যে ন্যায্য লেনদেনের স্বার্থ ছাড়া লিখিত অনুমতি ছাড়া কোনো অংশ পুনরুত্পাদন করা যাবে না। বিষয়বস্তু শুধুমাত্র রেফারেন্স জন্য.
(ট্যাগস-অনুবাদ
উৎস লিঙ্ক