Home শিক্ষা মাইক্রোসফ্ট লাইফলাইক অবতার এআই প্রযুক্তির পূর্বরূপ দেখায়, তবে প্রকাশের তারিখ দেয় না

শিক্ষা

মাইক্রোসফ্ট লাইফলাইক অবতার এআই প্রযুক্তির পূর্বরূপ দেখায়, তবে প্রকাশের তারিখ দেয় না

April 20, 2024

মাইক্রোসফ্ট গবেষকরা বলছেন যে তারা একটি কৃত্রিম বুদ্ধিমত্তা মডেল তৈরি করেছে যা অবতারদের বাস্তবসম্মত কথোপকথন করতে দেয়, মুখের অভিব্যক্তির সাথে সম্পূর্ণ।

মাইক্রোসফ্টের গবেষকরা একটি নতুন কৃত্রিম সরঞ্জাম প্রদর্শন করেছেন যা অত্যন্ত প্রাণবন্ত মানব অবতার তৈরি করতে পারে তবে গভীর জাল বিষয়বস্তু প্রচারের বিষয়ে উদ্বেগ উল্লেখ করে জনসাধারণের জন্য এই সরঞ্জামটি উপলব্ধ করার জন্য একটি সময়সূচী প্রদান করেনি।

VASA-1 নামক একটি এআই মডেল (যা “ভিজ্যুয়াল অ্যাফেক্টিভ স্কিল” এর জন্য দাঁড়ায়) একজন ব্যক্তির কথা বলার অ্যানিমেটেড ভিডিও তৈরি করতে পারে, ঠোঁটের নড়াচড়াগুলিকে সিঙ্ক্রোনাইজ করে, সহজভাবে ব্যবহার করে একক চিত্র এবং বক্তৃতার একটি অডিও ক্লিপ।

বিভ্রান্তি গবেষকরা উদ্বিগ্ন যে কৃত্রিম বুদ্ধিমত্তা-চালিত অ্যাপ্লিকেশনগুলি একটি গুরুত্বপূর্ণ নির্বাচনী বছরে “ডিপফেক” ছবি, ভিডিও এবং অডিও ক্লিপ তৈরি করতে অপব্যবহার করা হতে পারে।

মাইক্রোসফ্ট রিসার্চ এশিয়ার এই সপ্তাহে প্রকাশিত VASA-1 প্রতিবেদনের লেখকরা লিখেছেন, “আমরা প্রকৃত মানুষদের সম্পর্কে বিভ্রান্তিকর বা ক্ষতিকারক সামগ্রী তৈরি করার যে কোনও প্রচেষ্টার বিরোধিতা করি।”

“আমরা মানব কল্যাণের অগ্রগতির লক্ষ্যে দায়িত্বের সাথে কৃত্রিম বুদ্ধিমত্তা বিকাশের জন্য প্রতিশ্রুতিবদ্ধ,” তারা বলে।

“আমাদের অনলাইন ডেমো, এপিআই, পণ্য, অন্যান্য বাস্তবায়নের বিশদ, বা সংশ্লিষ্ট কোনো পণ্য প্রকাশ করার কোনো পরিকল্পনা নেই যতক্ষণ না আমরা নিশ্চিত না হচ্ছি যে প্রযুক্তিটি দায়িত্বশীলভাবে এবং যথাযথ নিয়ম মেনে ব্যবহার করা হবে।”

মাইক্রোসফ্ট গবেষকরা বলছেন যে প্রযুক্তিটি মুখের সূক্ষ্মতা এবং প্রাকৃতিক মাথার নড়াচড়ার বিস্তৃত পরিসর ক্যাপচার করতে পারে।

“এটি মানুষের কথোপকথনমূলক আচরণকে অনুকরণ করে এমন প্রাণবন্ত অবতারের সাথে রিয়েল-টাইম মিথস্ক্রিয়া করার পথ প্রশস্ত করে,” গবেষকরা পোস্টে বলেছেন।

মাইক্রোসফটের মতে, VASA শৈল্পিক ছবি, গান এবং অ-ইংরেজি বক্তৃতা পরিচালনা করতে পারে।

গবেষকরা প্রযুক্তির সম্ভাব্য সুবিধার কথা বলেছেন, যেমন শিক্ষার্থীদের জন্য ভার্চুয়াল শিক্ষক প্রদান করা বা যাদের প্রয়োজন তাদের চিকিৎসা সহায়তা প্রদান করা।

“এটি বিভ্রান্তি বা প্রতারণা করার উদ্দেশ্যে সামগ্রী তৈরি করার উদ্দেশ্যে নয়,” তারা বলেছে৷

VASA ভিডিওগুলিতে এখনও “আর্টিফ্যাক্ট” রয়েছে যা পরামর্শ দেয় যে সেগুলি কৃত্রিম বুদ্ধিমত্তা দ্বারা তৈরি করা হয়েছে, পোস্টে বলা হয়েছে।

ProPublica-এর প্রযুক্তি প্রধান বেন ওয়ের্ডমুলার বলেছেন যে তিনি “প্রথমবার জুম মিটিংয়ে তাদের প্রতিনিধিত্ব করার জন্য কেউ এটি ব্যবহার করছেন শুনে রোমাঞ্চিত হয়েছেন।”

“লাইক, এটা কেমন চলছে? কেউ কি লক্ষ্য করেছে?

ChatGPT নির্মাতা ওপেনএআই মার্চ মাসে “স্পিচ ইঞ্জিন” নামে একটি ভয়েস ক্লোনিং টুল প্রকাশ করেছে যা 15-সেকেন্ডের অডিও নমুনার উপর ভিত্তি করে কারো ভয়েস কপি করতে পারে।

কিন্তু কোম্পানি বলেছে যে “সংশ্লেষিত বক্তৃতার অপব্যবহারের সম্ভাবনার কারণে, এটি ব্যাপক প্রকাশের জন্য একটি সতর্ক এবং অবহিত পদ্ধতি গ্রহণ করছে।”

এই বছরের শুরুর দিকে, ডেমোক্র্যাটিক রাষ্ট্রপতি প্রার্থীর পক্ষে কাজ করা একজন পরামর্শদাতা স্বীকার করেছেন যে তিনি নিউ হ্যাম্পশায়ারের ভোটারদের কাছে জো বিডেনের ছদ্মবেশী একটি রোবোকলের পিছনে ছিলেন, তিনি বলেছিলেন যে তিনি কৃত্রিম বুদ্ধিমত্তার বিপদগুলি তুলে ধরার চেষ্টা করছেন।

রাজ্যের জানুয়ারী প্রাইমারিতে ভোট না দেওয়ার জন্য বিডেনের মতো শোনানো এই আহ্বানটি বিশেষজ্ঞদের উদ্বিগ্ন করেছে যারা 2024 সালের হোয়াইট হাউসের দৌড়ে এআই-চালিত প্রচারণার ভয়ে ভয় পায়।

উদ্ধৃতি: মাইক্রোসফট লাইফলাইক অবতার এআই প্রযুক্তি টিজ করে কিন্তু রিলিজ ডেট দেয় না (2024, এপ্রিল 20), সংগৃহীত 20 এপ্রিল, 2024 https://techxplore.com/news/2024-04-microsoft- lifelike-avatar-ai-tech। html

এই নথিটি কপিরাইট দ্বারা সুরক্ষিত। ব্যক্তিগত অধ্যয়ন বা গবেষণার উদ্দেশ্যে ন্যায্য লেনদেনের স্বার্থ ছাড়া লিখিত অনুমতি ছাড়া কোনো অংশ পুনরুত্পাদন করা যাবে না। বিষয়বস্তু শুধুমাত্র রেফারেন্স জন্য.

(ট্যাগস-অনুবাদ

উৎস লিঙ্ক

এছাড়াও পড়ুন শব্দ তরঙ্গ ব্যবহার করে ফোটোনিক মেশিন লার্নিং: অধ্যয়ন পুনর্নির্মাণযোগ্য নিউরোমরফিক বিল্ডিং ব্লকের ভিত্তি স্থাপন করে