KLING AI tool on website

এই বছরের ফেব্রুয়ারিতে, ওপেনএআই ভিডিও জেনারেশন মডেল সোরা প্রকাশ করেছে, যা এক মিনিট-লম্বা হাই-ডেফিনিশন ভিডিও তৈরি করতে পারে। সোরা এখনও অনলাইনে নেই, এবং এখনও আরেকটি টেক্সট-টু-ভিডিও প্রজন্মের মডেল শিরোনাম করছে বলে মনে হচ্ছে। কুয়াইশোউ টেকনোলজি, একটি চীনা কোম্পানি যা তার সংক্ষিপ্ত ভিডিও প্ল্যাটফর্মের জন্য পরিচিত, ক্লিং নামে একটি টেক্সট-টু-ভিডিও মডেল চালু করেছে।

এটি রিপোর্ট করা হয়েছে যে ক্লিং সোরার মতো প্রযুক্তি ব্যবহার করে, যা 1080p হাই-ডেফিনিশন ভিডিওর দুই মিনিট পর্যন্ত শুট করতে পারে মডেলটি বড় আকারের বাস্তবসম্মত আন্দোলন তৈরি করতে পারে, মূলত ভৌত জগতের বৈশিষ্ট্যগুলিকে অনুকরণ করে৷

বৃহস্পতিবার, কোম্পানিটি তার ভিডিও তৈরির ক্ষমতা প্রদর্শন করে একটি ডেমো ভিডিও প্রকাশ করেছে। মডেলটি উন্মুক্ত ব্যবহারের জন্য উপলব্ধ বলে জানা গেছে এবং কিছু ক্ষেত্রে সোরার থেকে অনেক এগিয়ে ভিডিও তৈরি করতে পারে।

Kling ভিডিও মডেলটি Kuaishou-এর Master of Laws টিম দ্বারা স্ব-বিকাশিত এবং বর্তমানে Kuaishou-এর ভিডিও শ্যুটিং এবং APP Kuaiying-এর সম্পাদনা পরীক্ষা করার জন্য উন্মুক্ত।

বেশ কিছু এআই উত্সাহী ক্লিং অন এক্স ব্যবহার করে তাদের তৈরি করা ভিডিওগুলি শেয়ার করেছেন৷ মডেলটি 30fps এর ফ্রেম রেট সহ দুই মিনিট পর্যন্ত ভিডিও তৈরি করতে পারে। সোরা বর্তমানে শুধুমাত্র এক মিনিটের ভিডিও তৈরি করতে পারে। X-তে পোস্ট করা নমুনার উপর ভিত্তি করে, ক্লিং দ্বারা তৈরি করা ভিডিওগুলি বাস্তব-বিশ্বের পদার্থবিদ্যাকে সঠিকভাবে অনুকরণ করে বলে মনে হচ্ছে।

এটি লক্ষ করা গুরুত্বপূর্ণ যে ক্লিং চীনের একমাত্র পাঠ্য থেকে ভিডিও মডেল নয়। এই বছরের এপ্রিলে, চীন Vidu AI প্রকাশ করেছে, একটি টেক্সট-টু-ভিডিও মডেল যা 1080p রেজোলিউশনে 16 সেকেন্ডের ভিডিও রেকর্ড করতে পারে। রিপোর্ট অনুসারে, ক্লিং ডিফিউশন ট্রান্সফরমার আর্কিটেকচারের উপর ভিত্তি করে তৈরি করা হয়েছে এবং টেক্সট প্রম্পটকে ভিভিড ভিজ্যুয়াল এফেক্টে রূপান্তর করতে পারে।

https://platform.twitter.com/widgets.js

এছাড়াও পড়ুন  মতামত: মতামত | কেন এক্সিট পোল বাস্তবতা প্রতিফলিত করতে ব্যর্থ হয়?পোলিং বিশেষজ্ঞদের দ্বারা ব্যাখ্যা

ছুটির ডিল

ক্লিং মডেলগুলিতে উন্নত 3D ফেসিয়াল এবং বডি রিকনস্ট্রাকশন প্রযুক্তি রয়েছে এবং কোম্পানির মালিকানাধীন 3D VAE প্রযুক্তি দ্বারা চালিত হয়, যা ব্যবহারকারীদের বিভিন্ন আকৃতির অনুপাতের ভিডিও তৈরি করতে দেয়। এটি পরিবর্তনশীল রেজোলিউশন প্রশিক্ষণের মাধ্যমে অর্জন করা হয়, যা সম্পূর্ণ অভিব্যক্তি এবং শরীরের নড়াচড়াকে শুধুমাত্র একটি পূর্ণ-বডি ফটোতে ক্যাপচার করতে দেয়।

মনে হচ্ছে চীন দ্রুত তার এআই মডেলের উন্নয়নে অগ্রসর হচ্ছে এবং ক্লিং তার দ্রুত উন্নয়নের প্রমাণ বলে মনে হচ্ছে। মনে হচ্ছে চ্যাটজিপিটি নির্মাতা সোরা চীনে কঠোর প্রতিযোগিতার মুখোমুখি হতে পারে।




উৎস লিঙ্ক