OpenAI announced the new Voice Mode earlier this year in May alongside GPT-4o.

চলতি বছরের শুরুতে যখন চ্যাটজিপিটি নির্মাতা OpenAI সর্বশেষ বৃহৎ ভাষার মডেল-GPT-4o লঞ্চ করেছেমার্কিন ভিত্তিক কোম্পানিটি তার মাল্টিমোডাল ক্ষমতার উপর জোর দিয়েছে এবং বাস্তব সময়ে মানুষের সাথে কথোপকথন করার জন্য এআই মডেলের ক্ষমতার উপর ফোকাস করেছে।

OpenAI দ্বারা শেয়ার করা একটি প্রদর্শনীতে, ChatGPT ব্যবহারকারীদের পর্তুগিজ শেখাতে, একাধিক ব্যক্তির সাথে কথোপকথন করতে এবং আবেগ এবং অ-মৌখিক ইঙ্গিত দিয়ে ব্যবহারকারীর প্রশ্নের উত্তর দিতে দেখা যায়। GPT-4o-ভিত্তিক ভয়েস মোডটি মূলত গত মাসে ব্যবহারকারীদের একটি ছোট গোষ্ঠীর জন্য উপলব্ধ হওয়ার জন্য নির্ধারিত ছিল, কিন্তু কৃত্রিম বুদ্ধিমত্তার “নির্দিষ্ট বিষয়বস্তু সনাক্ত এবং প্রত্যাখ্যান” করার ক্ষমতার কারণে বিলম্বিত হয়েছিল।

গত মাসে, OpenAI বলেছিল যে কিছু অভ্যন্তরীণ নিরাপত্তা এবং নির্ভরযোগ্যতা পরীক্ষা পাস করার পরেই নতুন বৈশিষ্ট্যগুলি উপলব্ধ হবে উন্নত ভয়েস মোড ChatGPT প্লাস গ্রাহকদের কাছে জুলাই মাসের কোনো এক সময় উপলব্ধ হবে।

https://platform.twitter.com/widgets.js

আজ, OpenAI সিইও স্যাম অল্টম্যান X (আগের টুইটারে) একটি পোস্টের উত্তরে বলেছেন যে GPT-4o দ্বারা সমর্থিত বহুল প্রত্যাশিত ভয়েস মোড আগামী সপ্তাহে অর্থপ্রদানকারী গ্রাহকদের জন্য আলফা সংস্করণে উপলব্ধ হবে। যদিও ChatGPT-এর বর্তমানে একটি ভয়েস মোড রয়েছে, তবে দেরী প্রতিক্রিয়ার কারণে এটি তেমন কার্যকর নয়। বর্তমান সংস্করণগুলির তুলনায় (GPT 3.5 এবং GPT 4 এর জন্য যথাক্রমে 2.8 সেকেন্ড এবং 5.4 সেকেন্ডের গড় বিলম্ব), GPT-4o-এর কোনও লক্ষণীয় লেটেন্সি নেই৷

যাইহোক, নতুন ভয়েস মোড পতন না হওয়া পর্যন্ত সমস্ত ChatGPT প্লাস ব্যবহারকারীদের জন্য উপলব্ধ হবে না। OpenAI গত সপ্তাহে GPT-4o মিনি চালু করেছে, তার সর্বশেষ বৃহৎ ভাষার মডেলের একটি সুবিন্যস্ত সংস্করণ, যা কোম্পানি বলে যে এটি GPT-3.5 Turbo-এর চেয়ে বেশি শক্তিশালী। সম্প্রতি ওপেনএআইও ঘোষণা করেছে সার্চজিপিটি নামে একটি নতুন কৃত্রিম বুদ্ধিমত্তার সার্চ ইঞ্জিনযা শেষ পর্যন্ত ChatGPT এর সাথে একত্রিত হবে।




উৎস লিঙ্ক