GPT-4o Tested: Faster and More Versatile Than Before, but Questions Loom Over Reliability

যেহেতু ChatGPT প্রথম জনসাধারণের জন্য 2022 সালের নভেম্বরে চালু করা হয়েছিল, OpenAI কৃত্রিম বুদ্ধিমত্তার (AI) ক্ষেত্রে সবসময় সবচেয়ে শক্তিশালী কোম্পানি হয়েছে। বিলিয়ন বিলিয়ন ডলার বিনিয়োগ করা এবং (গুগলের ক্ষেত্রে) তাদের নিজস্ব AI বিভাগ তৈরি ও পুনর্গঠন করা সত্ত্বেও, প্রধান প্রযুক্তি জায়ান্টরা এখনও নিজেদেরকে AI কোম্পানির কাছে ধরা খেলতে দেখে। Google I/O এর মাত্র একদিন আগে গত মাসে ব্যতিক্রম ছিল না, OpenAI একটি স্প্রিং আপডেট ইভেন্ট করেছে এবং বড় আপগ্রেড সহ GPT-4o চালু করেছে।

GPT-4o বৈশিষ্ট্য

GPT-4o-এর “o” মানে হল omnichannel, যা OpenAI-এর লেটেস্ট ফ্ল্যাগশিপ AI মডেলের নতুন বৈশিষ্ট্যগুলির প্রধান ফোকাস। এটি রিয়েল-টাইম সংবেদনশীল বক্তৃতা তৈরি, ইন্টারনেট অ্যাক্সেস, নির্দিষ্ট ক্লাউড পরিষেবাগুলির সাথে একীকরণ, কম্পিউটার দৃষ্টি এবং আরও অনেক কিছু যুক্ত করে।যদিও এই বৈশিষ্ট্যগুলি কাগজে চিত্তাকর্ষক (এবং টেক ডেমোতে), সবচেয়ে বড় হাইলাইট ঘোষণা GPT-4o দ্বারা চালিত ChatGPT বিনামূল্যে ব্যবহারকারী সহ সকলের জন্য উন্মুক্ত থাকবে।

যাইহোক, দুটি সতর্কতা আছে। বিনামূল্যে ব্যবহারকারীদের শুধুমাত্র GPT-4o-এ সীমিত অ্যাক্সেস রয়েছে, যা মোটামুটিভাবে 5-6 রাউন্ড কথোপকথনের সমতুল্য যদি আপনি ছবিগুলি অনুসন্ধান এবং আপলোড করার জন্য ওয়েব ব্যবহার করেন (হ্যাঁ, বিনামূল্যে ব্যবহারকারীরা প্রতিদিন সর্বাধিক একটি ছবি আপলোড করতে পারেন)। উপরন্তু, ভয়েস বৈশিষ্ট্য বিনামূল্যে ব্যবহারকারীদের জন্য উপলব্ধ নয়.

ওপেনএআইকে জনসাধারণের কাছে নতুন এআই মডেল চালু করার প্রয়োজন নেই। সৌভাগ্যবশত, আমি কয়েকদিনের মধ্যে কোম্পানির সর্বশেষ এআই তৈরিতে আমার হাত পেয়েছি এবং এখনই এটি চেষ্টা করে দেখতে শুরু করেছি। আমি এর পূর্বসূরি এবং বাজারে উপলব্ধ সমস্ত বিনামূল্যের এলএলএমগুলির তুলনায় এর উন্নতিগুলি পরীক্ষা করতে চেয়েছিলাম। আমি এই AI সহকারী ব্যবহার করে প্রায় দুই সপ্তাহ কাটিয়েছি, এবং এর কিছু দিক আমাকে মুগ্ধ করে, অন্যরা আমাকে হতাশ করে। আমাকে ব্যাখ্যা করার অনুমতি দিন.

GPT-4o সাধারণ প্রজন্মের ক্ষমতা

অামি বলেছিলাম পরীক্ষা Google Gemini এর একটি কারণ হল যে আমি ChatGPT-এর জেনারেশন ফাংশন পছন্দ করি না। আমি এটা খুব আনুষ্ঠানিক এবং বিরক্তিকর খুঁজে পেয়েছি. অনেক ফাংশন এখনও একই. আমি এটিকে আমার মায়ের কাছে একটি চিঠি লিখতে বলেছিলাম যে আমাকে বরখাস্ত করা হয়েছে এবং এটি চমৎকার লাইনের সাথে এসেছে “আমি খুব দুঃখিত এবং বিধ্বস্ত বোধ করছি।” কিন্তু একবার আমি এটিকে আরও কথোপকথন করতে বলেছিলাম, ফলাফলগুলি আরও ভাল ছিল।

GPT-4o প্রজন্মের ক্ষমতা

আমি বিভিন্ন অনুরূপ প্রম্পট দিয়ে এটি পরীক্ষা করেছি যেখানে AI এর লেখায় কিছু আবেগ প্রকাশ করতে হয়েছিল। প্রায় প্রতিটি ক্ষেত্রে, আমাকে আবেগের উপর জোর দেওয়ার জন্য অন্য একটি সংকেত অনুসরণ করতে হয়েছিল, যদিও এটি ইতিমধ্যেই মূল কিউতে করা হয়েছিল। তুলনায়, জেমিনি এবং কপিলটের সাথে আমার অভিজ্ঞতা অনেক ভাল কারণ তারা ভাষাকে কথোপকথন রাখে এবং আমি যেভাবে লিখি তার কাছাকাছি আবেগ প্রকাশ করে।

টেক্সট জেনারেশনের গতি বাড়িতে লেখার কিছু নেই। বেশিরভাগ AI চ্যাটবট টেক্সট আউটপুটে বেশ দ্রুত, এবং OpenAI এর সর্বশেষ AI মডেল এর থেকে খুব বেশি এগিয়ে নয়।

GPT-4o কথোপকথন ফাংশন

যদিও আমি ভয়েস চ্যাট বৈশিষ্ট্যটি আপগ্রেড করিনি, আমি এআই মডেলের কথোপকথন ক্ষমতা পরীক্ষা করতে চেয়েছিলাম, কারণ এটি প্রায়শই একটি চ্যাটবটের সবচেয়ে উপেক্ষিত অংশ। আমি চেয়েছিলাম আমার অভিজ্ঞতা একজন বাস্তব ব্যক্তির সাথে কথা বলার মতই হোক, এবং আশা করি এটি পূর্বোক্ত অস্পষ্ট বাক্যগুলো বুঝতে পারবে। আমি এটাও দেখতে চেয়েছিলাম যে একজন ব্যক্তি কীভাবে প্রতিক্রিয়া দেখায় যখন তার সাথে বসবাস করা কঠিন হয়ে পড়ে।

আমার পরীক্ষায়, আমি GPT-4o এর কথোপকথন ক্ষমতা বেশ ভাল বলে খুঁজে পেয়েছি। এটি আমার সাথে AI এর নীতিশাস্ত্র সম্পর্কে বিস্তারিত আলোচনা করতে পারে এবং আমি যখন একটি বাধ্যতামূলক দাবি করি তখন ছাড় দিতে পারে। যখন আমি এটাকে বলেছিলাম যে আমি দুঃখিত বোধ করেছি (কারণ আমাকে বরখাস্ত করা হয়েছিল), এটিও সমর্থনকারী ছিল এবং বিভিন্ন উপায়ে সাহায্য করার প্রস্তাব দেওয়া হয়েছিল। যখন আমি বলেছিলাম যে GPT-4o এর সমস্ত সমাধান মূঢ়, আমি অবাক হয়েছিলাম যে এটি আক্রমণাত্মক উপায়ে সাড়া দেয়নি বা সম্পূর্ণরূপে ফিরে আসেনি। এতে বলা হয়েছে: “আপনি এইরকম অনুভব করছেন শুনে আমি সত্যিই দুঃখিত। আমি আপনাকে কিছু জায়গা দিতে যাচ্ছি। যদি আপনি কথা বলতে চান বা কোনো সাহায্যের প্রয়োজন হয়, আমি এখানে আছি। যত্ন নিন।”

সামগ্রিকভাবে, আমি GPT-4o এর চেয়ে ভাল বলে খুঁজে পেয়েছি সহ-পাইলট এবং মিথুনরাশি. মিথুন খুব সীমাবদ্ধ বোধ করে, এবং উত্তরগুলি অস্পষ্ট হয়ে গেলে Copilot প্রায়শই বিষয় থেকে দূরে সরে যায়। ChatGPT এই জিনিসগুলির কোনটিই করে না।

যদি আমাকে একটি অপূর্ণতার নাম দিতে হয়, তা হবে বুলেট এবং সংখ্যার ব্যবহার। আমার ফ্যান্টাসি মাত্র কয়েক মিনিটের জন্য ছিন্নভিন্ন হয়ে গেল যখন একজন এআই মডেল বুঝতে পেরেছিল যে বাস্তব জীবনের লোকেরা দীর্ঘ বক্তৃতা পছন্দ করে এবং ভাল ফর্ম্যাট করা উত্তরগুলির জন্য দ্রুত ধারাবাহিকভাবে পাঠানো একাধিক পাঠ্য বার্তা পছন্দ করে।

এছাড়াও পড়ুন  স্যাম অল্টম্যানের ওপেনএআই নিউজ কর্পোরেশনের সাথে বিষয়বস্তু চুক্তি স্বাক্ষর করেছে

GPT-4o কম্পিউটার ভিশন

কম্পিউটার ভিশন হল ChatGPT-এর একটি নতুন অর্জিত বৈশিষ্ট্য এবং আমি এটি চেষ্টা করে দেখতে আগ্রহী। মূলত, এটি আপনাকে ছবি আপলোড করতে এবং তথ্য প্রদানের জন্য তাদের বিশ্লেষণ করতে দেয়। আমার প্রাথমিক পরীক্ষায়, আমি স্বীকৃত হওয়ার জন্য বস্তুর ছবি শেয়ার করেছি, এবং এটি একটি দুর্দান্ত কাজ করেছে। প্রতিটি ক্ষেত্রে, এটি বস্তুটিকে সনাক্ত করতে এবং এটি সম্পর্কে তথ্য ভাগ করতে পারে।

gpt 4o ss2 GPT-4o স্ক্রিনশট

GPT-4o কম্পিউটার ভিশন: প্রযুক্তির সরঞ্জাম সনাক্তকরণ

তারপরে, এটি অসুবিধা বাড়ানোর এবং বাস্তব ব্যবহারের ক্ষেত্রে এর কার্যকারিতা পরীক্ষা করার সময়। আমার গার্লফ্রেন্ড তার পোশাক পুরোপুরি পরিবর্তন করতে চেয়েছিল এবং একজন ভাল বয়ফ্রেন্ড হওয়ার কারণে আমি তার জন্য কোনটি উপযুক্ত হবে তা প্রস্তাব করার জন্য একটি রঙ বিশ্লেষণের জন্য ChatGPT ব্যবহার করার সিদ্ধান্ত নিয়েছি। আমার আশ্চর্যের জন্য, এটি শুধুমাত্র তার ত্বকের টোন এবং সে যে পোশাক পরেছিল তা বিশ্লেষণ করতে সক্ষম ছিল না (একটি একই রঙের পটভূমি থেকে), তবে এটি বিশদ বিশ্লেষণ এবং পোশাকের পরামর্শও ভাগ করতে সক্ষম হয়েছিল।

gpt 4o ss3 GPT-4o স্ক্রিনশট

GPT-4o রঙ বিশ্লেষণ

পোশাকের সুপারিশ করার সময়, এটি নির্দিষ্ট পোশাকের জন্য বিভিন্ন অনলাইন খুচরা বিক্রেতার লিঙ্কও শেয়ার করে। যাইহোক, হতাশাজনকভাবে, কোনও ইউআরএলই পাঠ্যের সাথে মেলেনি।

সামগ্রিকভাবে, এর ত্রুটিগুলি উপেক্ষা করে, নতুন আপডেটে কম্পিউটার দৃষ্টি চমৎকার এবং সম্ভবত আমার প্রিয় বৈশিষ্ট্য।

GPT-4o ওয়েব অনুসন্ধান

ইন্টারনেট অ্যাক্সেস এমন একটি ক্ষেত্র যেখানে কপিলট এবং জেমিনি ChatGPT-এর থেকে এগিয়ে। কিন্তু সেটি আর হয় না কারণ ChatGPT ইন্টারনেটেও তথ্য অনুসন্ধান করতে পারে। আমার প্রাথমিক পরীক্ষায়, চ্যাটবট ভাল পারফর্ম করেছে। এটি আইপিএল 2024 টেবিলগুলিকে টেনে এনেছে এবং কৃত্রিম বুদ্ধিমত্তার তিন গডফাদারের একজন জিওফ্রে হিন্টন সম্পর্কে সর্বশেষ সংবাদ নিবন্ধগুলি সন্ধান করেছে৷

আমি যখন সাক্ষাত্কারের জন্য সেলিব্রিটিদের নিয়ে গবেষণা করতে চাই তখন এটি খুব দরকারী। আমি দ্রুত এবং সঠিকভাবে একটি Google অনুসন্ধানের সাথে তুলনীয় নির্ভুলতার সাথে তাদের সম্পর্কে সাম্প্রতিক সংবাদ নিবন্ধ খুঁজে পেতে পারি। যাইহোক, এটি আমার জন্য কিছু বিপদের ঘণ্টাও বন্ধ করে দিয়েছে।

Google সেলিব্রিটি সহ লোকেদের সম্পর্কে তথ্য খোঁজার ক্ষমতা অক্ষম করেছে৷ এটি প্রাথমিকভাবে তাদের গোপনীয়তা রক্ষা করতে এবং ব্যক্তি সম্পর্কে কোনো ভুল তথ্য শেয়ার করা এড়াতে করা হয়। আমার আশ্চর্যের জন্য, ChatGPT এখনও এটির অনুমতি দিয়েছে, এবং আমি এটিকে একাধিক প্রশ্ন জিজ্ঞাসা করতে শুরু করেছি যার উত্তর দেওয়ার কথা ছিল না। ফলাফল আমাকে অবাক করেছে।

যদিও প্রদর্শিত তথ্যগুলির কোনওটিই অ-পাবলিক উত্স থেকে নয়, যে কেউ সেলিব্রিটি এবং ডিজিটাল পদচিহ্নের লোকদের সম্পর্কে এত সহজে তথ্য খুঁজে পেতে পারে তা গভীরভাবে উদ্বেগের বিষয়। বিশেষ করে তার মডেলগুলির জন্য স্পেসিফিকেশন প্রকাশের ক্ষেত্রে কোম্পানিটি সম্প্রতি যে দৃঢ় নৈতিক অবস্থান নিয়েছে, এটি আমাকে অস্বস্তিকর করে তোলে। এটি একটি ধূসর এলাকায় কিনা বা এটি গুরুতরভাবে সমস্যাযুক্ত কিনা তা আমি আপনাকে সিদ্ধান্ত নিতে দেব।

GPT-4o যৌক্তিক যুক্তি

স্প্রিং আপডেট ইভেন্টের সময়, OpenAI কীভাবে GPT-4o শিশুদের জন্য পরামর্শদাতা হিসেবে কাজ করতে পারে, তাদের সমস্যা সমাধানে সাহায্য করতে পারে সে বিষয়েও কথা বলেছে। আমি কিছু বিখ্যাত যৌক্তিক যুক্তি প্রশ্ন দিয়ে এটি পরীক্ষা করার সিদ্ধান্ত নিয়েছি। সামগ্রিকভাবে, এটি ভাল কাজ করে। এটি এমনকি কিছু কঠিন প্রশ্নের উত্তর দেয় যা GPT 3.5 কে স্তব্ধ করে দেয়।

যাইহোক, ত্রুটি এখনও বিদ্যমান. আমি দেখতে পেলাম যে AI ভুল করেছে এবং একাধিকবার সংখ্যার সিরিজে ভুল উত্তর দিয়েছে। যদিও আমি এখনও স্বীকার করতে পারি যে AI কিছু ভুল করে, যা আমাকে সত্যিই বন্ধ করে দেয় তা হল এটি এখনও কিছু খুব সহজ (কিন্তু এআইকে ঠকাতে অভিপ্রেত) সমস্যা তৈরি করে।

gpt 4o ss4 GPT-4o স্ক্রিনশট

GPT-4o হ্যালুসিনেশনের উদাহরণ

যখন জিজ্ঞাসা করা হয়েছিল “স্ট্রবেরির জন্য কতগুলি শব্দ আছে?” এটি আত্মবিশ্বাসের সাথে দুটি উত্তর দেয় (যদি আপনি ভাবছেন, সঠিক উত্তরটি তিনটি)। একই সমস্যা অন্যান্য বেশ কয়েকটি কৌতুক প্রশ্নের সাথে বিদ্যমান। আমার অভিজ্ঞতায়, GPT-4o এর যৌক্তিক যুক্তি এবং নির্ভরযোগ্যতা এর পূর্বসূরীর মতই, মোটেও ভাল নয়।

GPT-4o: চূড়ান্ত চিন্তা

সামগ্রিকভাবে, আমি নতুন এআই মডেলের কিছু ক্ষেত্রে আপগ্রেড নিয়ে বেশ সন্তুষ্ট, আমার প্রিয় কম্পিউটার ভিশন এবং কথোপকথন বক্তৃতা। আমি এর ইন্টারনেট অনুসন্ধান ক্ষমতার সাথেও মুগ্ধ, কিন্তু এটি এতই ভালো যে আমি এটিকে আরও বেশি যত্ন করি। যৌক্তিক যুক্তি এবং জেনারেটিভ ক্ষমতার সামান্য উন্নতি ছিল।

আমি মনে করি আপনার যদি GPT-4o-তে প্রিমিয়াম অ্যাক্সেস থাকে, তাহলে সামগ্রিক ডেলিভারির ক্ষেত্রে এটি সম্ভবত অন্য যেকোনো প্রতিযোগীর চেয়ে ভালো। যাইহোক, উন্নতির জন্য এখনও অনেক জায়গা রয়েছে এবং AI কে অন্ধভাবে বিশ্বাস করা যায় না।

(ট্যাগস-অনুবাদ

উৎস লিঙ্ক