স্যামুয়েল (স্যান্ডি) অ্যারনসন, ALM, MA, ব্রিঘাম, ম্যাসাচুসেটস জেনারেল হাসপাতালে ব্যক্তিগতকৃত ওষুধের জন্য IT এবং AI সমাধানগুলির নির্বাহী পরিচালক এবং ক্লিনিকাল ট্রান্সফরমেশন অ্যাক্সিলারেটরের জন্য IT এবং AI সমাধানগুলির সিনিয়র ডিরেক্টর, NEJM-এ প্রকাশিত একটি গবেষণাপত্রের একজন সংবাদদাতা। AI লেখক: জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা ক্লিনিকাল জেনেটিক পরীক্ষায় পরিবর্তনের উন্নতির প্রতিশ্রুতি রাখে কিনা তা তদন্ত করে বৈজ্ঞানিক সাহিত্যের একটি পর্যালোচনা। তাদের অনুসন্ধানের এই ব্যবহারের ক্ষেত্রে বিস্তৃত প্রভাব থাকতে পারে।
কিভাবে আপনি একটি সাধারণ শ্রোতা আপনার গবেষণা সংক্ষিপ্ত হবে?
আমরা পরীক্ষা করেছি যে জেনারেটিভ আর্টিফিশিয়াল ইন্টেলিজেন্স ব্যবহার করা যেতে পারে কিনা তা সনাক্ত করতে বৈজ্ঞানিক নিবন্ধগুলিতে এমন তথ্য রয়েছে যা জেনেটিকবিদদের জেনেটিক বৈচিত্রগুলি রোগীদের জন্য ক্ষতিকারক কিনা তা নির্ধারণ করতে সাহায্য করতে পারে। এই কাজটি পরীক্ষা করার সময়, আমরা উত্পন্ন কৃত্রিম বুদ্ধিমত্তার মধ্যে অসঙ্গতি খুঁজে পেয়েছি যেগুলি যদি পর্যাপ্তভাবে সমাধান না করা হয় তবে রোগীদের জন্য ঝুঁকি তৈরি করতে পারে। আমরা এমন ধরনের পরীক্ষা এবং পর্যবেক্ষণের সুপারিশ করি যা নিরাপত্তা উন্নত করতে পারে।
আপনি কি সমস্যা তদন্ত করছেন?
আমরা তদন্ত করেছি যে কৃত্রিম বুদ্ধিমত্তা নির্ণয় করতে ব্যবহার করা যেতে পারে: 1) বৈজ্ঞানিক নিবন্ধগুলিতে বৈকল্পিকের প্রমাণ রয়েছে যা জেনেটিক বৈকল্পিকদের মূল্যায়ন করতে সহায়তা করতে পারে 2) বৈকল্পিক সম্পর্কে পাওয়া প্রমাণগুলি সৌম্য, প্যাথোজেনিক, মধ্যবর্তী বা পরিবর্তনশীলতাকে সমর্থন করে কিনা;
আপনি কি পদ্ধতি বা পন্থা ব্যবহার করেছেন?
আমরা 72টি নিবন্ধের লেবেলযুক্ত ডেটাসেট ব্যবহার করে একটি GPT-4-ভিত্তিক জেনারেটিভ এআই কৌশল পরীক্ষা করেছি এবং জেনারেটিভ এআই-কে বিশেষজ্ঞ জেনেটিসিস্ট মূল্যায়নের সাথে তুলনা করেছি।
আপনি কি খুঁজে পেয়েছেন?
জেনারেটিভ এআই তুলনামূলকভাবে ভাল পারফর্ম করে, তবে বেশিরভাগ ব্যবহারের ক্ষেত্রে এখনও আরও উন্নতির প্রয়োজন। যাইহোক, যখন আমরা বারবার পরীক্ষাটি সম্পাদন করেছি, তখন আমরা এমন কিছু পর্যবেক্ষণ করেছি যা আমরা গুরুত্বপূর্ণ বলে মনে করেছি: একই পরীক্ষার ডেটা সেটের বারবার সঞ্চালন ভিন্ন ফলাফল তৈরি করে। বারবার পরীক্ষার সেট চালানোর মাধ্যমে, আমরা পরিবর্তনশীলতা চিহ্নিত করি। আমরা দেখতে পেয়েছি যে ড্রিফট (সময়ের সাথে মডেলের পারফরম্যান্সে পরিবর্তন) এবং অনিশ্চয়তা (পরবর্তী রানের মধ্যে অসঙ্গতি) উভয়ই উপস্থিত ছিল। এই সমস্যার প্রকৃতি দেখানোর জন্য আমরা ভিজ্যুয়ালাইজেশন তৈরি করেছি।
প্রভাব কি?
যদি ক্লিনিকাল টুল ডেভেলপাররা সচেতন না হন যে বৃহৎ ভাষার মডেলগুলি উল্লেখযোগ্য প্রবাহ এবং অনিশ্চয়তা প্রদর্শন করতে পারে, তবে তারা একবার একটি পরীক্ষার সেট চালাতে পারে এবং তাদের সরঞ্জামটি অনুশীলনে চালু করা যেতে পারে কিনা তা নির্ধারণ করতে ফলাফলগুলি ব্যবহার করতে পারে। এটি নিরাপদ নাও হতে পারে।
পরবর্তী পদক্ষেপ কি?
আমাদের ফলাফলগুলি পরামর্শ দেয় যে বিদ্যমান পরিবর্তনশীলতার ডিগ্রী (অনিশ্চয়তা) প্রদর্শনের জন্য একাধিকবার পরীক্ষা সেট চালানো গুরুত্বপূর্ণ হতে পারে। আমাদের ফলাফলগুলিও দেখায় যে সময়ের সাথে পারফরম্যান্সের (ড্রিফট) পরিবর্তনগুলি পর্যবেক্ষণ করা গুরুত্বপূর্ণ।
উৎস:
জার্নাল রেফারেন্স:
অ্যারনসন, এসজে, ইত্যাদি. (2024)। একটি জেনেটিক সাহিত্য পর্যালোচনায় জিপিটি -4 উপস্থাপনা, অনিশ্চয়তাবাদ এবং প্রবাহ। NEJM কৃত্রিম বুদ্ধিমত্তা. doi.org/10.1056/aics2400245.