কীভাবে এটির কাঠামোর পাঠোদ্ধার করা যায় – এটি কীভাবে লেখা হয়, বলা হয়, অনুভূত হয় – এবং কয়েক ঘন্টার মধ্যে এটিকে পিছনে পিছনে অনুবাদ করতে সক্ষম হবেন?
এটি ভাষাবিজ্ঞানের বিজ্ঞান এবং এটিই ভারতীয় কিশোরী অনিমিখা দত্ত ধর, শ্রীলক্ষ্মী ভেঙ্কটরামন, ফারাজ সিদ্দিকী এবং অনন্যা আগরওয়াল এই আগস্টে ব্রাসিলিয়ায় 2024 আন্তর্জাতিক অলিম্পিয়াড ইন লিঙ্গুইস্টিকস (IOL) এ অর্জন করেছে৷
আমাদের স্যাফরান এবং গ্রিন টিমকে পাঁচটি অবিশ্বাস্য শব্দ সমস্যার একটি সেট দেওয়া হয়েছিল যাতে ছয় ঘন্টার মধ্যে সমাধান করা যায়, একটি খুব কমই উল্লেখ করা এবং কদাচিৎ কথ্য ভাষায় – কোরিয়াক (রাশিয়া থেকে), খাজা (তানজানিয়া), কমজো (পাপুয়া) এবং অন্যান্য দূরবর্তী ভাষায়। কিন্তু লোকেরা কীভাবে একটি ভাষা বোঝায় যা তাদের সম্পূর্ণ বিদেশী?
অন্তর্দৃষ্টির সাথে যৌক্তিক যুক্তির সংমিশ্রণে, ভারতের একমাত্র রৌপ্য পদক বিজয়ী এবং চেন্নাই গণিত ইনস্টিটিউটের ছাত্রী 17 বছর বয়সী অনিমিখার গল্প প্রকাশিত হয়েছে।
“একটি সীমিত সময়ের মধ্যে একটি ভাষার কাঠামো প্রকাশ করার জন্য, আমরা সাধারণত আমাদের দেওয়া ডেটা দেখি… এবং ডেটাকে ন্যায্যতা দেয় এমন নিয়মগুলি খুঁজে বের করার চেষ্টা করি৷ উদাহরণস্বরূপ, যদি একটি নির্দিষ্ট টোকেন একটি বাক্যে প্রদর্শিত হয় একবচন বিষয়, এটা বলা ঠিক যে যখনই একটি একবচন বিষয় উপস্থিত থাকে তখনই চিহ্নটি ঘটে “বিকল্পভাবে, যদি একই শব্দটি 3, 27 এবং 63 সংখ্যার জন্য উপস্থিত হয়, তাহলে আমরা অনুমান করতে পারি যে ভাষাটি একটি বেস-12 ব্যবহার করে। সংখ্যা সিস্টেম। “
শ্রীলক্ষ্মী, 14, নিশ্চিত করেছেন যে অন্য যেকোন অলিম্পিয়াডের মতো, আপনি আপনার শার্লকিয়ান ডিডাকশন দক্ষতা বিকাশের জন্য পূর্ববর্তী বছরের প্রশ্ন অনুশীলন করেও উপকৃত হতে পারেন। জয়গোপাল গারোদিয়া রাষ্ট্রোত্তন বিদ্যা কেন্দ্র, বেঙ্গালুরুর একজন ছাত্র, তিনি আইআইটি কানপুরের নবীন এবং পদক বিজয়ী ফারাজের সাথে ব্রোঞ্জ পদক জিতেছিলেন, যিনি 2023 সালে রৌপ্য পদক জিতেছিলেন। প্রায় একটি পদক হাতছাড়া, কিন্তু একটি সম্মানজনক উল্লেখ পেয়েছিলাম.
যেহেতু বেশিরভাগ ভাষা একটি সম্প্রদায়ের বিশ্বাস, অনুশীলন এবং সামাজিক প্রতিষ্ঠানের সাথে আবদ্ধ, তাই প্রতিটি আইওএল ধাঁধায় শিক্ষার্থীদের গাইড করার জন্য কিছু প্রাসঙ্গিক সাংস্কৃতিক টিডবিট রয়েছে। আদিবাসী বা উচ্চ-ঝুঁকিপূর্ণ ভাষাগুলির উপর ফোকাস রেখে এই সমস্যাগুলি বহু বছর ধরে চলছে এবং IOL ওয়েবসাইটে পাওয়া যাবে। উদাহরণস্বরূপ, এই বছরের কমনজো ভাষার প্রশ্নে (নীচের স্লাইড 3) একটি পারিবারিক গাছ পূরণ করা জড়িত। এখানে মূল বার্তাটি হল যে ফারেম লোকেরা (কমঞ্জো ভাষার প্রধান বক্তা) বোন বিনিময়ের অনুশীলন করে, যেখানে বিভিন্ন বংশের দুইজন পুরুষ একে অপরের বোনকে বিয়ে করে:
কম্পিউটার বিজ্ঞানে এর ক্রমবর্ধমান গুরুত্ব ছাড়াও, ভাষাবিজ্ঞান অনেক লোককে বিদেশী সংস্কৃতিতে একটি উইন্ডো প্রদান করে। অনিমিহা বলেছিলেন যে তিনি “ভাষা থেকে ঐতিহাসিক প্রেক্ষাপট অনুমান করা” উপভোগ করেন এবং তার প্রিয় উদাহরণ ভাগ করেছেন: “পাপুয়া নিউ গিনির একটি এনডু ভাষা মানম্বুতে, ক্যাসোওয়ারীকে (কথা বলা হয়) একটি মহিলা সন কারণ তারা পৌরাণিক মহিলাদের সাথে যুক্ত।
অন্যদিকে শ্রী লক্ষ্মী ভাষাবিজ্ঞানের ক্ষেত্র সম্পর্কে অবগত ছিলেন না। “প্রাথমিকভাবে যা আমার দৃষ্টি আকর্ষণ করেছিল তা হল এর অপ্রচলিত প্রকৃতি। এটা হল ধাঁধা সমাধান করা এবং মানুষকে সৃজনশীল নতুন উপায়ে চিন্তা করা. সবচেয়ে মজার বিষয় হল ধাঁধার সাথে জড়িত ভাষা সম্পর্কে আমার কিছু জানার দরকার ছিল না।
আসলে, ভাষাবিজ্ঞানের ক্ষেত্রে উন্নতির জন্য আপনাকে বহুভুজ বা ভাল লেখক হতে হবে না। এই দক্ষতাগুলি কিছু ভারা প্রদান করতে পারে, কিন্তু আইওএল-এ পডিয়াম শেষ করার চাবিকাঠি হল প্যাটার্নের দিকে মনোযোগ দেওয়া। ভারতের এখন পর্যন্ত একটি দুর্দান্ত রেকর্ড রয়েছে – 2009 সালে প্রথম দল প্রবেশ করার পর থেকে আমরা 15টি সংস্করণে 31টি পদক (4টি স্বর্ণ সহ) জিতেছি। ভারত আইওএল হল অফ ফেমে সাতটি পুরস্কার বিজয়ী পদকপ্রাপ্তকেও পাঠিয়েছে।
এছাড়াও পড়ুন | মহান ব্যাকরণবিদ পাণিনি অষ্টাধ্যায়ীতে একটি সংস্কৃত ধাঁধা রেখে গেছেন। ভারতীয় ছাত্ররা কি এর সমাধান করেছে?
এখানে একটি সুস্পষ্ট প্রশ্ন: ছোটবেলা থেকেই দ্বিভাষিক বা ত্রিভাষিক হওয়া কি ভারতীয়দের জন্য একটি সুবিধা নিয়ে আসে? এটা কি একাধিক ভাষায় চিন্তা করতে সক্ষম হতে সাহায্য করে? আমাদের বিজয়ীরা বিশ্বাস করে পারস্পরিক সম্পর্ক আছে, কিন্তু কার্যকারণ নয়:
“অন্যান্য ভাষায় ঘটে এমন কিছু ধ্বনিতাত্ত্বিক (শব্দ-সম্পর্কিত) ঘটনাগুলি ভারতীয় ভাষাগুলিতেও ভালভাবে প্রতিফলিত হয়৷ উদাহরণস্বরূপ, আদ্যক্ষরগুলির মধ্যে স্বরবিহীন ব্যঞ্জনবর্ণ (ch, th, d, sh, k, ইত্যাদি) কণ্ঠস্বর হয়ে ওঠে বা দুটি সন্নিহিত হয় স্বরবর্ণগুলি একক স্বর (যুক্তাক্ষর/ডিগ্রাফ) এ একত্রিত হয়, আমি লক্ষ্য করেছি যে ভারতীয় ভাষাগুলিতে উপস্থিত কিছু সিনট্যাক্টিক (বিন্যাস সম্পর্কিত) বৈশিষ্ট্যগুলিও আমাদের আরও সৃজনশীলভাবে চিন্তা করার সুযোগ রয়েছে।
তিনি তার সাংস্কৃতিক ঐতিহ্যকে অনুপ্রেরণা হিসেবে ব্যবহার করেন: “আমি বাংলায় কথা বলি, যাতে ব্যাকরণগত লিঙ্গ থাকে না, হিন্দি থাকে, এবং ইংরেজিতে লিঙ্গ সর্বনাম থাকে। যখন আমি এমন একটি ভাষার মুখোমুখি হই যা আমি আগে কখনো দেখিনি, আমি মনে করি আমি বিবেচনা করতে আরও ইচ্ছুক হব এই দৃষ্টিকোণ সব.
শ্রী লক্ষ্মী সম্মত হন, উল্লেখ্য যে ভারতীয় শিশুদের স্থানীয় ভাষার মধ্যে বৈপরীত্যের নিষ্ক্রিয় উপলব্ধি একজনের অন্তর্দৃষ্টি তৈরি করে। “আমরা স্বাভাবিকভাবেই ভাষার বৃহত্তর ঘটনা সম্পর্কে সচেতন, অধিকতর ভাষা শেখা সমালোচনামূলক চিন্তাভাবনা বাড়ায় তাই, ভারতীয়রা একাধিক ভাষা শেখার মানে হল যে আমরা কিছু বিন্দু সংযোগ করতে এবং সৃজনশীলভাবে চিন্তা করতে সক্ষম হয়েছি…”
কৃত্রিম বুদ্ধিমত্তা বৃদ্ধির তরঙ্গ হিসাবে ভাষাবিজ্ঞানের ক্যারিয়ারে আগ্রহ বাড়ছে
ভাষাবিজ্ঞান হল যে কোনো ভাষার বাক্য গঠন, ব্যাকরণ এবং ধ্বনিতত্ত্বের বৈজ্ঞানিক অধ্যয়ন—মূলত, এর গঠন এবং কীভাবে এই পূর্বনির্ধারিত যুক্তি শব্দ ও বাক্য তৈরি করতে ব্যবহৃত হয়। কৃত্রিম বুদ্ধিমত্তার বিকাশ এবং GPT-4 এবং Claude-এর মতো বৃহৎ ভাষা মডেলের (LLM) বিকাশের ফলে এই ক্ষেত্রের প্রতি মানুষের আগ্রহ আবার জাগানো হয়েছে। মিথুন ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP) সিস্টেমগুলি মানুষের ইনপুট এবং মেশিনগুলি বুঝতে পারে এমন কমান্ডগুলির মধ্যে ব্যবধান কমানোর জন্য প্রয়োজন৷ ভাষাবিজ্ঞান এনএলপির ভিত্তি তৈরি করে, কম্পিউটারগুলিকে আমাদের বোঝার এবং পাঠ্য বিশ্লেষণ বা অনুবাদ তৈরি করার মতো কাজগুলি সম্পাদন করার জন্য একটি অনুমানযোগ্য উপায় দেয়।
যেহেতু আরও দক্ষ ভাষাবিদরা NLP গবেষণায় যোগ দিচ্ছেন, AI সিস্টেমগুলি তাদের আউটপুট উন্নত করতে পারে। এটা বোঝা যায় যে অতীতের IOL অংশগ্রহণকারীরা MIT তে গেছেন বা গণনামূলক ভাষাবিজ্ঞানে কাজ করেছেন।
গেমে NLP অ্যাপ্লিকেশন | কৃত্রিম বুদ্ধিমত্তার বিস্ময় অসীম কারুশিল্প চেষ্টা করুন, আপনি এখানে যে কোনও কিছু তৈরি করতে পারেন
যেসব কোম্পানি অ্যাক্সেসিবিলিটি টুল তৈরি করে তারা ভাষাবিদদেরও নিয়োগ করে যারা দেখতে, শুনতে, কথা বলতে বা পড়তে পারে না এমন লোকদের মধ্যে যোগাযোগকে মসৃণভাবে সেতু করার পরিকল্পনা তৈরি করতে সাহায্য করে (উদাহরণস্বরূপ, স্পিচ-টু-টেক্সট মডেল তৈরি করা)। এর বাইরে, অনুবাদ, স্পিচ থেরাপি (দ্য কিংস স্পিচ মনে আছে?), প্রকাশনা এবং কারিগরি লেখালেখিতে সবসময় চাকরি আছে।
আমাদের পদকপ্রাপ্তদের জন্য, ভাষাতত্ত্বের সাথে তাদের ভবিষ্যৎ ক্যারিয়ার পরিকল্পনার একটি উত্তেজনাপূর্ণ যোগসূত্র রয়েছে। শ্রীলক্ষ্মী LLM জগতে এটি প্রয়োগ করতে আগ্রহী, কিন্তু স্বীকার করেছেন যে দক্ষতার আরও ঐতিহ্যগত ব্যবহার আমাদের ইতিহাসের জ্ঞানকে প্রসারিত করছে – ভাষাবিদ ছাড়া আমরা রোসেটা স্টোন-এর মতো প্রাচীন গ্রন্থের ব্যাখ্যা করতে সক্ষম হব না। অনেক দক্ষিণ এশীয় লিখন পদ্ধতি, যেমন সিন্ধু লিপি বা পুষ্করসারি, এখনও পাঠোদ্ধার করা হয়নি।
ভাষাবিদরাও বিপন্ন ভাষাগুলিকে সংরক্ষণ করতে সাহায্য করে, যা অনিমিকা প্রকল্প অন্বেষণ করে। তিনি তিব্বত-বর্মন এবং দক্ষিণ এশীয় ভাষা যেমন মুন্ডা, খাসি এবং সাঁওতালি সংরক্ষণের প্রতি আগ্রহী। “এছাড়া, আমি ভারতে আইওএল-এর জন্য নির্বাচন এবং প্রশিক্ষণ প্রক্রিয়ার সাথে জড়িত থাকব, এতে লেখা এবং পরিকল্পনার প্রশ্ন, সেইসাথে ভবিষ্যত দলকে প্রশিক্ষণ দেওয়া হবে।
আন্তর্জাতিক ভাষাবিজ্ঞান অলিম্পিয়াডে কীভাবে ভারতের প্রতিনিধিত্ব করবেন
পাণিনি লিঙ্গুইস্টিক অলিম্পিয়াড (পিএলও) এবং এশিয়া-প্যাসিফিক লিঙ্গুইস্টিক অলিম্পিয়াডে (এপিএলও) তাদের পারফরম্যান্সের ভিত্তিতে ভারতীয় দলের সদস্যদের নির্বাচিত করা হয়েছিল।
PLO গ্রেড 6 থেকে 8 (নিম্ন বিভাগ) এবং 9 থেকে 12 (উচ্চ বিভাগ) ছাত্রদের জন্য উন্মুক্ত এবং এটি IIIT দ্বারা সংগঠিত হায়দ্রাবাদ পাশে মাইক্রোসফট ইন্ডিয়া রিসার্চ ল্যাবরেটরি, জিনান ইউনিভার্সিটি দিল্লি, ইন্ডিয়া ইউনিভার্সিটি মুম্বাই. জাতীয় পরীক্ষাগুলি সারা দেশের নামকরা প্রতিষ্ঠানে অনুষ্ঠিত হয় যেমন ইনস্টিটিউট অফ ম্যাথমেটিক্স, চেন্নাই, ইন্ডিয়ান ইনস্টিটিউট অফ টেকনোলজি গুয়াহাটিএসএনএলটিআর কলকাতাএবং ইন্ডিয়ান ইনস্টিটিউট অফ টেকনোলজি পাটনা। PLO তে ভাল পারফর্ম করা 40 জন ছাত্রকে APLO তে পাঠানো হয় এবং তারপর তাদের মধ্যে সেরা পারফর্ম করা ছাত্রদেরকে IOL-তে ভারতের প্রতিনিধিত্ব করার জন্য IIIT-H কর্মশালায় প্রশিক্ষণ দেওয়া হয়। অলিম্পিক গেমস হবে তাইওয়ান পরের বছর
আইআইআইটি-এইচ-এর অধ্যাপক মণীশ শ্রীবাস্তব আমাদের জাতীয় সমন্বয়কারী হিসেবে কাজ করেন। তিনি ভারতের উন্নয়নের গল্পে ভাষাতত্ত্বের গুরুত্ব এবং উদ্ভাবনকে বাধাগ্রস্ত করে এমন সাংস্কৃতিক প্রতিবন্ধকতা দূর করতে সাহায্য করার সম্ভাবনা তুলে ধরেন। “যদি আমি এটিকে একটি ভারতীয় পরিবেশে নিয়ে আসি, সাধারণত একাধিক ভাষার জন্য, আমরা যদি বড় ভাষা মডেলের মতো শক্তিশালী AI সিস্টেম তৈরি করতে চাই, তাহলে আমাদের ভাষা অধ্যয়ন, ভাষাবিজ্ঞান এবং কৃত্রিম বুদ্ধিমত্তা একসাথে যুক্ত করা উচিত। যে মডেলগুলি বিপুল পরিমাণ ডেটার প্রয়োজন ছাড়াই দ্রুত শিখতে পারে, “তিনি ANI কে বলেছেন।
এছাড়াও চেষ্টা করুন | ইন্ডিয়ান ওয়ার্ডল স্পিন-অফ: তামিল, কাশ্মীরি, হিন্দি, বাংলা এবং মারাঠি ভাষায় ওয়ার্ড গেম তৈরি করুন
ভাষা সম্পর্কে গভীর উপলব্ধি অর্জনের পাশাপাশি, আইওএল অংশগ্রহণকারীরা অন্যান্য দেশের পাশাপাশি আয়োজক দেশের শিক্ষার্থীদের সাথে প্রাণবন্ত সাংস্কৃতিক বিনিময়ের অভিজ্ঞতা লাভ করে। “আমাদের স্থানীয় ব্রাজিলিয়ান ভাষা সম্পর্কে অনেক জ্ঞানের উন্মোচন হয়েছিল,” অনিমিহা ভারতীয় দলের ব্রাসিলিয়া সফর সম্পর্কে শেয়ার করেছেন। “আমাদের আদিবাসী স্মৃতিসৌধে নিয়ে যাওয়া হয়েছিল যেখানে আমরা তাদের ঐতিহ্য সম্পর্কে শেখার সুযোগ পেয়েছি!
যেহেতু ক্রিয়াকলাপটি একটি চাপপূর্ণ প্রতিযোগিতার পরিবর্তে সৃজনশীল সমৃদ্ধির উপর দৃষ্টি নিবদ্ধ করে, তাই এটি শিক্ষার্থীদের রোট শেখার থেকে বিরতি দেয়। “যদিও ইভেন্টটি একটি প্রতিযোগিতা ছিল, সবকিছু এমনভাবে সংগঠিত হয়েছিল যাতে আমরা একে অপরের সাথে সময় কাটাতে পারি এবং মজা করতে পারি। খুব উদ্বিগ্ন ব্যক্তির জন্য… আমি সেখানে পরিবেশে প্রবেশ করা আশ্চর্যজনকভাবে সহজ বলে মনে করেছি। ব্রাজিলীয় সংস্কৃতি, ব্রাজিলীয় সঙ্গীত, ব্রাজিলীয় নৃত্য ইত্যাদির সংস্পর্শে আসা উত্তেজনাপূর্ণ,” শ্রীলক্ষ্মী হাসেন।
সাম্বার মাধ্যমে পরবর্তী ভাষাবিজ্ঞান অলিম্পিয়াডে প্রবেশ করতে চান? পার্শ্বীয় চিন্তার অভ্যাস গড়ে তুলুন। প্রতিদিন শব্দ গেম অনুশীলন করুনভাষাতত্ত্বের নীতিগুলি পর্যালোচনা করুন এবং আপডেটের জন্য ioling.org এ যান। সুখী সমাধান!