মানুষের ভাষা উল্লেখযোগ্যভাবে সমৃদ্ধ এবং জটিল। তবুও তথ্য তত্ত্বের দৃষ্টিকোণ থেকে, একই ধারণাগুলি তাত্ত্বিকভাবে অনেক বেশি সংকুচিত বিন্যাসে প্রেরণ করা যেতে পারে। এটি একটি আকর্ষণীয় প্রশ্ন উত্থাপন করে: কেন লোকেরা কম্পিউটারের মতো ডিজিটাল সিস্টেমে এবং শূন্যের মধ্যে যোগাযোগ করে না?
মাইকেল হ্যান, একজন সারব্রুকেন-ভিত্তিক ভাষাবিদ, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের রিচার্ড ফুট্রেল, আরভিনের সাথে এই প্রশ্নের উত্তর দিতে বেরিয়েছিলেন। একসাথে, তারা একটি মডেল তৈরি করেছে যা ব্যাখ্যা করে যে কেন মানুষের ভাষা এটির মতো দেখাচ্ছে। সম্প্রতি তাদের গবেষণা প্রকাশিত হয়েছে প্রকৃতি মানুষের আচরণ.
মানুষের ভাষা এবং তথ্য দক্ষতা
সারা বিশ্বে প্রায় 7,000টি ভাষায় কথা বলা হয়। কিছু কিছু অবশিষ্ট স্পিকার দ্বারা ব্যবহৃত হয়, যখন অন্যান্য যেমন চীনা, ইংরেজি, স্প্যানিশ এবং হিন্দি কোটি কোটি মানুষ দ্বারা কথা বলা হয়। তাদের পার্থক্য সত্ত্বেও, সমস্ত ভাষা একই অপরিহার্য উদ্দেশ্য পরিবেশন করে। তারা বাক্যাংশে শব্দগুলিকে একত্রিত করে অর্থ প্রকাশ করে, যা পরে বাক্যে সংগঠিত হয়। প্রতিটি অংশের নিজস্ব অর্থ রয়েছে এবং তারা একসাথে একটি স্পষ্ট বার্তা তৈরি করে।
মাইকেল হ্যান ব্যাখ্যা করেন, “এটি আসলে একটি খুব জটিল কাঠামো। যেহেতু প্রাকৃতিক বিশ্ব দক্ষতা বাড়াতে এবং সম্পদ সংরক্ষণের প্রবণতা রাখে, তাই এটি জিজ্ঞাসা করা সম্পূর্ণরূপে যুক্তিসঙ্গত যে কেন মস্তিষ্ক কম্পিউটারের মতো ডিজিটাল পদ্ধতির পরিবর্তে ভাষাগত তথ্যকে এত জটিল উপায়ে এনকোড করে।” তাত্ত্বিকভাবে, বক্তৃতাকে এক এবং শূন্যের বাইনারি ক্রম হিসাবে এনকোড করা আরও কার্যকর হবে কারণ এটি কথ্য ভাষার চেয়ে আরও শক্তভাবে তথ্য সংকুচিত করে। তাহলে মানুষ কেন স্টার ওয়ার্স থেকে R2-D2 এর মতো যোগাযোগ করে না? হ্যান এবং ফুট্রেল বিশ্বাস করেন যে তারা উত্তর খুঁজে পেয়েছেন।
ভাষা বাস্তব বিশ্বের অভিজ্ঞতার উপর নির্মিত
মাইকেল হ্যান বলেছেন, “মানুষের ভাষা আমাদের চারপাশের জীবনের বাস্তবতা দ্বারা রূপায়িত হয়।” “উদাহরণস্বরূপ, আমি যদি অর্ধেক কুকুরের সাথে অর্ধেক বিড়ালের কথা বলি এবং আমি এটিকে বিমূর্ত শব্দ ‘বৃত্তাকার’ ব্যবহার করে উল্লেখ করি, তবে কেউ জানবে না যে আমি কী বোঝাতে চাইছি, কারণ এটি নিশ্চিত যে কেউ কখনও একটি রাউন্ড দেখেনি – এটি কেবল কারও জীবনের অভিজ্ঞতাকে প্রতিফলিত করে না। সমানভাবে, ‘বিড়াল’ এবং ‘কুকুর’ শব্দগুলিকে মিশ্রিত করার কোনও অর্থ নেই তবে একই অক্ষরগুলির মধ্যে একটি অক্ষর ব্যবহার করা অসম্ভব। ব্যাখ্যা করা হয়,” তিনি যোগ করেন।
“গ্যাডকট” এর মতো একটি স্ক্র্যাম্বল ফর্ম টেকনিক্যালি উভয় শব্দের অক্ষর ধারণ করে, কিন্তু শ্রোতাদের কাছে এটি অর্থহীন। বিপরীতে, “বিড়াল এবং কুকুর” বাক্যাংশটি অবিলম্বে অর্থপূর্ণ কারণ উভয় প্রাণীই পরিচিত ধারণা। মানুষের ভাষা কাজ করে কারণ এটি সরাসরি শেয়ার করা জ্ঞান এবং জীবিত অভিজ্ঞতার সাথে সংযোগ স্থাপন করে।
মস্তিষ্ক পরিচিত নিদর্শন পছন্দ করে
হ্যান এইভাবে ফলাফলগুলিকে সংক্ষিপ্ত করেছেন: “সহজভাবে বলতে গেলে, আমাদের মস্তিষ্কের পক্ষে এমন একটি পথ নেওয়া সহজ যা আরও জটিল বলে মনে হতে পারে।” যদিও প্রাকৃতিক ভাষা সর্বাধিক সংকুচিত হয় না, তবুও এটি মস্তিষ্কে খুব কম চাপ দেয়। এর কারণ হল আমরা ইতিমধ্যে বিশ্ব সম্পর্কে যা জানি তার সাথে মস্তিষ্ক ক্রমাগত মিথস্ক্রিয়ায় শব্দগুলি প্রক্রিয়া করে।
একটি সম্পূর্ণ ডিজিটাল কোড দ্রুত তথ্য প্রেরণ করতে পারে, কিন্তু এটি দৈনন্দিন অভিজ্ঞতা থেকে ভিন্ন হবে। হ্যান এটিকে কাজের সাথে ড্রাইভিং এর সাথে তুলনা করেছেন: “আমাদের স্বাভাবিক যাতায়াতে, রুটটি আমাদের কাছে এতটাই পরিচিত যে ড্রাইভটি প্রায় অটোপাইলটের মতো। আমাদের মস্তিষ্ক ঠিক কী আশা করতে হবে তা জানে, তাই এটির জন্য যে প্রচেষ্টা করা দরকার তা অনেক কম। একটি সংক্ষিপ্ত কিন্তু কম পরিচিত রুট গ্রহণ করা আরও ক্লান্তিকর বোধ করে, কারণ নতুন রুটটি গাড়ি চালানোর সময় আমাদের আরও বেশি মনোযোগী হতে চায়।” একটি গাণিতিক দৃষ্টিকোণ থেকে, তিনি বলেন, “আমরা যখন পরিচিত, প্রাকৃতিক উপায়ে কথা বলি তখন মস্তিষ্ককে প্রক্রিয়া করতে হয় এমন বিটের সংখ্যা খুবই কম।”
অন্য কথায়, বাইনারি কোড বলা এবং বোঝার জন্য বক্তা এবং শ্রোতা উভয়ের কাছ থেকে আরও মানসিক প্রচেষ্টার প্রয়োজন হবে। পরিবর্তে, মস্তিষ্ক ক্রমাগত অনুমান করে যে কিছু শব্দ এবং বাক্যাংশ পরবর্তীতে আসার সম্ভাবনা কতটা। যেহেতু আমরা কয়েক দশক ধরে প্রতিদিন আমাদের স্থানীয় ভাষা ব্যবহার করি, এই নিদর্শনগুলি গভীরভাবে এম্বেড হয়ে যায়, যা যোগাযোগকে সহজ এবং কম চাহিদাপূর্ণ করে তোলে।
ভবিষ্যদ্বাণীমূলক প্রক্রিয়াকরণ কীভাবে বক্তৃতাকে আকার দেয়
হ্যান একটি সুস্পষ্ট উদাহরণ প্রদান করেন: “যখন আমি জার্মান শব্দগুচ্ছ ‘Die funf grüne Autos’ (ইংরেজি: ‘The Five green cars’) বলি, তখন এই বাক্যাংশটি অন্য একজন জার্মান স্পিকারের কাছে অবশ্যই অর্থপূর্ণ হবে, যেখানে ‘Grünen funf die Autos’ (ইংরেজি: ‘The Five green cars’) হবে না,” তিনি বলেছেন।
যখন কেউ “ডাই ফানফ গ্রুনেন অটোস” শোনে, মস্তিষ্ক অবিলম্বে অর্থ ব্যাখ্যা করতে শুরু করে। “মরা” শব্দটি ব্যাকরণগত কিছু সম্ভাবনার ইঙ্গিত দেয়। একজন জার্মান শ্রোতা অবিলম্বে বিকল্পগুলিকে সীমিত করতে পারে, পুংলিঙ্গ বা নিরপেক্ষ একবচন বিশেষ্যকে বাতিল করে। পরের শব্দ, “fnaf”, প্রেম বা তৃষ্ণার মত বিমূর্ত ধারণা ছাড়া গণনাযোগ্য কিছু প্রস্তাব করে। তারপর “গ্রুনেন” নির্দেশ করে যে বিশেষ্যটি বহুবচন এবং সবুজ হবে। সেই সময়ে, বস্তুগুলি গাড়ি, কলা বা ব্যাঙ হতে পারে। কেবলমাত্র যখন শেষ শব্দ, “অটোস” উচ্চারিত হয়, তখনই অর্থটি সম্পূর্ণরূপে সেট করা হয়৷ প্রতিটি শব্দের সাথে, মস্তিষ্ক অনিশ্চয়তা হ্রাস করে যতক্ষণ না শুধুমাত্র একটি ব্যাখ্যা অবশিষ্ট থাকে।
বিপরীতে, “গ্রুনেন ফানফ ডাই অটোস” এই অনুমানযোগ্য প্যাটার্নটি ব্যাহত করে। প্রত্যাশিত ব্যাকরণগত সংকেতগুলি ভুল ক্রমে প্রদর্শিত হয়, তাই মস্তিষ্ক ক্রম থেকে সহজে অর্থ তৈরি করতে পারে না।
এআই এবং ভাষা মডেলের জন্য প্রভাব
হ্যান এবং ফুট্রেল গাণিতিকভাবে এই নিদর্শনগুলি প্রদর্শন করতে সক্ষম হন। তাদের অনুসন্ধান, প্রকাশিত প্রকৃতি মানুষের আচরণদেখান যে মানব ভাষা সর্বাধিক কম্প্রেশনের চেয়ে জ্ঞানীয় লোড কমিয়ে আনাকে অগ্রাধিকার দেয়।
এই অন্তর্দৃষ্টিগুলি বৃহৎ ভাষা মডেল (এলএলএম), ChatGPT বা মাইক্রোসফ্ট-এর কপিলট-এর মতো জেনারেটিভ এআই সরঞ্জামগুলির পিছনে সিস্টেমগুলির উন্নতিগুলিও জানাতে পারে। মানব মস্তিষ্ক কীভাবে ভাষা প্রক্রিয়া করে তা আরও ভালভাবে বোঝার মাধ্যমে, গবেষকরা এআই সিস্টেমগুলি ডিজাইন করতে পারেন যা প্রাকৃতিক যোগাযোগের ধরণগুলির সাথে আরও ঘনিষ্ঠভাবে সারিবদ্ধ।