1930-এর দশকে, জন ভন নিউম্যান এবং অস্কার মর্গেনস্টার গণিতের একটি নতুন এবং আকর্ষণীয় শাখার প্রতিষ্ঠাতা হয়ে ওঠেন যার নাম "গেম থিওরি"। 1950 এর দশকে, তরুণ গণিতবিদ জন ন্যাশ এই দিকে আগ্রহী হয়ে ওঠেন। ভারসাম্যের তত্ত্বটি তার গবেষণার বিষয় হয়ে ওঠে, যা তিনি 21 বছর বয়সে লিখেছিলেন। এইভাবে "ন্যাশ ইকুইলিব্রিয়াম" নামে একটি নতুন খেলার কৌশলের জন্ম হয়েছিল, যা বহু বছর পরে নোবেল পুরস্কার জিতেছিল - 1994 সালে।
একটি গবেষণামূলক লেখা এবং সাধারণ স্বীকৃতির মধ্যে দীর্ঘ ব্যবধান একজন গণিতবিদদের জন্য একটি পরীক্ষায় পরিণত হয়েছে। স্বীকৃতি ছাড়াই প্রতিভা গুরুতর মানসিক ব্যাধিতে পরিণত হয়েছিল, কিন্তু জন ন্যাশ তার চমৎকার যৌক্তিক মনের জন্য ধন্যবাদ এই সমস্যাটি সমাধান করতে সক্ষম হয়েছিল। তার ন্যাশ ইকুইলিব্রিয়াম তত্ত্ব নোবেল পুরস্কার জিতেছে এবং তার জীবন সুন্দর মনে চিত্রায়িত হয়েছে।
গেম তত্ত্ব সম্পর্কে সংক্ষেপে
যেহেতু ন্যাশ ভারসাম্য তত্ত্ব মিথস্ক্রিয়া অবস্থার মধ্যে মানুষের আচরণ ব্যাখ্যা করে, এটি গেম তত্ত্বের মৌলিক ধারণাগুলি বিবেচনা করা মূল্যবান৷
গেম তত্ত্ব একটি খেলার মত একে অপরের সাথে মিথস্ক্রিয়া পরিপ্রেক্ষিতে অংশগ্রহণকারীদের (এজেন্টদের) আচরণ অধ্যয়ন করে, যখন ফলাফল বেশ কয়েকটি ব্যক্তির সিদ্ধান্ত এবং আচরণের উপর নির্ভর করে।অংশগ্রহণকারী অন্যদের আচরণ সম্পর্কে তার ভবিষ্যদ্বাণীর ভিত্তিতে সিদ্ধান্ত নেয়, যাকে খেলার কৌশল বলা হয়।
এছাড়াও একটি প্রভাবশালী কৌশল রয়েছে যেখানে অংশগ্রহণকারী অন্যান্য অংশগ্রহণকারীদের যেকোনো আচরণের জন্য সেরা ফলাফল পায়। এটি খেলোয়াড়ের সেরা জয়-জয় কৌশল।
বন্দীর দ্বিধা এবং বৈজ্ঞানিক অগ্রগতি
বন্দীদের দ্বিধা হল এমন একটি খেলার ক্ষেত্রে যেখানে অংশগ্রহণকারীরা যুক্তিসঙ্গত সিদ্ধান্ত নিতে বাধ্য হয়, বিকল্পের দ্বন্দ্বের মুখে একটি সাধারণ লক্ষ্য অর্জন করে। প্রশ্ন হল এই বিকল্পগুলির মধ্যে তিনি কোনটি বেছে নেবেন, ব্যক্তিগত এবং সাধারণ স্বার্থ উপলব্ধি করার পাশাপাশি উভয়ই পাওয়ার অসম্ভবতা। খেলোয়াড়দের একটি কঠিন খেলার পরিবেশে বন্দী করা হয়েছে বলে মনে হয়, যা তাদের মাঝে মাঝে খুব ফলপ্রসূভাবে চিন্তা করে।
এই দ্বিধাটি আমেরিকান গণিতবিদ জন ন্যাশ অন্বেষণ করেছিলেন। তিনি যে ভারসাম্য বজায় রেখেছিলেন তা তার নিজস্ব উপায়ে বিপ্লবী ছিল। বিশেষ করে উজ্জ্বলভাবে এই নতুন চিন্তা অর্থনীতিবিদদের মতামতকে প্রভাবিত করেছে কিভাবে বাজারের খেলোয়াড়রা পছন্দ করে, অন্যদের স্বার্থ বিবেচনা করে, ঘনিষ্ঠ মিথস্ক্রিয়া এবং স্বার্থের ছেদ নিয়ে।
কংক্রিট উদাহরণের মাধ্যমে গেম থিওরি অধ্যয়ন করা ভাল, যেহেতু এই গাণিতিক শৃঙ্খলা নিজেই শুষ্কভাবে তাত্ত্বিক নয়।
বন্দীর দ্বিধা উদাহরণ
উদাহরণ, দুই ব্যক্তি একটি ডাকাতি করেছে, পুলিশের হাতে পড়েছে এবং পৃথক সেলে জিজ্ঞাসাবাদ করা হচ্ছে। একই সময়ে, পুলিশ অফিসাররা প্রত্যেক অংশগ্রহণকারীকে অনুকূল শর্ত দেয় যার অধীনে সে তার সঙ্গীর বিরুদ্ধে সাক্ষ্য দিলে তাকে মুক্তি দেওয়া হবে। প্রতিটিঅপরাধীদের নিম্নলিখিত কৌশল রয়েছে যা সে বিবেচনা করবে:
- উভয়েই একই সময়ে সাক্ষ্য দেয় এবং ২.৫ বছরের জেল হয়।
- দুজনেই একই সময়ে নীরব থাকে এবং প্রত্যেকে ১ বছর পাবে, কারণ এই ক্ষেত্রে তাদের অপরাধের প্রমাণের ভিত্তি ছোট হবে।
- একজন সাক্ষ্য দেয় এবং মুক্তি পায়, অন্যজন নীরব থাকে এবং ৫ বছরের জেল হয়।
অবশ্যই, মামলার ফলাফল উভয় অংশগ্রহণকারীদের সিদ্ধান্তের উপর নির্ভর করে, কিন্তু তারা একমত হতে পারে না, কারণ তারা বিভিন্ন কক্ষে বসে আছে। অভিন্ন স্বার্থের লড়াইয়ে তাদের ব্যক্তিগত স্বার্থের সংঘাতও স্পষ্টভাবে দৃশ্যমান। বন্দীদের প্রত্যেকের কর্মের জন্য দুটি বিকল্প এবং ফলাফলের জন্য 4টি বিকল্প রয়েছে৷
যৌক্তিক অনুমানের চেইন
সুতরাং, অপরাধী A নিম্নলিখিত বিকল্পগুলি বিবেচনা করছে:
- আমি নীরব আর আমার সঙ্গী নীরব - আমরা দুজনেই ১ বছরের জেল পাব।
- আমি আমার সঙ্গীকে পরিণত করি এবং সে আমাকে ফিরিয়ে দেয় - আমরা দুজনেই 2.5 বছরের জেল পাব।
- আমি নীরব, এবং আমার সঙ্গী আমার সাথে বিশ্বাসঘাতকতা করেছে - আমি 5 বছর জেলে যাব, এবং সে মুক্ত হবে৷
- আমি আমার সঙ্গীকে হস্তান্তর করি, কিন্তু সে নীরব - আমি স্বাধীনতা পাই, এবং সে 5 বছরের জেল হয়।
আসুন স্বচ্ছতার জন্য সম্ভাব্য সমাধান এবং ফলাফলের একটি ম্যাট্রিক্স দেওয়া যাক।
বন্দীর দ্বিধাদ্বন্দ্বের সম্ভাব্য ফলাফলের সারণী।
প্রশ্ন হল, প্রত্যেক প্রতিযোগী কি বেছে নেবে?
"চুপ থাকুন, আপনি কথা বলতে পারবেন না" বা "চুপ থাকতে পারবেন না, আপনি কথা বলতে পারবেন না"
অংশগ্রহণকারীর পছন্দ বোঝার জন্য, আপনাকে তার চিন্তাধারার মধ্য দিয়ে যেতে হবে। অপরাধী A এর যুক্তি অনুসরণ করে: যদি আমি নীরব থাকি এবং আমার সঙ্গী নীরব থাকে, তাহলে আমরা ন্যূনতম মেয়াদ (1 বছর) পাব, কিন্তু আমিআমি জানি না সে কেমন আচরণ করবে। সে যদি আমার বিরুদ্ধে সাক্ষ্য দেয়, তাহলে সাক্ষ্য দেওয়াই আমার জন্য ভালো, নইলে আমি ৫ বছর বসে থাকতে পারি। আমি 5 বছরের চেয়ে 2.5 বছর বসে থাকতে চাই। যদি সে নীরব থাকে, তবে আমার আরও বেশি সাক্ষ্য দেওয়া দরকার, কারণ আমি আমার স্বাধীনতা পাব। অংশগ্রহণকারী B.
এটা দেখা কঠিন নয় যে প্রত্যেক অপরাধীর জন্য প্রভাবশালী কৌশল সাক্ষ্য দেওয়া। এই গেমের সর্বোত্তম পয়েন্টটি আসে যখন উভয় অপরাধী সাক্ষ্য দেয় এবং তাদের "পুরষ্কার" গ্রহণ করে - 2.5 বছরের জেল। ন্যাশ গেম থিওরি এই ভারসাম্যকে বলে।
অ-অপটিমাল সর্বোত্তম ন্যাশ সমাধান
নাশিয়ান দৃষ্টিভঙ্গির বৈপ্লবিক প্রকৃতি হল যে ব্যক্তিগত অংশগ্রহণকারী এবং তার স্বার্থ বিবেচনা করার সময় এই ধরনের ভারসাম্য সর্বোত্তম নয়। সর্বোপরি, সর্বোত্তম বিকল্প হল নীরব থাকা এবং মুক্ত হওয়া।
ন্যাশ ভারসাম্য হল স্বার্থের মিলনের একটি বিন্দু, যেখানে প্রতিটি অংশগ্রহণকারী তার জন্য সর্বোত্তম বিকল্পটি বেছে নেয় শুধুমাত্র যদি অন্য অংশগ্রহণকারীরা একটি নির্দিষ্ট কৌশল বেছে নেয়।
অপশন বিবেচনা করে যখন উভয় অপরাধী নীরব থাকে এবং মাত্র 1 বছর পায়, আমরা একে প্যারেটো-অপ্টিমাল বিকল্প বলতে পারি। তবে অপরাধীরা আগে থেকে রাজি হতে পারলেই তা সম্ভব। তবে এটিও এই ফলাফলের গ্যারান্টি দেবে না, যেহেতু চুক্তি থেকে পিছু হটতে এবং শাস্তি এড়াতে প্রলোভনটি দুর্দান্ত। একে অপরের প্রতি সম্পূর্ণ আস্থার অভাব এবং 5 বছর পাওয়ার বিপদ স্বীকৃতি সহ বিকল্পটি বেছে নিতে বাধ্য হয়। অংশগ্রহণকারীরা কি মেনে চলবে তার প্রতিফলননীরবতার সাথে বিকল্প, কনসার্টে অভিনয় করা, কেবল অযৌক্তিক। আমরা যদি ন্যাশ ভারসাম্য অধ্যয়ন করি তাহলে এই ধরনের উপসংহার টানা যেতে পারে। উদাহরণ শুধুমাত্র আপনি সঠিক প্রমাণিত.
স্বার্থপর বা যুক্তিবাদী
ন্যাশ ভারসাম্য তত্ত্ব চমকপ্রদ সিদ্ধান্তে উপনীত হয়েছে যা পূর্বে বিদ্যমান নীতিগুলিকে অস্বীকার করেছে। উদাহরণস্বরূপ, অ্যাডাম স্মিথ অংশগ্রহণকারীদের প্রত্যেকের আচরণকে সম্পূর্ণ স্বার্থপর বলে বিবেচনা করেছিলেন, যা সিস্টেমটিকে ভারসাম্য এনেছিল। এই তত্ত্বটিকে বলা হত "বাজারের অদৃশ্য হাত।"
জন ন্যাশ দেখেছিলেন যে সমস্ত অংশগ্রহণকারীরা যদি তাদের নিজস্ব স্বার্থে কাজ করে তবে এটি কখনই একটি সর্বোত্তম গ্রুপ ফলাফলের দিকে নিয়ে যাবে না। প্রতিটি অংশগ্রহণকারীর মধ্যে যৌক্তিক চিন্তাভাবনা অন্তর্নিহিত রয়েছে তা বিবেচনা করে, ন্যাশ ভারসাম্য কৌশল দ্বারা প্রস্তাবিত পছন্দের সম্ভাবনা বেশি৷
শুদ্ধভাবে পুরুষ পরীক্ষা
একটি প্রধান উদাহরণ হ'ল স্বর্ণকেশী প্যারাডক্স গেম, যা আপাতদৃষ্টিতে স্থানের বাইরে, ন্যাশ গেম তত্ত্ব কীভাবে কাজ করে তার একটি স্পষ্ট চিত্র।
এই গেমটিতে আপনাকে কল্পনা করতে হবে যে ফ্রি ছেলেদের একটি কোম্পানি একটি বারে এসেছে। কাছাকাছি মেয়েদের একটি কোম্পানি, যার মধ্যে একটি অন্যদের থেকে পছন্দনীয়, একটি স্বর্ণকেশী বলে। ছেলেরা নিজেদের জন্য সেরা গার্লফ্রেন্ড পেতে কীভাবে আচরণ করে?
সুতরাং, ছেলেদের যুক্তি: সবাই যদি স্বর্ণকেশীর সাথে পরিচিত হতে শুরু করে, তবে সম্ভবত, কেউ এটি পাবে না, তারপরে তার বন্ধুরা পরিচিত হতে চাইবে না। কেউ দ্বিতীয় ফলব্যাক হতে চায় না. কিন্তু ছেলেরা বেছে নিলে এড়িয়ে যায়স্বর্ণকেশী, তাহলে প্রতিটি ছেলের জন্য মেয়েদের মধ্যে একটি ভাল বান্ধবী খুঁজে পাওয়ার সম্ভাবনা বেশি৷
ন্যাশ ভারসাম্য পরিস্থিতি ছেলেদের জন্য অনুকূল নয়, কারণ, শুধুমাত্র তাদের নিজস্ব স্বার্থপরতা অনুসরণ করে, সবাই স্বর্ণকেশী বেছে নেবে। দেখা যায়, শুধুমাত্র স্বার্থপরতা সাধন করা গোষ্ঠীগত স্বার্থের পতনের সামিল হবে। ন্যাশ ভারসাম্যের অর্থ হবে যে প্রতিটি লোক তার নিজস্ব স্বার্থে কাজ করে, যা পুরো গোষ্ঠীর স্বার্থের সাথে যোগাযোগ করে। এটি ব্যক্তিগতভাবে সবার জন্য সর্বোত্তম বিকল্প নয়, তবে সাফল্যের সামগ্রিক কৌশলের উপর ভিত্তি করে সবার জন্য সেরা।
আমাদের পুরো জীবনটাই একটা খেলা
বাস্তব জগতে সিদ্ধান্ত নেওয়া অনেকটা এমন একটি খেলার মতো যেখানে আপনি অন্যান্য অংশগ্রহণকারীদের কাছ থেকেও কিছু যুক্তিপূর্ণ আচরণ আশা করেন। ব্যবসায়, কর্মক্ষেত্রে, একটি দলে, একটি কোম্পানিতে এবং এমনকি বিপরীত লিঙ্গের সাথে সম্পর্কের ক্ষেত্রেও। বড় ডিল থেকে শুরু করে সাধারণ জীবন পরিস্থিতি, সবকিছুই এক বা অন্য আইন মেনে চলে।
অবশ্যই, অপরাধীদের সাথে উপরোক্ত খেলার পরিস্থিতি এবং একটি বার শুধুমাত্র চমৎকার চিত্র যা ন্যাশ ভারসাম্য প্রদর্শন করে। এই ধরনের দ্বিধাগুলির উদাহরণ প্রায়ই বাস্তব বাজারে দেখা দেয়, এবং এটি বিশেষ করে এমন ক্ষেত্রে কাজ করে যেখানে দুটি একচেটিয়া বাজার নিয়ন্ত্রণ করে৷
মিশ্র কৌশল
প্রায়শই আমরা একটি নয়, একাধিক গেমের সাথে জড়িত থাকি। একটি গেমের বিকল্পগুলির মধ্যে একটি বেছে নেওয়া, একটি যুক্তিসঙ্গত কৌশল দ্বারা পরিচালিত, কিন্তু আপনি অন্য গেমে শেষ হয়ে যাবেন। কিছু যৌক্তিক সিদ্ধান্তের পরে, আপনি দেখতে পাবেন যে আপনার ফলাফল আপনার পছন্দের নয়। কিনিবেন?
আসুন দুই ধরনের কৌশল বিবেচনা করি:
- বিশুদ্ধ কৌশল হল অংশগ্রহণকারীর আচরণ, যা অন্যান্য অংশগ্রহণকারীদের সম্ভাব্য আচরণ সম্পর্কে চিন্তাভাবনা থেকে আসে।
- মিশ্র কৌশল বা এলোমেলো কৌশল হল এলোমেলোভাবে বিশুদ্ধ কৌশলগুলির বিকল্প বা একটি নির্দিষ্ট সম্ভাবনা সহ একটি বিশুদ্ধ কৌশল বেছে নেওয়া। এই কৌশলটিকে র্যান্ডমাইজডও বলা হয়৷
এই আচরণ বিবেচনা করে, আমরা ন্যাশ ভারসাম্যের একটি নতুন চেহারা পাই। যদি আগে বলা হয় যে খেলোয়াড় একবার কৌশল বেছে নেয়, তাহলে অন্য আচরণ কল্পনা করা যেতে পারে। এটা অনুমান করা যেতে পারে যে খেলোয়াড়রা একটি নির্দিষ্ট সম্ভাবনার সাথে এলোমেলোভাবে একটি কৌশল বেছে নেয়। যে গেমগুলি খাঁটি কৌশলে ন্যাশের ভারসাম্য খুঁজে পায় না সেগুলি সর্বদা মিশ্র কৌশলে থাকে৷
মিশ্র কৌশলে ন্যাশ ভারসাম্যকে মিশ্র ভারসাম্য বলে। এটি একটি ভারসাম্য যেখানে প্রতিটি অংশগ্রহণকারী তার কৌশলগুলি বেছে নেওয়ার সর্বোত্তম ফ্রিকোয়েন্সি বেছে নেয়, তবে শর্ত থাকে যে অন্যান্য অংশগ্রহণকারীরা একটি প্রদত্ত ফ্রিকোয়েন্সি সহ তাদের কৌশল বেছে নেয়।
দণ্ড এবং মিশ্র কৌশল
ফুটবল খেলায় মিশ্র কৌশলের উদাহরণ পাওয়া যেতে পারে। একটি মিশ্র কৌশলের সেরা দৃষ্টান্ত সম্ভবত একটি পেনাল্টি শুটআউট। সুতরাং, আমাদের একজন গোলরক্ষক আছে যে শুধুমাত্র এক কোণে ঝাঁপ দিতে পারে, এবং একজন খেলোয়াড় যে পেনাল্টি নেবে।
সুতরাং, প্লেয়ার যদি প্রথমবার বাম কোণে শ্যুট করার কৌশল বেছে নেয় এবং গোলরক্ষকও এই কর্নারে পড়ে বলটি ধরেন, তাহলে দ্বিতীয়বার কীভাবে জিনিসগুলি বিকাশ করতে পারে? খেলোয়াড় হলেবিপরীত কোণে আঘাত করবে, এটি সম্ভবত খুব স্পষ্ট, কিন্তু একই কোণে আঘাত করা কম স্পষ্ট নয়। অতএব, গোলরক্ষক এবং কিকার উভয়েরই এলোমেলো নির্বাচনের উপর নির্ভর করা ছাড়া কোন বিকল্প নেই।
এইভাবে, একটি নির্দিষ্ট বিশুদ্ধ কৌশলের সাথে এলোমেলো নির্বাচনের মাধ্যমে, খেলোয়াড় এবং গোলরক্ষক সর্বোচ্চ ফলাফল পাওয়ার চেষ্টা করেন।