পরিসংখ্যান দীর্ঘদিন ধরে জীবনের একটি অবিচ্ছেদ্য অংশ। মানুষ সর্বত্র এটির মুখোমুখি হয়। পরিসংখ্যানের উপর ভিত্তি করে, কোথায় এবং কোন রোগগুলি সাধারণ, একটি নির্দিষ্ট অঞ্চলে বা জনসংখ্যার একটি নির্দিষ্ট অংশের মধ্যে কীসের চাহিদা বেশি সে সম্পর্কে সিদ্ধান্ত নেওয়া হয়। এমনকি সরকারী সংস্থার প্রার্থীদের রাজনৈতিক কর্মসূচির নির্মাণ পরিসংখ্যানগত তথ্যের উপর ভিত্তি করে। তারা পণ্য কেনার সময় খুচরা চেইন দ্বারা ব্যবহার করা হয়, এবং নির্মাতারা তাদের প্রস্তাবে এই তথ্য দ্বারা পরিচালিত হয়৷
পরিসংখ্যান সমাজের জীবনে একটি গুরুত্বপূর্ণ ভূমিকা পালন করে এবং এর প্রতিটি পৃথক সদস্যকে প্রভাবিত করে, এমনকি ছোট জিনিসগুলিতেও। উদাহরণস্বরূপ, যদি পরিসংখ্যান অনুসারে, বেশিরভাগ লোকেরা একটি নির্দিষ্ট শহর বা অঞ্চলের পোশাকগুলিতে গাঢ় রঙ পছন্দ করে, তবে স্থানীয় আউটলেটগুলিতে ফুলের প্রিন্ট সহ একটি উজ্জ্বল হলুদ রেইনকোট খুঁজে পাওয়া অত্যন্ত কঠিন হবে। কিন্তু কি পরিমাণএই তথ্য যোগ আপ যেমন একটি প্রভাব আছে? উদাহরণস্বরূপ, "পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ" কি? এই সংজ্ঞা দ্বারা ঠিক কি বোঝানো হয়েছে?
এটা কি?
বিজ্ঞান হিসাবে পরিসংখ্যান বিভিন্ন পরিমাণ এবং ধারণার সমন্বয়ে গঠিত। তাদের মধ্যে একটি হল "পরিসংখ্যানগত তাত্পর্য" ধারণা। এটি ভেরিয়েবলের মানের নাম, অন্যান্য সূচকের উপস্থিতির সম্ভাবনা যার মধ্যে নগণ্য।
উদাহরণস্বরূপ, 10 জনের মধ্যে 9 জন লোক বৃষ্টির রাতের পরে শরতের বনে মাশরুমের জন্য সকালে হাঁটার সময় তাদের পায়ে রাবারের জুতা পরে। কোনো কোনো সময়ে তাদের মধ্যে 8টি ক্যানভাস মোকাসিনে রাখার সম্ভাবনা নগণ্য। সুতরাং, এই বিশেষ উদাহরণে, 9 নম্বরটিকে "পরিসংখ্যানগত তাত্পর্য" বলা হয়৷
তদনুসারে, যদি আমরা প্রদত্ত বাস্তব উদাহরণটি আরও বিকাশ করি, তবে জুতার দোকানগুলি বছরের অন্যান্য সময়ের তুলনায় গ্রীষ্মের মরসুমের শেষে রাবারের বুট বেশি পরিমাণে ক্রয় করে। এইভাবে, পরিসংখ্যানগত মূল্যের মাত্রা সাধারণ জীবনে প্রভাব ফেলে৷
অবশ্যই, জটিল গণনায়, বলুন, ভাইরাসের বিস্তারের পূর্বাভাস দেওয়ার সময়, প্রচুর সংখ্যক ভেরিয়েবলকে বিবেচনায় নেওয়া হয়। কিন্তু পরিসংখ্যানগত তথ্যের একটি উল্লেখযোগ্য সূচক নির্ধারণের সারমর্ম একই রকম, গণনার জটিলতা এবং পরিবর্তনশীল মানের সংখ্যা নির্বিশেষে।
এটা কিভাবে গণনা করা হয়?
সমীকরণের "পরিসংখ্যানগত তাত্পর্য" সূচকের মান গণনা করার সময় ব্যবহৃত হয়। অর্থাৎ, যুক্তি দেওয়া যেতে পারে যে এই ক্ষেত্রে সবকিছু গণিত দ্বারা নির্ধারিত হয়।সবচেয়ে সহজ গণনার বিকল্প হল গাণিতিক ক্রিয়াকলাপের একটি চেইন, যাতে নিম্নলিখিত পরামিতিগুলি জড়িত:
- সমীক্ষা বা উদ্দেশ্যমূলক ডেটার অধ্যয়ন থেকে প্রাপ্ত দুই ধরনের ফলাফল, যেমন ক্রয়ের পরিমাণ, a এবং b দ্বারা চিহ্নিত;
- উভয় গ্রুপের জন্য নমুনা আকার নির্দেশক – n;
- সম্মিলিত নমুনা শেয়ারের মূল্য - p;
- মান ত্রুটি - SE.
পরবর্তী ধাপে সামগ্রিক পরীক্ষার স্কোর নির্ধারণ করা হয় - t, এর মান 1.96 নম্বরের সাথে তুলনা করা হয়। 1.96 হল গড় মান, যা ছাত্রদের টি-বন্টন ফাংশন অনুসারে 95% এর পরিসর বহন করে।
ন এবং পি-এর মানের মধ্যে পার্থক্য কী তা নিয়ে প্রায়ই প্রশ্ন ওঠে। এই nuance একটি উদাহরণ দিয়ে স্পষ্ট করা সহজ. ধরা যাক যে কোন পণ্য বা ব্র্যান্ডের পুরুষ ও মহিলাদের আনুগত্যের পরিসংখ্যানগত তাত্পর্য গণনা করা হয়৷
এই ক্ষেত্রে, অক্ষরগুলি নিম্নলিখিতগুলি অনুসরণ করবে:
- n - উত্তরদাতাদের সংখ্যা;
- p - পণ্যের সাথে সন্তুষ্ট সংখ্যা।
এই ক্ষেত্রে ইন্টারভিউ নেওয়া মহিলাদের সংখ্যা n1 হিসাবে মনোনীত করা হবে। তদনুসারে, পুরুষ - n2. একই মানের p প্রতীকের "1" এবং "2" সংখ্যা থাকবে।
পরীক্ষার স্কোরের সাথে ছাত্রদের স্প্রেডশীটের গড় তুলনা করাকে "পরিসংখ্যানগত তাৎপর্য" বলা হয়।
যাচাই বলতে কি বোঝায়?
যেকোন গাণিতিক গণনার ফলাফল সর্বদা পরীক্ষা করা যেতে পারে, এটি প্রাথমিক বিদ্যালয়ে শিশুদের শেখানো হয়। এটা অনুমান করা যৌক্তিকযেহেতু পরিসংখ্যান গণনার চেইন ব্যবহার করে নির্ধারণ করা হয়, তারপর সেগুলি পরীক্ষা করা হয়।
তবে, পরিসংখ্যানগত তাৎপর্যের জন্য পরীক্ষা শুধু গণিত নয়। পরিসংখ্যান অনেক সংখ্যক ভেরিয়েবল এবং বিভিন্ন সম্ভাব্যতা নিয়ে কাজ করে, যেগুলি সর্বদা গণনার জন্য উপযুক্ত নয়। অর্থাৎ, যদি আমরা নিবন্ধের শুরুতে রাবারের জুতার উদাহরণে ফিরে আসি, তাহলে পরিসংখ্যানগত ডেটার যৌক্তিক নির্মাণ যা স্টোরের জন্য পণ্যের ক্রেতারা নির্ভর করবে তা শুষ্ক এবং গরম আবহাওয়ার কারণে ব্যাহত হতে পারে, যা শরতের জন্য সাধারণ নয়।. এই ঘটনার ফলস্বরূপ, রাবারের বুট ক্রয়কারী লোকের সংখ্যা হ্রাস পাবে এবং আউটলেটগুলি ক্ষতির সম্মুখীন হবে। অবশ্যই, একটি গাণিতিক সূত্র আবহাওয়ার অসঙ্গতির পূর্বাভাস দিতে সক্ষম নয়। এই মুহূর্তটিকে "ভুল" বলা হয়৷
এটি কেবলমাত্র এই জাতীয় ত্রুটির সম্ভাবনা এবং গণনাকৃত তাত্পর্যের স্তরের চেককে বিবেচনা করে। এটি গণনা করা সূচক এবং তাত্পর্যের গৃহীত স্তর উভয়ই বিবেচনা করে, সেইসাথে পরিমাণগুলিকে প্রচলিতভাবে অনুমান বলা হয়৷
তাত্পর্যের স্তর কী?
পরিসংখ্যানগত তাৎপর্যের প্রধান মাপকাঠিতে "স্তর" ধারণাটি অন্তর্ভুক্ত। এটি প্রয়োগ এবং ব্যবহারিক পরিসংখ্যানে ব্যবহৃত হয়। এটি এমন এক ধরনের মান যা সম্ভাব্য বিচ্যুতি বা ত্রুটির সম্ভাবনা বিবেচনা করে।
এই স্তরটি তৈরি করা নমুনাগুলির পার্থক্যগুলির সনাক্তকরণের উপর ভিত্তি করে, এটি আপনাকে তাদের তাত্পর্য বা বিপরীতভাবে, এলোমেলোতা প্রতিষ্ঠা করতে দেয়। এই ধারণাটির শুধুমাত্র ডিজিটাল অর্থই নয়, তাদের অদ্ভুত ব্যাখ্যাও রয়েছে। তারা ব্যাখ্যা করেআপনি কীভাবে মানটি বুঝতে হবে, এবং গড় সূচকের সাথে ফলাফলের তুলনা করে স্তর নিজেই নির্ধারণ করা হয়, এটি পার্থক্যগুলির নির্ভরযোগ্যতার মাত্রা প্রকাশ করে৷
এইভাবে, আমরা একটি স্তরের ধারণাটিকে সহজভাবে কল্পনা করতে পারি - এটি প্রাপ্ত পরিসংখ্যানগত তথ্য থেকে প্রাপ্ত সিদ্ধান্তে একটি গ্রহণযোগ্য, সম্ভাব্য ত্রুটি বা ত্রুটির একটি সূচক৷
কী স্তরের তাৎপর্য ব্যবহার করা হয়?
অভ্যাসে ত্রুটির সম্ভাবনা সহগগুলির পরিসংখ্যানগত তাত্পর্য তিনটি মৌলিক স্তরের উপর ভিত্তি করে।
প্রথম স্তরটি হল থ্রেশহোল্ড যার মান 5%। অর্থাৎ, ত্রুটির সম্ভাবনা 5% এর তাত্পর্য স্তর অতিক্রম করে না। এর মানে হল যে পরিসংখ্যানগত গবেষণা তথ্যের ভিত্তিতে গৃহীত সিদ্ধান্তের অনবদ্যতা এবং অসম্পূর্ণতার উপর আস্থা 95%।
দ্বিতীয় স্তর হল 1% থ্রেশহোল্ড৷ তদনুসারে, এই পরিসংখ্যানটির অর্থ হল পরিসংখ্যানগত গণনার সময় প্রাপ্ত ডেটা দ্বারা 99% আত্মবিশ্বাসের সাথে একজনকে নির্দেশিত করা যেতে পারে৷
তৃতীয় স্তর - 0.1%। এই মানের সাথে, একটি ত্রুটির সম্ভাবনা শতাংশের একটি ভগ্নাংশের সমান, অর্থাৎ, ত্রুটিগুলি কার্যত বাদ দেওয়া হয়৷
পরিসংখ্যানে হাইপোথিসিস কি?
একটি ধারণা হিসাবে ত্রুটিগুলি দুটি ক্ষেত্রে বিভক্ত, শূন্য অনুমানের গ্রহণ বা প্রত্যাখ্যান সংক্রান্ত। একটি অনুমান হল একটি ধারণা যার পিছনে, সংজ্ঞা অনুসারে, সমীক্ষার ফলাফলের একটি সেট, অন্যান্য ডেটা বা বিবৃতি লুকানো থাকে। অর্থাৎ, পরিসংখ্যানগত অ্যাকাউন্টিং বিষয়ের সাথে সম্পর্কিত কিছুর সম্ভাব্যতা বন্টনের একটি বিবরণ।
সরল গণনায় দুটি অনুমান আছে - শূন্য এবং বিকল্প। তাদের মধ্যে পার্থক্য হল যে নাল হাইপোথিসিস এই ধারণার উপর ভিত্তি করে যে পরিসংখ্যানগত তাত্পর্য নির্ধারণে জড়িত নমুনার মধ্যে কোন মৌলিক পার্থক্য নেই এবং বিকল্পটি এটির সম্পূর্ণ বিপরীত। অর্থাৎ, বিকল্প অনুমান এই নমুনাগুলির মধ্যে একটি উল্লেখযোগ্য পার্থক্যের উপস্থিতির উপর ভিত্তি করে।
ভুলগুলো কি?
পরিসংখ্যানের ধারণা হিসাবে ত্রুটিগুলি এই বা সেই অনুমানকে সত্য হিসাবে গ্রহণ করার সরাসরি অনুপাতে। তাদের দুটি দিক বা প্রকারে বিভক্ত করা যেতে পারে:
- প্রথম প্রকারটি শূন্য অনুমানের গ্রহণযোগ্যতার কারণে, যা ভুল বলে প্রমাণিত হয়েছে;
- সেকেন্ড - বিকল্প অনুসরণ করার কারণে।
প্রথম প্রকারের ত্রুটিটিকে মিথ্যা পজিটিভ বলা হয় এবং পরিসংখ্যান ব্যবহার করা হয় এমন সমস্ত ক্ষেত্রে এটি বেশ সাধারণ। তদনুসারে, দ্বিতীয় প্রকারের ত্রুটিটিকে মিথ্যা নেতিবাচক বলা হয়৷
আমাদের পরিসংখ্যানে রিগ্রেশন দরকার কেন?
রিগ্রেশনের পরিসংখ্যানগত তাৎপর্য হল যে এটির সাহায্যে তথ্যের ভিত্তিতে গণনা করা বিভিন্ন নির্ভরতার মডেল বাস্তবতার সাথে কতটা মিল রয়েছে তা প্রতিষ্ঠিত করা সম্ভব; আপনাকে অ্যাকাউন্টিং এবং সিদ্ধান্তের জন্য পর্যাপ্ততা বা কারণগুলির অভাব সনাক্ত করতে দেয়৷
ফিশার টেবিলে তালিকাভুক্ত ডেটার সাথে ফলাফলের তুলনা করে রিগ্রেশন মান নির্ধারণ করা হয়। অথবা বৈচিত্র্যের বিশ্লেষণ ব্যবহার করে। রিগ্রেশন সূচক গুরুত্বপূর্ণ যখনজটিল পরিসংখ্যানগত অধ্যয়ন এবং গণনা যাতে বিপুল সংখ্যক ভেরিয়েবল, এলোমেলো ডেটা এবং সম্ভাব্য পরিবর্তন জড়িত থাকে।