পরিসংখ্যানগত তাৎপর্য: সংজ্ঞা, ধারণা, তাৎপর্য, রিগ্রেশন সমীকরণ এবং অনুমান পরীক্ষা

সুচিপত্র:

পরিসংখ্যানগত তাৎপর্য: সংজ্ঞা, ধারণা, তাৎপর্য, রিগ্রেশন সমীকরণ এবং অনুমান পরীক্ষা
পরিসংখ্যানগত তাৎপর্য: সংজ্ঞা, ধারণা, তাৎপর্য, রিগ্রেশন সমীকরণ এবং অনুমান পরীক্ষা

ভিডিও: পরিসংখ্যানগত তাৎপর্য: সংজ্ঞা, ধারণা, তাৎপর্য, রিগ্রেশন সমীকরণ এবং অনুমান পরীক্ষা

ভিডিও: পরিসংখ্যানগত তাৎপর্য: সংজ্ঞা, ধারণা, তাৎপর্য, রিগ্রেশন সমীকরণ এবং অনুমান পরীক্ষা
ভিডিও: 11) 5.4_6 ML Basics DL book 2024, নভেম্বর
Anonim

পরিসংখ্যান দীর্ঘদিন ধরে জীবনের একটি অবিচ্ছেদ্য অংশ। মানুষ সর্বত্র এটির মুখোমুখি হয়। পরিসংখ্যানের উপর ভিত্তি করে, কোথায় এবং কোন রোগগুলি সাধারণ, একটি নির্দিষ্ট অঞ্চলে বা জনসংখ্যার একটি নির্দিষ্ট অংশের মধ্যে কীসের চাহিদা বেশি সে সম্পর্কে সিদ্ধান্ত নেওয়া হয়। এমনকি সরকারী সংস্থার প্রার্থীদের রাজনৈতিক কর্মসূচির নির্মাণ পরিসংখ্যানগত তথ্যের উপর ভিত্তি করে। তারা পণ্য কেনার সময় খুচরা চেইন দ্বারা ব্যবহার করা হয়, এবং নির্মাতারা তাদের প্রস্তাবে এই তথ্য দ্বারা পরিচালিত হয়৷

পরিসংখ্যান সমাজের জীবনে একটি গুরুত্বপূর্ণ ভূমিকা পালন করে এবং এর প্রতিটি পৃথক সদস্যকে প্রভাবিত করে, এমনকি ছোট জিনিসগুলিতেও। উদাহরণস্বরূপ, যদি পরিসংখ্যান অনুসারে, বেশিরভাগ লোকেরা একটি নির্দিষ্ট শহর বা অঞ্চলের পোশাকগুলিতে গাঢ় রঙ পছন্দ করে, তবে স্থানীয় আউটলেটগুলিতে ফুলের প্রিন্ট সহ একটি উজ্জ্বল হলুদ রেইনকোট খুঁজে পাওয়া অত্যন্ত কঠিন হবে। কিন্তু কি পরিমাণএই তথ্য যোগ আপ যেমন একটি প্রভাব আছে? উদাহরণস্বরূপ, "পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ" কি? এই সংজ্ঞা দ্বারা ঠিক কি বোঝানো হয়েছে?

এটা কি?

বিজ্ঞান হিসাবে পরিসংখ্যান বিভিন্ন পরিমাণ এবং ধারণার সমন্বয়ে গঠিত। তাদের মধ্যে একটি হল "পরিসংখ্যানগত তাত্পর্য" ধারণা। এটি ভেরিয়েবলের মানের নাম, অন্যান্য সূচকের উপস্থিতির সম্ভাবনা যার মধ্যে নগণ্য।

পরিসংখ্যান সূচকের গণনা
পরিসংখ্যান সূচকের গণনা

উদাহরণস্বরূপ, 10 জনের মধ্যে 9 জন লোক বৃষ্টির রাতের পরে শরতের বনে মাশরুমের জন্য সকালে হাঁটার সময় তাদের পায়ে রাবারের জুতা পরে। কোনো কোনো সময়ে তাদের মধ্যে 8টি ক্যানভাস মোকাসিনে রাখার সম্ভাবনা নগণ্য। সুতরাং, এই বিশেষ উদাহরণে, 9 নম্বরটিকে "পরিসংখ্যানগত তাত্পর্য" বলা হয়৷

তদনুসারে, যদি আমরা প্রদত্ত বাস্তব উদাহরণটি আরও বিকাশ করি, তবে জুতার দোকানগুলি বছরের অন্যান্য সময়ের তুলনায় গ্রীষ্মের মরসুমের শেষে রাবারের বুট বেশি পরিমাণে ক্রয় করে। এইভাবে, পরিসংখ্যানগত মূল্যের মাত্রা সাধারণ জীবনে প্রভাব ফেলে৷

অবশ্যই, জটিল গণনায়, বলুন, ভাইরাসের বিস্তারের পূর্বাভাস দেওয়ার সময়, প্রচুর সংখ্যক ভেরিয়েবলকে বিবেচনায় নেওয়া হয়। কিন্তু পরিসংখ্যানগত তথ্যের একটি উল্লেখযোগ্য সূচক নির্ধারণের সারমর্ম একই রকম, গণনার জটিলতা এবং পরিবর্তনশীল মানের সংখ্যা নির্বিশেষে।

এটা কিভাবে গণনা করা হয়?

সমীকরণের "পরিসংখ্যানগত তাত্পর্য" সূচকের মান গণনা করার সময় ব্যবহৃত হয়। অর্থাৎ, যুক্তি দেওয়া যেতে পারে যে এই ক্ষেত্রে সবকিছু গণিত দ্বারা নির্ধারিত হয়।সবচেয়ে সহজ গণনার বিকল্প হল গাণিতিক ক্রিয়াকলাপের একটি চেইন, যাতে নিম্নলিখিত পরামিতিগুলি জড়িত:

  • সমীক্ষা বা উদ্দেশ্যমূলক ডেটার অধ্যয়ন থেকে প্রাপ্ত দুই ধরনের ফলাফল, যেমন ক্রয়ের পরিমাণ, a এবং b দ্বারা চিহ্নিত;
  • উভয় গ্রুপের জন্য নমুনা আকার নির্দেশক – n;
  • সম্মিলিত নমুনা শেয়ারের মূল্য - p;
  • মান ত্রুটি - SE.

পরবর্তী ধাপে সামগ্রিক পরীক্ষার স্কোর নির্ধারণ করা হয় - t, এর মান 1.96 নম্বরের সাথে তুলনা করা হয়। 1.96 হল গড় মান, যা ছাত্রদের টি-বন্টন ফাংশন অনুসারে 95% এর পরিসর বহন করে।

সহজ হিসাবের জন্য সূত্র
সহজ হিসাবের জন্য সূত্র

ন এবং পি-এর মানের মধ্যে পার্থক্য কী তা নিয়ে প্রায়ই প্রশ্ন ওঠে। এই nuance একটি উদাহরণ দিয়ে স্পষ্ট করা সহজ. ধরা যাক যে কোন পণ্য বা ব্র্যান্ডের পুরুষ ও মহিলাদের আনুগত্যের পরিসংখ্যানগত তাত্পর্য গণনা করা হয়৷

এই ক্ষেত্রে, অক্ষরগুলি নিম্নলিখিতগুলি অনুসরণ করবে:

  • n - উত্তরদাতাদের সংখ্যা;
  • p - পণ্যের সাথে সন্তুষ্ট সংখ্যা।

এই ক্ষেত্রে ইন্টারভিউ নেওয়া মহিলাদের সংখ্যা n1 হিসাবে মনোনীত করা হবে। তদনুসারে, পুরুষ - n2. একই মানের p প্রতীকের "1" এবং "2" সংখ্যা থাকবে।

পরীক্ষার স্কোরের সাথে ছাত্রদের স্প্রেডশীটের গড় তুলনা করাকে "পরিসংখ্যানগত তাৎপর্য" বলা হয়।

যাচাই বলতে কি বোঝায়?

যেকোন গাণিতিক গণনার ফলাফল সর্বদা পরীক্ষা করা যেতে পারে, এটি প্রাথমিক বিদ্যালয়ে শিশুদের শেখানো হয়। এটা অনুমান করা যৌক্তিকযেহেতু পরিসংখ্যান গণনার চেইন ব্যবহার করে নির্ধারণ করা হয়, তারপর সেগুলি পরীক্ষা করা হয়।

তবে, পরিসংখ্যানগত তাৎপর্যের জন্য পরীক্ষা শুধু গণিত নয়। পরিসংখ্যান অনেক সংখ্যক ভেরিয়েবল এবং বিভিন্ন সম্ভাব্যতা নিয়ে কাজ করে, যেগুলি সর্বদা গণনার জন্য উপযুক্ত নয়। অর্থাৎ, যদি আমরা নিবন্ধের শুরুতে রাবারের জুতার উদাহরণে ফিরে আসি, তাহলে পরিসংখ্যানগত ডেটার যৌক্তিক নির্মাণ যা স্টোরের জন্য পণ্যের ক্রেতারা নির্ভর করবে তা শুষ্ক এবং গরম আবহাওয়ার কারণে ব্যাহত হতে পারে, যা শরতের জন্য সাধারণ নয়।. এই ঘটনার ফলস্বরূপ, রাবারের বুট ক্রয়কারী লোকের সংখ্যা হ্রাস পাবে এবং আউটলেটগুলি ক্ষতির সম্মুখীন হবে। অবশ্যই, একটি গাণিতিক সূত্র আবহাওয়ার অসঙ্গতির পূর্বাভাস দিতে সক্ষম নয়। এই মুহূর্তটিকে "ভুল" বলা হয়৷

পরিসংখ্যানগত ডেটা ভিজ্যুয়ালাইজেশনের জন্য সরঞ্জাম
পরিসংখ্যানগত ডেটা ভিজ্যুয়ালাইজেশনের জন্য সরঞ্জাম

এটি কেবলমাত্র এই জাতীয় ত্রুটির সম্ভাবনা এবং গণনাকৃত তাত্পর্যের স্তরের চেককে বিবেচনা করে। এটি গণনা করা সূচক এবং তাত্পর্যের গৃহীত স্তর উভয়ই বিবেচনা করে, সেইসাথে পরিমাণগুলিকে প্রচলিতভাবে অনুমান বলা হয়৷

তাত্পর্যের স্তর কী?

পরিসংখ্যানগত তাৎপর্যের প্রধান মাপকাঠিতে "স্তর" ধারণাটি অন্তর্ভুক্ত। এটি প্রয়োগ এবং ব্যবহারিক পরিসংখ্যানে ব্যবহৃত হয়। এটি এমন এক ধরনের মান যা সম্ভাব্য বিচ্যুতি বা ত্রুটির সম্ভাবনা বিবেচনা করে।

এই স্তরটি তৈরি করা নমুনাগুলির পার্থক্যগুলির সনাক্তকরণের উপর ভিত্তি করে, এটি আপনাকে তাদের তাত্পর্য বা বিপরীতভাবে, এলোমেলোতা প্রতিষ্ঠা করতে দেয়। এই ধারণাটির শুধুমাত্র ডিজিটাল অর্থই নয়, তাদের অদ্ভুত ব্যাখ্যাও রয়েছে। তারা ব্যাখ্যা করেআপনি কীভাবে মানটি বুঝতে হবে, এবং গড় সূচকের সাথে ফলাফলের তুলনা করে স্তর নিজেই নির্ধারণ করা হয়, এটি পার্থক্যগুলির নির্ভরযোগ্যতার মাত্রা প্রকাশ করে৷

পরিসংখ্যান আলোচনা
পরিসংখ্যান আলোচনা

এইভাবে, আমরা একটি স্তরের ধারণাটিকে সহজভাবে কল্পনা করতে পারি - এটি প্রাপ্ত পরিসংখ্যানগত তথ্য থেকে প্রাপ্ত সিদ্ধান্তে একটি গ্রহণযোগ্য, সম্ভাব্য ত্রুটি বা ত্রুটির একটি সূচক৷

কী স্তরের তাৎপর্য ব্যবহার করা হয়?

অভ্যাসে ত্রুটির সম্ভাবনা সহগগুলির পরিসংখ্যানগত তাত্পর্য তিনটি মৌলিক স্তরের উপর ভিত্তি করে।

প্রথম স্তরটি হল থ্রেশহোল্ড যার মান 5%। অর্থাৎ, ত্রুটির সম্ভাবনা 5% এর তাত্পর্য স্তর অতিক্রম করে না। এর মানে হল যে পরিসংখ্যানগত গবেষণা তথ্যের ভিত্তিতে গৃহীত সিদ্ধান্তের অনবদ্যতা এবং অসম্পূর্ণতার উপর আস্থা 95%।

দ্বিতীয় স্তর হল 1% থ্রেশহোল্ড৷ তদনুসারে, এই পরিসংখ্যানটির অর্থ হল পরিসংখ্যানগত গণনার সময় প্রাপ্ত ডেটা দ্বারা 99% আত্মবিশ্বাসের সাথে একজনকে নির্দেশিত করা যেতে পারে৷

তৃতীয় স্তর - 0.1%। এই মানের সাথে, একটি ত্রুটির সম্ভাবনা শতাংশের একটি ভগ্নাংশের সমান, অর্থাৎ, ত্রুটিগুলি কার্যত বাদ দেওয়া হয়৷

পরিসংখ্যানে হাইপোথিসিস কি?

একটি ধারণা হিসাবে ত্রুটিগুলি দুটি ক্ষেত্রে বিভক্ত, শূন্য অনুমানের গ্রহণ বা প্রত্যাখ্যান সংক্রান্ত। একটি অনুমান হল একটি ধারণা যার পিছনে, সংজ্ঞা অনুসারে, সমীক্ষার ফলাফলের একটি সেট, অন্যান্য ডেটা বা বিবৃতি লুকানো থাকে। অর্থাৎ, পরিসংখ্যানগত অ্যাকাউন্টিং বিষয়ের সাথে সম্পর্কিত কিছুর সম্ভাব্যতা বন্টনের একটি বিবরণ।

রিগ্রেশনের পরিসংখ্যানগত তাত্পর্য
রিগ্রেশনের পরিসংখ্যানগত তাত্পর্য

সরল গণনায় দুটি অনুমান আছে - শূন্য এবং বিকল্প। তাদের মধ্যে পার্থক্য হল যে নাল হাইপোথিসিস এই ধারণার উপর ভিত্তি করে যে পরিসংখ্যানগত তাত্পর্য নির্ধারণে জড়িত নমুনার মধ্যে কোন মৌলিক পার্থক্য নেই এবং বিকল্পটি এটির সম্পূর্ণ বিপরীত। অর্থাৎ, বিকল্প অনুমান এই নমুনাগুলির মধ্যে একটি উল্লেখযোগ্য পার্থক্যের উপস্থিতির উপর ভিত্তি করে।

ভুলগুলো কি?

পরিসংখ্যানের ধারণা হিসাবে ত্রুটিগুলি এই বা সেই অনুমানকে সত্য হিসাবে গ্রহণ করার সরাসরি অনুপাতে। তাদের দুটি দিক বা প্রকারে বিভক্ত করা যেতে পারে:

  • প্রথম প্রকারটি শূন্য অনুমানের গ্রহণযোগ্যতার কারণে, যা ভুল বলে প্রমাণিত হয়েছে;
  • সেকেন্ড - বিকল্প অনুসরণ করার কারণে।
পরিসংখ্যানগত গ্রাফ দেখা
পরিসংখ্যানগত গ্রাফ দেখা

প্রথম প্রকারের ত্রুটিটিকে মিথ্যা পজিটিভ বলা হয় এবং পরিসংখ্যান ব্যবহার করা হয় এমন সমস্ত ক্ষেত্রে এটি বেশ সাধারণ। তদনুসারে, দ্বিতীয় প্রকারের ত্রুটিটিকে মিথ্যা নেতিবাচক বলা হয়৷

আমাদের পরিসংখ্যানে রিগ্রেশন দরকার কেন?

রিগ্রেশনের পরিসংখ্যানগত তাৎপর্য হল যে এটির সাহায্যে তথ্যের ভিত্তিতে গণনা করা বিভিন্ন নির্ভরতার মডেল বাস্তবতার সাথে কতটা মিল রয়েছে তা প্রতিষ্ঠিত করা সম্ভব; আপনাকে অ্যাকাউন্টিং এবং সিদ্ধান্তের জন্য পর্যাপ্ততা বা কারণগুলির অভাব সনাক্ত করতে দেয়৷

ফিশার টেবিলে তালিকাভুক্ত ডেটার সাথে ফলাফলের তুলনা করে রিগ্রেশন মান নির্ধারণ করা হয়। অথবা বৈচিত্র্যের বিশ্লেষণ ব্যবহার করে। রিগ্রেশন সূচক গুরুত্বপূর্ণ যখনজটিল পরিসংখ্যানগত অধ্যয়ন এবং গণনা যাতে বিপুল সংখ্যক ভেরিয়েবল, এলোমেলো ডেটা এবং সম্ভাব্য পরিবর্তন জড়িত থাকে।

প্রস্তাবিত: