توانایی درک رابطه بین عوامل مختلف برای سازمان ها بسیار مهم است. به عنوان مثال، درک رابطه بین هزینه تبلیغات و فروش ایجاد شده از آن هزینه تبلیغاتی یا بین سطح تولید و کل هزینه های تولید مفید خواهد بود. درک این روابط به سازمان ها اجازه می دهد تا پیش بینی های بهتری از میزان فروش یا هزینه ها در آینده داشته باشند. این در هنگام بودجه بندی یا پیش بینی بسیار ارزشمند خواهد بود.
این مقاله به بررسی چگونگی تحلیل روابط بین متغیرها با استفاده از روش «خط بهترین تناسب» و تحلیل رگرسیون میپردازد و چگونه میتوان قدرت این روابط را با استفاده از همبستگی اندازهگیری کرد.
رابطه بین متغیرها
در هر رابطه بین دو متغیر یک متغیر مستقل و یک متغیر وابسته وجود دارد که اندازه حرکات در متغیر وابسته به اندازه حرکات متغیر مستقل بستگی دارد. مثلا؛هزینه کل یک فرآیند تولید به سطح فعالیت بستگی دارد.
داده های زیر را که توسط یک شرکت طی دو سال گذشته تولید شده است در نظر بگیرید.
این شرکت می خواهد رابطه بین سطح فعالیت و هزینه کل تولید را درک کند تا بتواند کل هزینه های تولید را در آینده پیش بینی کند.
خط بهترین تناسب
یکی از روش های درک رابطه بین متغیرها، روش خط بهترین برازش است. تمام داده های داده شده بر روی نمودار رسم شده است. سطح فعالیت متغیر مستقل است (همانطور که در بالا توضیح داده شد) و در محور x (افقی) نشان داده شده است. هزینه کل تولید متغیر وابسته است و بر روی محور y (عمودی) نشان داده شده است.
هنگامی که تمام داده ها بر روی نمودار رسم می شوند، می توان خطی با بهترین تناسب رسم کرد:
در این مورد برخی از نقاط روی خط و برخی در بالا و پایین هستند، اما بیشتر آنها نزدیک به خط هستند که نشان می دهد بین سطح فعالیت و هزینه کل تولید رابطه وجود دارد.
این "خط بهترین تناسب" را می توان برای پیش بینی آنچه در سطوح دیگر تولید اتفاق می افتد استفاده کرد. برای سطوح تولیدی که در محدوده سطوح قبلی قرار نمیگیرند، میتوان «خط بهترین تناسب» را برای پیشبینی سطوح دیگر با خواندن مقدار از نمودار برون یابی کرد.
این یک تکنیک ساده است ، اما محدودیت هایی دارد. نکته اصلی این است که "خط بهترین تناسب" از نقاط داده ترسیم شده تخمین زده می شود و خطوط مختلف ممکن است از همان مجموعه از نقاط داده تهیه شود. روشی که می تواند بر این ضعف غلبه کند ، تجزیه و تحلیل رگرسیون است.
تجزیه و تحلیل رگرسیون
تجزیه و تحلیل رگرسیون همچنین از داده های تاریخی استفاده می کند و خطی از بهترین تناسب را پیدا می کند ، اما از نظر آماری این کار را انجام می دهد و خط نتیجه را قابل اطمینان تر می کند.
ما یک رابطه خطی (خط مستقیم) بین متغیرها و اینکه معادله یک خط مستقیم است فرض می کنیم:
y = a + bx
a عنصر ثابت است (جایی که خط از محور y عبور می کند)
B عنصر متغیر (شیب خط) و
x و y به متغیرهای x و y مربوط می شوند.
A و B با استفاده از فرمول های زیر محاسبه می شوند:
این فرمول ها در برگه فرمول PM آورده شده است.
ساده ترین راه برای مقابله با این محاسبات این است که ابتدا یک جدول با ستون های X ، Y ، XY و X 2 تنظیم کنید.
(توجه: جدول همچنین حاوی ستونی برای Y 2 است. این مورد در محاسبه بعدی مورد نیاز است)
کل (∑)
285
4،265
168. 975
12،025
2،440،125
معادله خط رگرسیون (به شکل y = a + bx) می شود:
y = 208. 90 + 9. 1x
با استفاده از این معادله ، پیش بینی کل هزینه ها در سطوح مختلف تولید آسان است ، به عنوان مثال برای سطح تولید 80،000 واحد ، تخمین هزینه کل خواهد بود:
208. 90 + (9. 1 x 80) = 936. 90 یا 936. 900 دلار.
این تخمین چقدر قابل اعتماد است به قدرت رابطه بین دو متغیر بستگی دارد. چه مقدار از تغییر y را می توان با تغییر در x توضیح داد؟
هرچه رابطه بین متغیرها قوی تر باشد ، می توان به معادله محاسبه شده اعتماد بیشتری کرد و پیش بینی ها بهتر می شدند.
اندازه گیری قدرت رابطه بین متغیرها همبستگی است.
همبستگی
گفته می شود که اگر مربوط به یکدیگر باشد ، دو متغیر با یکدیگر ارتباط دارند و اگر تغییر در یک تمایل به همراهی با تغییرات در دیگری باشد. همبستگی می تواند مثبت باشد (جایی که افزایش در یک متغیر در نتیجه در دیگری افزایش می یابد) یا منفی (جایی که افزایش در یک متغیر منجر به کاهش در دیگری می شود).
نمودار نشان داده شده در بخش "خط بهترین تناسب" در بالا همبستگی مثبت قوی را نشان می دهد. برخی از روابط دیگر در زیر نشان داده شده است:
این امکان وجود دارد که هیچ ارتباطی بین متغیرها وجود نداشته باشد. یک خط افقی مانند موارد زیر هیچ ارتباطی را نشان نمی دهد:
در جایی که یک شرکت بخواهد از داده های گذشته برای پیش بینی آینده استفاده کند ، همبستگی قوی تر می شود ، تخمین ها بهتر می شوند.
قدرت همبستگی بین متغیرها را می توان با ضریب همبستگی اندازه گیری کرد که می تواند با استفاده از فرمول زیر محاسبه شود:
r = 1 همبستگی خطی مثبت کامل را نشان می دهد
r = -1 همبستگی خطی منفی کامل را نشان می دهد
r = 0 هیچ همبستگی خطی را نشان نمی دهد
مقدار ضریب همبستگی باید بین 1 تا 1 باشد. هرچه مقدار نزدیکتر به 1 و-1 باشد ، همبستگی قوی تر است.
با استفاده از مثال قبلی برای محاسبه r:
R = 0. 965 که نشانگر همبستگی مثبت قوی است.
محاسبه بیشتر ضریب تعیین است که به عنوان R 2 محاسبه می شود.
ضریب تعیین نسبت تغییرات در Y (متغیر وابسته) را که می تواند با تغییرات در X (متغیر مستقل) توضیح داده شود ، می دهد. در این مثال ، R 2 = 0. 931 ، بنابراین 93. 1 ٪ از تغییرات در کل هزینه تولید با تغییر در سطح فعالیت قابل توضیح است. این بدان معنی است که 6. 9 ٪ از تغییرات باید به دلیل سایر عوامل باشد.
نتیجه
برای استفاده از تجزیه و تحلیل رگرسیون و همبستگی برای پیش بینی های آینده باید مراقبت شود. محاسبات انجام شده فقط می تواند نشان دهد که رابطه بین عوامل وجود دارد ، نمی تواند رابطه را اثبات کند. این امکان وجود دارد که عوامل دیگری در تغییر در متغیرها وجود داشته باشد که ممکن است در نظر گرفته نشده باشد.
همچنین ، مانند تجزیه و تحلیل سری زمانی ، که در یک مقاله جداگانه به آن پرداخته می شود ، تجزیه و تحلیل رگرسیون از مشاهدات گذشته برای تلاش برای پیش بینی آنچه در آینده اتفاق خواهد افتاد استفاده می کند. این فرض که آنچه در گذشته اتفاق افتاده است نشانگر خوبی از آنچه در آینده اتفاق خواهد افتاد یک فرض ساده گرایانه است. در دنیای واقعی ، تغییرات در محیط (فناوری ، اجتماعی ، زیست محیطی ، سیاسی ، اقتصادی و غیره) همگی می توانند عدم اطمینان ایجاد کنند و پیش بینی هایی را که از مشاهدات گذشته غیر واقعی است ، ایجاد می کند.
نوشته شده توسط یکی از اعضای تیم بررسی مدیریت عملکرد