تكنولوجيا

ما هو تحليل الانحدار البسيط؟

ما هو تحليل الانحدار البسيط؟

هل تعلم أنه يمكن استخدام تحليل الانحدار البسيط لأغراض مختلفة في الأعمال التجارية؟ في الواقع، يعد التنبؤ بالفرص والمخاطر المستقبلية أحد التطبيقات الرئيسية لتحليل الانحدار في الأعمال التجارية. بالإضافة إلى ذلك، تستخدم الشركات نماذج الانحدار الخطي لتحسين عمليات أعمالها عن طريق تقليل الكمية الهائلة من البيانات الأولية إلى معلومات قابلة للتنفيذ.

ما هو تحليل الانحدار البسيط

في الأساس، يعد تحليل الانحدار البسيط أداة إحصائية تُستخدم في القياس الكمي للعلاقة بين متغير مستقل واحد ومتغير تابع واحد بناءً على الملاحظات التي تم تنفيذها في الماضي. في تفسير الشخص العادي، ما يعنيه هذا هو أنه يمكن استخدام تحليل الانحدار الخطي البسيط في توضيح كيف أن التغيير في ساعات آلة إنتاج المؤسسة (وهو المتغير المستقل) سيؤدي بالتالي إلى تغيير في تكلفة الكهرباء في المؤسسة .

نموذج الانحدار الخطي البسيط

بشكل أساسي، يمكن التعبير عن نموذج الانحدار الخطي البسيط بنفس قيمة صيغة الانحدار البسيط .

ص = β 0  + 1 X + ε.

في نموذج الانحدار الخطي البسيط، نأخذ في الاعتبار النمذجة بين المتغير المستقل والمتغير التابع. عادةً ما يُطلق على النموذج نموذج الانحدار الخطي البسيط عندما يكون هناك متغير مستقل واحد فقط في نموذج الانحدار الخطي. ضع في اعتبارك أنه يصبح نموذجًا لانحدارًا خطيًا متعددًا عندما يكون هناك أكثر من متغير مستقل واحد.

في نموذج الانحدار الخطي البسيط، يشير y إلى الدراسة أو المتغير التابع و X هو المتغير التوضيحي أو المستقل. التعابير β 0  و β 1 هي معلمات نموذج الانحدار الخطي. تعتبر المعلمة β 0 بمثابة مصطلح تقاطع، بينما تعتبر المعلمة 1 بمثابة معلمة الميل. يُعرف المصطلح العام لهذه المعلمات باسم معاملات الانحدار.

التعبير “ε” هو الخطأ الذي لا يمكن ملاحظته والذي يفسر عدم قدرة البيانات على البقاء في خط مستقيم. كما أنه يمثل الاختلاف بين الإدراك المرصود والحقيقي لـ “y”.

يمكن أن تعزى عدة أسباب لهذه الاختلافات. على سبيل المثال، قد تكون المتغيرات نوعية وعشوائية متأصلة في الملاحظات، كما أن تأثير جميع المتغيرات المحذوفة في النموذج يساهم أيضًا في الاختلافات. وبالتالي، يُفترض أن يُلاحظ كمتغير عشوائي مستقل وموزع بشكل متماثل بمتوسط ​​صفر وتباين ثابت q². بعد ذلك، سيتم افتراض أن ε يتم توزيعها بشكل طبيعي.

يُنظر إلى المتغيرات المستقلة في نموذج الانحدار الخطي على أنها مسيطر عليها من قبل المجرب. هذا هو السبب في أنها تعتبر غير عشوائية، في حين تعتبر y متغير عشوائي مع:

ه (ص) = β 0  + 1 X. و

Var (y) = q²

في بعض الحالات، يمكن أن تعمل X كمتغير عشوائي. في هذه المواقف، بدلاً من تباين العينة ومتوسط ​​عينة y، سيكون اعتبارنا على المتوسط ​​الشرطي لـ y بشرط X = x كـ

ε (ص) = 0 و 1

والتباين الشرطي لـ y شريطة أن X = x as

فار (y | x) = q².

ومن ثم، فإن نموذج تحليل الانحدار البسيط يتم التعبير عنه بالكامل عند معرفة قيم 0 و β 1 و q². بشكل عام، المعلمات β 0 و 1 و q² غير معروفة عمليًا و غير ملاحظ. لذلك، ترى أن تحديد النموذج الإحصائي y = 0  + 1 X + يعتمد على التحديد (أي التقدير) لـ β 0 و 1 و q². من أجل التأكد من قيم هذه المعلمات، يتم ملاحظة / جمع n أزواج من الملاحظات (x¡، y¡) (¡= 1، …، n) في (X، y) وتستخدم لتحديد هذه المعلمات غير المعروفة.

بشكل عام، يمكن استخدام طرق مختلفة للتقدير في تحديد تقديرات المعلمات. الطريقة الأكثر شيوعًا هي طريقة تقدير المربعات الصغرى وطريقة الاحتمال القصوى للتقدير.

كيفية إجراء تحليل انحدار بسيط

الطريقة الأكثر شيوعًا التي يقوم بها الأشخاص لإجراء تحليل انحدار بسيط هي استخدام البرامج الإحصائية لتمكين التحليل السريع للبيانات.

إجراء الانحدار الخطي البسيط في R

R هو برنامج إحصائي يستخدم في إجراء تحليل انحدار خطي بسيط. يستخدم على نطاق واسع وقوي ومجاني. وإليك كيف يعمل.

أولاً، عليك تحميل مجموعة بيانات بيانات الدخل في بيئة R الخاصة بك. ثم تقوم بتشغيل الأمر أدناه لإنشاء نموذج مكتبة يوضح العلاقة بين السعادة والدخل.

كود R لبعض الانحدار الخطي

الدخل.السعادة. lm <- lm (السعادة ~ الدخل، البيانات = الدخل. البيانات)

بشكل أساسي، سيأخذ هذا الكود البيانات المجمعة “data = الدخل.data” ثم يقيم تأثير المتغير المستقل “الدخل” على المتغير التابع “السعادة” باستخدام معادلة النموذج الخطي: lm ().

كيف نفسر النتائج

لعرض نتيجة النموذج، يمكنك الاستفادة من وظيفة “Summary ()” في R:

ملخص (الدخل. السعادة. lm)

ما تفعله هذه الوظيفة هو أخذ أهم المعلمات من النموذج الخطي ووضعها في جدول.

يكرر جدول النتائج هذا مبدئيًا الصيغة التي تم استخدامها في إنشاء النتائج (‘Call’). بعد ذلك، يلخص بقايا النموذج (“المخلفات”). يساعد هذا في توفير نظرة ثاقبة حول مدى ملاءمة النموذج للبيانات الأصلية.

ثم ننتقل إلى جدول “المعاملات”. يوفر الصف الأول تقديرات تقاطع y، بينما يوفر الصف الثاني معامل الانحدار للنموذج.

الصف الأول من الجدول يسمى “(التقاطع)”. هذا هو الجزء المقطوع من المحور y لمعادلة الانحدار بقيمة 0.20. يمكنك دمج هذا في معادلة الانحدار الخاص بك إذا كنت تريد التنبؤ بقيم السعادة عبر نطاق الدخل الذي قمت بتحليله:

السعادة = 0.20 + 0.71 * الدخل ± 0.018

الصف التالي في جدول “المعاملات” هو الدخل. يوضح هذا الصف التأثير المقدر للدخل على السعادة المبلغ عنها.

عمود “التقدير” هو التأثير المقدر. يمكن أن يشار إليها أيضًا بالقيمة r² أو معامل الانحدار. يخبرنا الرقم الوارد في الجدول (0.713) أنه مقابل كل وحدة زيادة في الدخل (مع الأخذ في الاعتبار أن وحدة الدخل تساوي 10000 دولار)، هناك زيادة مقابلة بمقدار 0.71 وحدة في السعادة المبلغ عنها (مع اعتبار السعادة مقياسًا من 1 إلى 10).

يعد “Std. يصف عمود الخطأ “الخطأ المعياري للتقدير. يوضح هذا الرقم مستوى التباين في تقديرنا للعلاقة بين السعادة والدخل.

يتم عرض إحصاء الاختبار في عمود “t value”. إذا لم تحدد غير ذلك، فإن إحصائية الاختبار المستخدمة في الانحدار الخطي تظل قيمة t من اختبار t مزدوج الجوانب. كلما زادت إحصائية الاختبار، انخفض احتمال حدوث نتائجنا بالصدفة.

يصف العمود “pr (> | t |)” القيمة p. يوضح لنا الشكل هناك احتمال وجود التأثير المقدر للدخل على السعادة إذا كانت الفرضية الصفرية التي لا يوجد تأثير لها دقيقة.

نظرًا لأن القيمة p منخفضة جدًا (p <0.001)، يمكننا رفض الفرضية الصفرية والتوصل إلى استنتاج مفاده أن الدخل له تأثير ذي صلة إحصائيًا على السعادة.

تمثل الأسطر الثلاثة الأخيرة من ملخص النموذج إحصاءات تتعلق بكامل النموذج. أهم شيء يجب أخذه في الاعتبار هنا هو القيمة الاحتمالية للنموذج. يصبح مناسبًا هنا (p <0.001)، مما يعني أن هذا النموذج هو معيار مناسب للبيانات المرصودة.

عرض النتائج

في تقرير النتائج، أضف القيمة الاحتمالية والخطأ القياسي للتقدير والتأثير المقدر (أي معامل الانحدار). من الضروري أيضًا أن تفسر أرقامك لتوضح للقراء معنى معامل الانحدار.

نتيجة

كانت هناك علاقة وثيقة الصلة (p <0.001) بين الدخل والسعادة (R² = 0.71 ± 0.018)، مع زيادة قدرها 0.71 وحدة في السعادة المبلغ عنها لكل 10000 دولار زيادة في الدخل.

بالإضافة إلى ذلك، سيكون من الجيد إضافة رسم بياني مع نتائجك. لانحدار خطي بسيط ، كل ما عليك فعله هو رسم الملاحظات على محوري x و y. ثم تضيف دالة الانحدار وخط الانحدار.

صيغة بسيطة للانحدار الخطي

صيغة الانحدار الخطي البسيط هي

ص = β 0  + 1 + ε

الأجزاء الرئيسية لتحليل الانحدار البسيط

هذا هو مقياس الارتباط. إنه يمثل النسبة المئوية للتباين في قيم Y التي يمكن عرضها من خلال فهم قيمة X. R² يختلف من 0.0 كحد أدنى (حيث لا يتم شرح أي تباين على الإطلاق)، إلى حد أقصى +1.0 (حيث يتم شرح كل التباين).

سب

يشير هذا إلى الخطأ القياسي للقيمة المسجلة ب. يتم إجراء اختبار t للأهمية الإحصائية للمعامل عن طريق قسمة قيمة b على خطأها القياسي. وفقًا لقاعدة التجربة، عادةً ما تكون قيمة t الأعلى من 2.0 ذات صلة إحصائيًا، ولكن عليك الإشارة إلى جدول t فقط للتأكد.

إذا كان هناك وفقًا لقيمة t إشارة إلى أن المعامل b وثيق الصلة إحصائيًا، فهذا يعني أنه يجب حجز المتغير المستقل لـ X في معادلة الانحدار. هذا بشكل خاص لأنه يتميز بعلاقة ذات صلة إحصائيًا مع المتغير التابع أو Y. في الحالة التي لا تكون فيها العلاقة ذات صلة إحصائيًا، فإن قيمة “معامل b” ستكون تمامًا مثل الصفر (من الناحية الإحصائية).

F

هذا اختبار للأهمية الإحصائية لمعادلة الانحدار بأكملها. يتم إنشاؤه بقسمة التباين الموصوف على التباين غير المفسر. كما تفترض القاعدة العامة، فإن أي قيمة F أعلى من 4.0 غالبًا ما تكون ذات صلة إحصائيًا. ومع ذلك، يجب عليك الرجوع إلى طاولة F فقط للتأكد. إذا كانت F مناسبة، فإن معادلة الانحدار تساعدنا على معرفة العلاقة بين X و Y.

افتراضات الانحدار الخطي البسيط

  • تجانس التباين: يمكن الإشارة إلى هذا أيضًا باسم homoscedasticity. ينص جوهر هذا الافتراض على عدم وجود تغيير كبير في حجم الخطأ في تنبؤنا عبر قيم المتغير المستقل.
  • استقلالية الملاحظات: هنا، تم استخدام طرق أخذ العينات الصالحة إحصائيًا لجمع الملاحظات في مجموعة البيانات، ولا توجد علاقات غير معروفة بين الملاحظات.
  • الحالة الطبيعية: هذا ببساطة يفترض أن البيانات تتبع التوزيع الطبيعي.

أمثلة بسيطة للانحدار الخطي

هنا، سوف نستشهد بسيناريو يعد بمثابة مثال على تنفيذ تحليل الانحدار البسيط .

لنفترض أن متوسط ​​السرعة عند نشر دوريتين على الطريق السريع هو 75 ميلاً في الساعة، أو 35 ميلاً في الساعة عند نشر 10 دوريات على الطرق السريعة. والسؤال إذن ما هو متوسط ​​سرعة السيارات على الطريق السريع عند انتشار 5 دوريات على الطريق السريع؟

باستخدام معادلة تحليل الانحدار البسيطة الخاصة بنا، يمكننا بالتالي حساب القيم واشتقاق المعادلة التالية: Y = 85 + (-5) X، نظرًا لأن Y هي متوسط ​​سرعة السيارات على الطريق السريع. A = 85، أو متوسط ​​السرعة عندما تكون X = 0

B = (-5)، تأثير كل سيارة دورية إضافية منتشرة على Y

و X = عدد الدوريات المنتشرة

لذلك، فإن متوسط ​​سرعة السيارات على الطريق السريع عند عدم وجود دوريات على الطريق السريع (X = 0) سيكون 85 ميلاً في الساعة. لكل سيارة دورية إضافية على الطريق السريع تعمل، سينخفض ​​متوسط ​​السرعة بمقدار 5 ميل في الساعة. وبالتالي، بالنسبة لخمس سيارات دورية (X = 5)، لدينا Y = 85 + (-5) (5) = 85-25 = 60 ميلاً في الساعة.

حدود الانحدار الخطي البسيط

حتى أفضل البيانات لا تعطي الكمال. عادةً ما يتم استخدام تحليل الانحدار الخطي البسيط على نطاق واسع في البحث لتحديد العلاقة الموجودة بين المتغيرات. ومع ذلك، نظرًا لأن الارتباط لا يفسر على أنه السببية، فإن العلاقة بين متغيرين لا تعني أن أحدهما يتسبب في حدوث الآخر. في الواقع، قد لا يؤدي الخط في الانحدار الخطي البسيط الذي يصف نقاط البيانات جيدًا إلى علاقة السبب والنتيجة.

سيمكنك استخدام مثال تحليل الانحدار البسيط من معرفة ما إذا كانت هناك علاقة بين المتغيرات على الإطلاق. لذلك، هناك حاجة إلى مزيد من التحليل والبحث الإحصائي لتحديد ماهية العلاقة بالضبط، وما إذا كان أحد المتغيرات يؤدي إلى الآخر.

افكار اخيرة

بشكل عام، تحتاج الشركات اليوم إلى التفكير في تحليل الانحدار البسيط إذا احتاجت إلى خيار يوفر دعمًا ممتازًا لقرارات الإدارة، كما يحدد الأخطاء في الحكم. من خلال التحليل المناسب، سيكون للكميات الكبيرة من البيانات غير المهيكلة التي تراكمت من قبل الشركات بمرور الوقت القدرة على تقديم رؤى قيمة للشركات.

حول الكاتب

رائد الأعمال العربي

فريق متخصص في البحث والدراسة في عدة مجالات ضمن نطاق ريادة الأعمال، ومن أهم المجالات التي نتخصص في الكتابة عنها هي: كيفية إنشاء المشاريع بالسعودية، الإدارة، القيادة، إدارة الموارد البشرية...