عامل تضخم التباين (VIF) - نظرة عامة ، الصيغة ، الاستخدامات

يقيس عامل تضخم التباين (VIF) شدة العلاقة الخطية المتعددة في تحليل الانحدار. تحليل الانحدار. تحليل الانحدار هو مجموعة من الأساليب الإحصائية المستخدمة لتقدير العلاقات بين متغير تابع ومتغير واحد أو أكثر من المتغيرات المستقلة. يمكن استخدامه لتقييم قوة العلاقة بين المتغيرات ونمذجة العلاقة المستقبلية بينهما. . إنه مفهوم إحصائي يشير إلى الزيادة في تباين معامل الانحدار نتيجة العلاقة الخطية المتداخلة.

عامل تضخم الفروق

ملخص

  • يستخدم عامل تضخم التباين (VIF) لاكتشاف شدة الخطية المتعددة في تحليل انحدار المربع الصغرى العادي (OLS).
  • تؤدي العلاقة الخطية المتعددة إلى تضخيم التباين والخطأ من النوع الثاني. يجعل معامل المتغير متسقًا ولكنه غير موثوق به.
  • يقيس VIF عدد الفروق المتضخمة الناتجة عن العلاقة الخطية المتعددة.

عامل تضخم التباين ومتعدد الخطية

في تحليل انحدار المربعات الصغرى العادية (OLS) ، توجد علاقة خطية متعددة عندما يكون اثنان أو أكثر من المتغيرات المستقلة المتغير المستقل المتغير المستقل هو إدخال أو افتراض أو محرك يتم تغييره من أجل تقييم تأثيره على متغير تابع (النتيجة) . إظهار علاقة خطية بينهما. على سبيل المثال ، لتحليل العلاقة بين أحجام الشركة وإيراداتها بأسعار الأسهم في نموذج الانحدار ، فإن القيمة السوقية والعائدات هي المتغيرات المستقلة.

القيمة السوقية لشركة ما هي القيمة السوقية للقيمة السوقية (Market Cap) هي أحدث قيمة سوقية لأسهم الشركة القائمة. القيمة السوقية تساوي سعر السهم الحالي مضروبًا في عدد الأسهم القائمة. غالبًا ما يستخدم المجتمع الاستثماري قيمة الرسملة السوقية لتصنيف الشركات ويرتبط إجمالي إيراداتها ارتباطًا وثيقًا. كشركة تكسب إيرادات متزايدة ، فإنها تنمو أيضًا في الحجم. يؤدي إلى مشكلة خطية متعددة في تحليل انحدار OLS. إذا أظهرت المتغيرات المستقلة في نموذج الانحدار علاقة خطية يمكن التنبؤ بها تمامًا ، فإنها تُعرف باسم العلاقة الخطية المتعددة المثالية.

مع العلاقة الخطية المتعددة ، لا تزال معاملات الانحدار متسقة ولكنها لم تعد موثوقة نظرًا لتضخم الأخطاء القياسية. هذا يعني أن القدرة التنبؤية للنموذج لا يتم تقليلها ، لكن المعاملات قد لا تكون ذات دلالة إحصائية مع خطأ من النوع الثاني خطأ من النوع الثاني في اختبار الفرضية الإحصائية ، الخطأ من النوع الثاني هو حالة يفشل فيها اختبار الفرضية في رفض الفرضية الصفرية التي هو زائف. في أخرى .

لذلك ، إذا لم تكن معاملات المتغيرات مهمة بشكل فردي - لا يمكن رفضها في اختبار t ، على التوالي - ولكن يمكن أن تشرح بشكل مشترك تباين المتغير التابع مع الرفض في اختبار F ومعامل التحديد العالي (R2) ، قد توجد علاقة خطية متعددة. إنها إحدى طرق اكتشاف العلاقة الخطية المتعددة.

VIF هي أداة أخرى شائعة الاستخدام لاكتشاف ما إذا كانت العلاقات الخطية المتعددة موجودة في نموذج الانحدار. يقيس مدى تضخم التباين (أو الخطأ القياسي) لمعامل الانحدار المقدر بسبب العلاقة الخطية المتداخلة.

استخدام عامل التضخم التباين

يمكن حساب VIF بالصيغة أدناه:

عامل تضخم الفروق - الصيغة

حيث تمثل R i 2 معامل التحديد غير المعدل لانحدار المتغير المستقل في المتغيرات المتبقية. يُعرف مقلوب VIF بالتسامح . يمكن استخدام أي من VIF أو التسامح لاكتشاف العلاقة الخطية المتعددة ، اعتمادًا على التفضيل الشخصي.

إذا كانت R i 2 تساوي 0 ، فلا يمكن توقع تباين المتغيرات المستقلة المتبقية من المتغير المستقل ith. لذلك ، عندما يكون VIF أو التسامح مساويًا لـ 1 ، لا يرتبط المتغير المستقل بالمتغير المتبقي ، مما يعني عدم وجود علاقة خطية متعددة في نموذج الانحدار هذا. في هذه الحالة ، لا يتم تضخيم تباين معامل الانحدار.

بشكل عام ، يشير VIF أعلى من 4 أو التفاوت أقل من 0.25 إلى احتمال وجود علاقة خطية متعددة ، وهناك حاجة إلى مزيد من التحقيق. عندما يكون VIF أعلى من 10 أو يكون التفاوت أقل من 0.1 ، فهناك علاقة خطية متعددة كبيرة يجب تصحيحها.

ومع ذلك ، هناك أيضًا مواقف يمكن فيها تجاهل VFIs المرتفعة بأمان دون المعاناة من الخطية المتعددة. فيما يلي ثلاث حالات من هذا القبيل:

1. توجد مؤشرات VIF عالية فقط في متغيرات التحكم ، ولكن ليس في المتغيرات ذات الأهمية. في هذه الحالة ، المتغيرات ذات الأهمية ليست على علاقة خطية مع بعضها البعض أو متغيرات التحكم. لا تتأثر معاملات الانحدار.

2. عندما يحدث ارتفاع VIFs نتيجة لتضمين المنتجات أو قوى المتغيرات الأخرى ، فإن الخطية المتعددة لا تسبب تأثيرات سلبية. على سبيل المثال ، يشتمل نموذج الانحدار على كل من x و x2 كمتغيرات مستقلة.

3. عندما يكون للمتغير الوهمي الذي يمثل أكثر من فئتين قيمة VIF عالية ، لا توجد بالضرورة علاقة خطية متعددة. ستحتوي المتغيرات دائمًا على VIFs عالية إذا كان هناك جزء صغير من الحالات في الفئة ، بغض النظر عما إذا كانت المتغيرات الفئوية مرتبطة بمتغيرات أخرى.

تصحيح خط الطول المتعدد

نظرًا لأن العلاقات الخطية المتعددة تضخم تباين المعاملات وتسبب أخطاء من النوع الثاني ، فمن الضروري اكتشافها وتصحيحها. هناك طريقتان بسيطان وشائعان لتصحيح العلاقة الخطية المتعددة ، كما هو موضح أدناه:

1. الأول هو إزالة واحد (أو أكثر) من المتغيرات شديدة الارتباط. نظرًا لأن المعلومات المقدمة من المتغيرات زائدة عن الحاجة ، فلن يتأثر معامل التحديد بشكل كبير بسبب الإزالة.

2. الطريقة الثانية هي استخدام تحليل المكونات الرئيسية (PCA) أو الانحدار الجزئي للمربع الصغرى (PLS) بدلاً من انحدار OLS. يمكن لانحدار PLS تقليل المتغيرات إلى مجموعة أصغر بدون ارتباط فيما بينها. في PCA ، يتم إنشاء متغيرات جديدة غير مرتبطة. يقلل من فقدان المعلومات ويحسن إمكانية التنبؤ بالنموذج.

المزيد من الموارد

Finance هو المزود الرسمي للشهادة العالمية المعتمدة لمحلل الائتمان والمصرفية (CBCA) ™ CBCA اعتماد محلل الائتمان والائتمان المعتمد (CBCA) ™ هو معيار عالمي لمحللي الائتمان الذي يغطي التمويل والمحاسبة وتحليل الائتمان وتحليل التدفق النقدي ونمذجة العهد وسداد القروض وغير ذلك. برنامج شهادة ، مصمم لمساعدة أي شخص في أن يصبح محلل مالي على مستوى عالمي. لمواصلة تطوير حياتك المهنية ، ستكون الموارد الإضافية أدناه مفيدة:

  • مفاهيم الإحصاء الأساسية في الإحصاء المالي الأساسي. مفاهيم التمويل إن الفهم الراسخ للإحصاءات مهم للغاية في مساعدتنا على فهم التمويل بشكل أفضل. علاوة على ذلك ، يمكن أن تساعد مفاهيم الإحصاء المستثمرين على المراقبة
  • طرق التنبؤ طرق التنبؤ أعلى طرق التنبؤ. في هذه المقالة ، سنشرح أربعة أنواع من طرق التنبؤ بالإيرادات التي يستخدمها المحللون الماليون للتنبؤ بالإيرادات المستقبلية.
  • الانحدار الخطي المتعدد الانحدار الخطي المتعدد يشير الانحدار الخطي المتعدد إلى تقنية إحصائية تستخدم للتنبؤ بنتيجة متغير تابع بناءً على قيمة المتغيرات المستقلة
  • المتغير العشوائي المتغير العشوائي المتغير العشوائي (المتغير العشوائي) هو نوع من المتغيرات في الإحصائيات التي تعتمد قيمها المحتملة على نتائج ظاهرة عشوائية معينة