كشف وتقييم الأخطاء التغايرية في نموذج الانحدار الخطي المتعدد وسيناريوهات التعامل معها

نوع المستند : المقالة الأصلية

المؤلف

كلية التربية - جامعة الزقازيق - قسم علم النفس التربوي

المستخلص

الملخص:
يهدف البحث إلى التحقق من مدى اختلاف شكل البيانات ذات الأخطاء التغايرية عن شكل البيانات ذات الأخطاء الثابتة في نموذج الانحدار الخطي المتعدد، وكذلك التحقق من مدى اختلاف دقة الكشف عن الأخطاء التغايرية باختلاف الطريقة المستخدمة للكشف عنها في نموذج الانحدار الخطي المتعدد وفقاً لمحك الدلالة الإحصائية، كما يهدف إلى التوصل إلى أفضل السيناريوهات المفترضة والمستخدمة للتعامل مع البيانات ذات الأخطاء التغايرية في نموذج الانحدار الخطي المتعدد وفقاً لمحك الخطأ المعياري، أيضاً يحاول البحث التحقق من مدى اختلاف حدود فترات الثقة الدنيا والعليا (عند مستوى ثقة 95% & 99%) لمعاملات الانحدار في نموذج الانحدار الخطي المتعدد وفقاً للسيناريوهات المفترضة والمستخدمة للتعامل مع البيانات ذات الأخطاء التغايرية، وتم توليد البيانات باستخدام (أسلوب المحاكاة (مونت كارلو))؛  فقد تم توليد مجموعتين من البيانات باستخدام برنامج (R Core Team, 2023)؛ عدد كل مجموعة يساوي (1000)؛ المجموعة الأولى؛ وتمثل البيانات ذات الأخطاء الثابتة، والمجموعة الثانية؛ وتمثل البيانات ذات الأخطاء التغايرية؛ بهدف التحقق من فروض البحث، وأشارت أهم النتائج إلى أن شكل البيانات ذات الأخطاء التغايرية يختلف عن شكل البيانات ذات الأخطاء الثابتة في نموذج الانحدار الخطي المتعدد، كما تم التوصل إلى أن اختبار (White,s Test of Heteroscedasticity) أكثر دقة في الكشف عن الأخطاء التغايرية منه في حالة اختبار (Breusch-Pagan Test of Heteroscedasticity)، أيضاً بينت النتائج أنه في حالة الأخطاء الثابتة فإن قيم معاملات الانحدار تتساوى تقريباً باختلاف السيناريوهات المفترضة؛ إلا أنه يمكن ترتيب السيناريوهات وفقاً لأفضليتها بصفة عامة حسب الخطأ المعياري وقيمة (ت) ودلالتها الإحصائية؛ بأن طريقة المربعات الصغرى العادية جاءت في المرتبة الأولى، يليها طريقة المربعات الصغرى الموزونة يليها مصفوفة التغاير متسقة الأخطاء التغايرية، كما بينت النتائج أنه في حالة الأخطاء التغايرية فإن قيم معاملات الانحدار تتساوى تقريباً باختلاف السيناريوهات المفترضة عدا طريقة المربعات الصغرى الموزونة؛ ويمكن ترتيب السيناريوهات وفقاً لأفضليتها بصفة عامة حسب الخطأ المعياري وقيمة (ت) ودلالتها الإحصائية؛ بأن مصفوفة التغاير متسقة الأخطاء التغايرية جاءت في المرتبة الأولى، يليها طريقة المربعات الصغرى الموزونة، وكشفت النتائج أنه في حالة الأخطاء الثابتة فإن فترات الثقة الدنيا (CI Lower 95% & 99%) وفترات الثقة العليا (CI Upper 95% & 99%) تتساوى تقريباً باختلاف السيناريوهات المفترضة، كما أشارت النتائج إلى أنه في حالة الأخطاء التغايرية فإن فترات الثقة الدنيا (CI Lower 95% & 99%) وفترات الثقة العليا (CI Upper 95% & 99%) تختلف باختلاف السيناريوهات المفترضة، ونجد أن طريقة المربعات الصغرى الموزونة أكثر تحفظاً من مصفوفة التغاير متسقة الأخطاء التغايرية.
 
Detecting and Assessing Heteroscedasticity in Multiple-Linear Regression Model and Scenarios for dealing With Them.
Summary- The research aims to verify the extent to which the form of data with heteroskedastic errors differs from the form of data with homoskedastic errors in the multiple linear regression model, as well as to verify the extent to which the accuracy of detecting heteroscedastic errors differs depending on the method used to detect them in the multiple linear regression model according to the criterion of statistical significance. It aims to reach the best assumed scenarios used to deal with data with heteroscedastic errors in the multiple linear regression model according to the standard error criterion. The research also attempts to verify the extent to which the limits of the lower and upper confidence intervals differ (at the 95% & 99% confidence interval) for the regression coefficients in Multiple linear regression according to the hypothesized scenarios used to deal with data with heteroscedastic errors, The data was generated using the Monte Carlo simulation method. Two sets of data were generated using (R Core Team, 2023). The number of each set is (1000) cases. The first group represents data with homoskedastic errors, and the second group represents data with heteroscedastic errors, with the aim of verifying the research hypotheses. The most important results indicated that the form of data with heteroscedastic errors differs from the form of data with homoskedastic errors in the multiple linear regression model. It was also found that the (White,s Test of Heteroscedasticity) test is more Accuracy in detecting heteroscedastic errors than in the case of the Breusch-Pagan Test of Heteroscedasticity. The results also showed that in the case of homoskedastic errors, the values ​​of the regression coefficients are approximately equal depending on the assumed scenarios. However, the scenarios can be arranged according to their general preference, according to the standard error, the value of (t), and their statistical significance. The ordinary least squares method came in first place, followed by the weighted least squares method, followed by Heteroscedasticity consistent covariance matrix (HCCM). The results also showed that in the case of heteroscedastic errors, the values ​​of the regression coefficients are approximately equal according to the assumed scenarios, except for the weighted least squares method. The scenarios can be arranged according to their general preference according to the standard error, the value of (t), and their statistical significance, which is that Heteroscedasticity consistent covariance matrix (HCCM) comes in first place, followed by the weighted least squares method. The results revealed that in the case of homoskedastic errors, the lower confidence intervals (CI Lower 95% & 99%) and the upper confidence intervals (CI Upper 95% & 99%) are approximately equal depending on the assumed scenarios. The results also indicated that in the case of heteroscedastic errors, the confidence intervals The lower (CI Lower 95% & 99%) and upper confidence intervals (CI Upper 95% & 99%) differ depending on the assumed scenarios, and we find that the weighted least squares method is more conservative than the Heteroscedasticity consistent covariance matrix (HCCM).
Keywords: heteroskedastic errors - Homoskedastic errors - statistical significance criteria - Standard error criteria - Simulation method (Monte Carlo) - Confidence intervals - Ordinary least squares (OLS) method - Weighted least squares (WLS) method - Heteroscedasticity consistent covariance matrix (HCCM)

الكلمات الرئيسية