استخدامات الانحدار اللوجستي في التحليلات التنبؤية
استخدامات الانحدار اللوجستي في التحليلات التنبؤية
Predictive Analytics with Logistic Regression
إعداد: أ. سماء الجشي
الانحدار اللوجستي أو التراجع اللوجستي هو نموذج تعلُّم آلة موجَّه يسـتخدم دالـة لوجسـتية لتحويـل تنبـؤ النمـوذج الخطـي إلـى قيمـة بيـن 0 و1. تستعمل منهجية الانحدار اللوجستي في عالم الأعمال بمختلف القطاعات لبناء نماذج تنبؤية تصنف الأفراد أو المشاهدات إلى مجموعات غير متداخلة و تساهم نماذج التعلم الآلي التي يتم إنشاؤها باستخدام الانحدار اللوجستي في اكتساب رؤى قابلة للتنفيذ من بيانات أعمال المؤسسات، مثل تحليل العمليات المالية المشبوهة وتصنيفها على أنها احتيالية أو غير احتيالية، وتصنيف طلبات القروض وبطاقات الائتمان والتأمين إلى فئات منخفضة وعالية المخاطر، وفي القطاع الصحي للتخطيط للرعاية الوقائية والعلاج من خلال التنبؤ باحتمالية الإصابة بالأمراض لدى المرضى، وكذلك لمقارنة تأثير التاريخ العائلي أو الجينات على الأمراض.
بالمختصر، نسعى في الانحدار اللوجستي للتنبؤ باحتمالية وجود قيمة معينة مع وجود فئتين فقط من المخرجات، وهذا يشبه سؤال يمكن الإجابة عليه بـ “نعم” أو “لا”. عادةً ما تشير الفئة الإيجابية إلى وجود الشيء المعني بينما تشير الفئة السلبية إلى غيابه [3]. فنحدد في البداية سؤالًا يمكن الإجابة عليه بفئتين مثل “نعم” أو “لا”، ثم نجمع البيانات ذات الصلة ونستخدم بَرْمَجِيّات الانحدار بعد ذلك لمعالجة نقاط البيانات وربطها إحصائيًا باستخدام المعادلات الرياضية، مما ينقلنا للمرحلة الأخيرة وهي التوصل إلى التوقعات والتنبؤ بالقيم المجهولة [4]. ومن أفضل الممارسات بعد بناء النموذج، تقييم مدى قدرة النموذج على التنبؤ بالمتغير التابع (عامل الإجابة)، وهو ما يسمى بجودة ملاءمة النموذج وكفاءته (Goodness of Fit).
دراسة علمية [6]:
نموذج قائم على الانحدار اللوجستي للتنبؤ بالحالات الصحية لدى مرضى الشلل الدماغي
PredictMed: A logistic regression–based model to predict health conditions in cerebral palsy
طور فريق بحثي نموذج سمي PredictMed قائم على الانحدار اللوجستي للتنبؤ بنشوء الجنف (اعوجاج العمود الفقري) والإعاقات الذهنية، والسمات التوحدية، واضطرابات التغذية التي تحتاج إلى فغر المعدة (فتح المعدة لتركيب أنبوب تغذية) لدى الأطفال المصابين بالشلل الدماغي، في دراسة مقطعية وصفية، متعددة الجنسيات، ومُزْدَوِجَةُ التِعْمِيَة (الدِّراسة على جَماعتينِ فلا الباحث ولا الجَماعة يَدريان من ينتمي لمجموعة البحث ومجموعة المراقبة).
استخدم النموذج خوارزمية بلغة البرمجة R، وجُمعت بيانات 130 طفلاً (تتراوح أعمارهم بين 12 و18 عامًا) مصابين بالشلل الدماغي في الفترة ما بين يونيو 2005 ويونيو 2015. تم ترميز الملاحظات السردية والوثائق السريرية وإدخالها في قاعدة البيانات الإلكترونية، ثم قُسِّم المرضى إلى مجموعات تدريب واختبار. بعد ذلك، أُجري الانحدار اللوجستي على كل مجموعة فرعية ممكنة من المتغيرات المستقلة، وتم اختيار المجموعة التي أظهرت أفضل أداء تنبؤي من حيث الدقة والحساسية والخصوصية كأفضل مجموعة من المتغيرات المستقلة لاستخدامها في انحدار لوجستي آخر لحساب احتمالية الإصابة بحالة صحية معينة (مثل الحاجة إلى فغر المعدة).
تمثل نتيجة النموذج ممارسة جديدة في مجال الشلل الدماغي فيما يتعلق بنتائج العلاج الصحية، إذ بلغت متوسط درجة الدقة والحساسية والخصوصية في نموذج PredictMed حوالي 90%. ومن المتوقع أن يساعد الأطباء بشكل كبير في تشْخِيص وتوقع مآل المَرَض في سَيره وتطوُّره واتخاذ قرارات استباقية بناءً على ذلك، حيث يوفر PredictMed تنبؤات أسرع وأكثر موضوعية، مما قد يحسن من رعاية المرضى المصابين بالشلل الدماغي ويخفف معاناتهم ويقلل تكاليف الرعاية الصحية.
المراجع: