شجرة هوفدينج
شجرة هوفدينج
إعداد: أ. سماء الجشي
الحساسات الصغيرة في الأجهزة مثل التي تراقب الأنشطة الشخصية أو المنشآت الصناعية، وكذلك الاستخدام المتزايد لوسائل التواصل الاجتماعي مثل تويتر أدى إلى زيادة انتاج وتوليد حجم ضخم من البيانات المتدفقة. وبزيادة حجم البيانات المتدفقة وجدت الحاجة لتحليلها باستخدام تطبيقات قادرة على معالجة هذه البيانات بلا توقف سواء كانت بيانات كتابية أو صورية أو فيديوهات وأيضًا لابد من وجود خوارزمية قادرة على التكيف مع التغيرات المفاجئة أو التدريجية في هذه البيانات.
خوارزمية شجرة هوفدينج هي شجرة قرار تدريجية لها القدرة على التعلم من البيانات المتدفقة بالاعتماد على نظرية الاحتمالات additive Chernoff bound وبافتراض أن هذه البيانات لا تتغير مع مرور الوقت. [1] تقوم فكرة خوارزمية شجرة هوفدينج على أن عينة صغيرة يمكن أن تكون كافية في كثير من الأحيان لاختيار سمة تقسيم مثالية [2] وتبدأ العقدة (Node) بالتفرع حين تتوفر أدلة إحصائية كافية على وجود ميزة انقسام مثالية. [3]
استخداماتها في المجال الصحي:
بالنسبة للمنشآت الطبية، فإن البيانات المتدفقة من أحد أهم العوامل للإكلينيكيين والباحثين حيث تساعدهم على تسريع عملية القرار وتحسين المخرجات المتعلقة بالمرضى مثل اتخاذ الإجراءات الوقائية أو الإجراءات التصحيحية إذا ما استشعروا الخطر مبكرًا.
في عام 2019 صدرت ورقة علمية من مستشفى الملك فيصل التخصصي ومركز الأبحاث تفيد بأن 18% من المواعيد لم يتم حضورها. ولتقليل الخسائر الناتجة عن تغيب المرضى قاموا بإنشاء نموذج تنبؤي باستخدام تعلم الآلة (Machine-Learning) وخوارزميات JRip وHoeffding trees بالاعتماد على البيانات في النظام الصحي الإلكتروني فيما يخص حضور المريض للموعد من عدمه. أظهرت الدراسة ان معدل عدم حضور المرضى مرتبط بعاداتهم السابقة في التغيب عن المواعيد بمعنى كلما ارتفع معدل عدم الحضور للمواعيد من قبل المريض سابقًا، زادت احتمالية عدم حضوره للمواعيد مستقبلًا.
وفي مثال آخر، في دراسة للتنبؤ المبكر الفعال وتشخيص الأمراض باستخدام خوارزميات تعلم الآلة، أوضحت النتائج أن خوارزمية شجرة هوفدينج تعطي نتائج دقيقة بنسبة 92%. [4]
مصطلحات (معجم سدايا للبيانات والذكاء الاصطناعي):
خوارزمية: مجموعـة مـن التعليمـات المحـددة لحـل مشـكلة، أو أداء مهمـة معينـة.
شجرة القرار: خوارزمية تعلم موجّه تسـتخدم رسـوما بيانية شـجرية لإجراء عمليـات تحليل القرار.
تعلم شجرة القرار: عمليـة بنـاء شـجرة قـرار مـن البيانـات لأداء مهـام التصنيـف أو الانحدار.
بيانات متدفقة: بيانات تصل من مصدر يعمل بصفة مستمرة.
المراجع: