اخراج القيمة من البيانات

Data is the new oil

إعداد: أ. ياسمين مرزا

في هذا العصر أصبحت البيانات ثمينة ولديها المقدرة في احداث تغيير في مختلف المجالات اذا استخدمت بفعالية. وفي المقولة الشهيرة لإدواردز ديمينغ “بدون بيانات، فانت مجرد شخص لديه رأي“. في القطاع الصحي توجد البيانات في كل مكان ولا حصر لاستخداماتها. تبدأ البيانات مع رحلة المريض، تأثر على الخطة العلاجية، تحسن من اتخاذ القرارات المناسبة، وترفع من جودة الرعاية الصحية منذ سنوات عديدة. لكن مع الكم الهائل من البيانات استخداماتنا لها تعد محدودة مقارنة بامكانياتها الأخرى. فالسؤال يكمن ب”كيف يمكننا استخدام البيانات بطريقة تحدث ثورة في المجال الصحي؟”. في هذا التقرير سنذهب في رحلة مثرية لنتعرف على الخطوات لانشاء مشروع من خلال البيانات ورفع الستار لاظهار قوة وفعالية البيانات.

الخطوة الأولى، تحديد المشكلة(Problem Analysis). عند فهم المشكلة المراد حلها يمكن تحديد البيانات المناسبة للاستخدام. هذه الخطوة هي الأساسالذي تنبني عليه باقي الخطوات فمن المهم فهم المشكلة جيدا ومقابلة الفئة المستهدفة لفهم احتياجاتهم ومعرفة جميع التفاصيل. عند تحديد المشكلة يفضل اخذ استشارات من اخصائيين علم البيانات عن كيفية جمع البيانات واذا كانت مناسبة لحل المشكلة او لا.

الخطوة الثانية، جمع البيانات(Data Collection). هناك أنواع مختلفة من البيانات وهذه الخطوة من الممكن ان تاخذ الكثير من الوقت والجهد وينصح اخذ الوقت الكافي لجمع بيانات ذات جودة عالية. اذ ان اغلب المشاريع الناجحة مبنية على استخدام بيانات ذات جودة عالية. كلما كانت البيانات منظمة (structured data) أي مرتبة في جدول كان استخدامها اسهل ونتائجها افضل. بعد جمع البيانات يجب دراستها ومعرفة اذا كانت مناسبة لحل المشكلة او لا. يحدث دائما ان كثير من الأفكار تتغير عند هذا المرحلة اذ ان البيانات هي التي تحدد مسار الفكرة.

الخطوة الثالثة، تجهيز البيانات(Data Preparation). تتضمن هذه الخطوة عدة خطوات بما فيها تنظيف البيانات بمعنى إزالة الأخطاء، والقيم المفقودة والمتكررة. أيضا تحويل البيانات بطريقة تكون فيها مهيأة للتحليل من خلال الكومبيوتر.

الخطوة الرابعة، استكشاف البيانات التحليلية (Exploratory Data Analysis). تتضمن هذه المرحلة استكشاف البيانات عن طريق اختبارات حسابية لمعرفة العلاقة بين المتغيرات والنمط التي تحاول البيانات اخبارنا به. عند معرفة نمط البيانات يأتي دور الباحث العلمي باستكشاف هل هناك شيء يسبب شيء اخر؟ او ان ليس هناك مسبب والمتغيرات فقط تذهب بنفس النمط؟. عند الإجابة على هذه الأسئلة بدقة ومصداقية سوف نحدد المتغيرات التي يفضل استخدامها لحل المشكلة.

الخطوة الخامسة، نمذجة البيانات (Data Modeling). هنا يأتي دور اخصائي علم البيانات لتجريب مختلف الخوارزميات التي هي اختبارات حسابية وتحديد افضل خوارزمية لفهم وتحليل البيانات واستخراج النتائج. بالمختصر هذه الخطوة تحدد الطريقة الامثل لحل المشكلة. ومن المهم تجربة العديد من الطرق حتى نتوصل الى افضل طريقة لحل المشكلة بأكبر دقة ممكنة.

الخطوة السادسة، التصور والتواصل (Visualisation and Communication). في هذه المرحلة يكمن تحويل البيانات من شيء غير مرئي او ملموس الى شيء يمكن ان يرى وتحتوي هذي المرحلة على الكثير من الاستكشافات والمفاجات. فعند انشاء رسومات بيانية من خلال البيانات يسهل فهمها والتعامل معها وتحديد النمط التي تتبعه. يمكننا القول عند الوصول الى هذه المرحلة اننا حولنا البيانات من شيء راكد لا نفع له الى بيانات قيمة لها القدرة على التحدث والتواصل.

الخطوة السابعة، المتابعة والصيانة (Deployment and Maintainable). المرحلة الأخيرة، فيها يخضع المنتج للاختبار وعند اثبات جدارته يطبق في ارض الواقع. الا ان هذه المرحلة لا تنتهي هنا فيجب تحسين المنتج وتطويره واختباره بشكل مستمر للحصول على افضل النتائج.

في الختام، الإبحار في رحلة البيانات وتعلم كيفية التعامل معها بفعالية سيحدث ثورة في المجال الصحي. من الممكن ان تكون الرحلة طويلة ومليئة بالتحديات الا ان النتائج تستحق. للارتقاء في مجالات البحث والابتكار لنبدا في استخدام البيانات وتحويلها الى شيء فعال يمكن القطاع الصحي نحو مستقبل افضل.

المرجع