لنفترض أن لدينا مركزين لفحص فيروس #كورونا
الأول: دقته 69%
والثاني: دقته 29%
أيهما ستختار لإجراء الفحص؟
تعالوا نتعرف على قياسات تقييم أداء خوارزميات #تعلم_الآلة (Machine Learning) ومعايير اختيار كل قياس ، تابع ربما تُغير رأيك وخيارك في نهاية التغريدات!
#علم_البيانات https://t.co/IHBgBEydpF
تتعلم خوارزميات #تعلم_الآلة بالبيانات ونقوم بتقييم تعلمها باستخدام مجموعة من القياسات من ضمنها وأشهرها الدقة (accuracy) ، ولكن هذا القياس يبدو مضلل في بعض الأحيان كما سنشاهد في تقييم مركزي فحص #كورونا ، لذا مهم جداً اختيار القياس المناسب لتقييم نموذج التعلم.. ولكن بناءً على ماذا؟
من أهم المعايير هي تكلفة الخطأ ، الخطأ في تصنيف ايميل وصلنا على أنه spam وهو ليس spam ليس مثل خطورة تصنيف أحدهم على أنه غير مصاب بـ #كورونا وهو في الحقيقة مصاب!
لنرجع لمركز الفحص الأول والذي تم تقييم دقته accuracy بـ 69% وننظر في النتائج التفصيلية لفحوصات هذا المركز
- شُخص 10 على أنهم مصابين وهم بالفعل مصابين
- شخص 13 على أنهم مصابين وهم فعلياً سليمين
- شخص 75 على أنهم سليمين وهم فعلياً مصابين
- شخص 118 على أنهم سليمين وهم بالفعل سليمين https://t.co/ex0ZiemMuo
- شُخص 85 على أنهم مصابين وهم بالفعل مصابين
- شخص 201 على أنهم مصابين وهم فعلياً سليمين
- شخص 0 على أنهم سليمين وهم فعلياً مصابين
- شخص 0 على أنهم سليمين وهم بالفعل سليمين https://t.co/KBV7CLUzlo
في المقابل تفاصيل نتائج الفحص للمركز الثاني والذي تم تقييم دقته accuracy بـ 29% كانت كالتالي