متریک Recall در الگوریتمهای کلاسیفیکیشن
در یادگیری ماشین، متریکها نقش بسیار مهمی در ارزیابی عملکرد مدلهای یادگیری دارند. متریکهای مختلف برای اهداف متفاوت طراحی شدهاند تا تحلیلهای جامعتری از عملکرد مدل ارائه دهند. یکی از متریکهای کلیدی در ارزیابی مدلهای کلاسیفیکیشن Recall است که بهویژه در مواقعی که شناسایی موارد مثبت اهمیت زیادی دارد، استفاده میشود. در این مقاله به معرفی، اهمیت و کاربردهای این متریک میپردازیم.
تعریف متریک Recall
متریک Recall که با نامهای دیگری مانند حساسیت (Sensitivity) یا نرخ مثبت واقعی (True Positive Rate) نیز شناخته میشود، توانایی مدل را در شناسایی تمام نمونههای مثبت در دادهها اندازهگیری میکند. این متریک نشان میدهد که از میان تمام نمونههایی که واقعاً مثبت بودهاند، مدل چه تعداد را بهدرستی تشخیص داده است.
فرمول محاسبه Recall به صورت زیر است:
True Positives (TP): تعداد نمونههای مثبت که به درستی توسط مدل پیشبینی شدهاند.
False Negatives (FN): تعداد نمونههای مثبت که مدل نتوانسته آنها را بهدرستی شناسایی کند.
اهمیت متریک Recall
در بسیاری از کاربردها، تشخیص نمونههای مثبت اهمیت بسیار بالایی دارد. Recall در مواقعی که عدم شناسایی نمونههای مثبت منجر به خسارات یا هزینههای بالا شود، بسیار مهم است. برخی از این موارد عبارتند از:
تشخیص بیماریها: در سیستمهای پزشکی، مانند تشخیص سرطان یا بیماریهای نادر، اگر مدل نمونههای بیمار را شناسایی نکند (False Negative)، ممکن است جان بیمار به خطر بیفتد.
تشخیص تقلب: در سیستمهای بانکی، عدم شناسایی تراکنشهای تقلبی میتواند منجر به ضرر مالی قابل توجهی شود.
جستجو و نجات: در سیستمهای جستجو و نجات، شناسایی تمام موارد اضطراری (مانند افراد گمشده) حیاتی است.
تفاوت Recall با Precision
برای درک بهتر نقش Recall، لازم است آن را با متریک Precision مقایسه کنیم. در حالی که Recall بر شناسایی تمام نمونههای مثبت تمرکز دارد، Precision میزان دقت پیشبینیهای مثبت را اندازهگیری میکند. فرمول Precision بهصورت زیر است:
False Positives (FP): تعداد نمونههایی که به اشتباه به عنوان مثبت پیشبینی شدهاند.
مثال
فرض کنید در یک سیستم تشخیص سرطان، مدل ۱۰۰ بیمار مثبت واقعی (TP) را به درستی شناسایی کرده، اما ۲۰ بیمار واقعی (FN) را از دست داده است. در این حالت، Recall برابر است با:
این بدان معناست که مدل ۸۳ درصد از بیماران را بهدرستی شناسایی کرده است.
چالشها و راهکارها
چالشها:
اگر Recall بسیار بالا باشد، ممکن است Precision کاهش پیدا کند، چرا که مدل تعداد زیادی نمونه مثبت کاذب (False Positive) تولید میکند.
راهکار:
استفاده از متریک ترکیبی مانند F1 Score که میانگین هماهنگ Precision و Recall را محاسبه میکند.
نتیجهگیری
متریک Recall یکی از ابزارهای کلیدی برای ارزیابی مدلهای کلاسیفیکیشن است که بهویژه در کاربردهایی که عدم شناسایی موارد مثبت هزینهبر است، اهمیت دارد. با این حال، برای تحلیل دقیقتر عملکرد مدل، بهتر است Recall در کنار سایر متریکها مانند Precision و F1 Score بررسی شود. انتخاب متریک مناسب به کاربرد مورد نظر و اهمیت نسبی نمونههای مثبت و منفی بستگی دارد.

مدل طبقه بندی جنگل تصادفی (Random Forest)
مقدمه در دنیای هوش مصنوعی و یادگیری ماشین، مدلهای متعددی برای دستهبندی (Classification) و رگرسیون (Regression) استفاده میشوند. یکی از …

مدل طبقه بندی درخت تصمیم در یادگیری ماشین
https://aparat.com/v/qtb228whttps://aparat.com/v/qtb228w در دنیای یادگیری ماشین، مدلهای مختلفی وجود دارند که برخی از آنها نیاز به توزیع نرمال دادهها دارند، مانند …

مدل کلاسیفیکیشن LDA
https://www.aparat.com/v/oljczbmhttps://www.aparat.com/v/oljczbm مدل کلاسیفیکیشن LDA (تحلیل تشخیص خطی) یکی از روشهای محبوب در تحلیل دادهها و یادگیری ماشین است که برای …