پاکسازی داده ها یا Data cleaning چیست؟

ساخت وبلاگ
پاکسازی داده‌ ها (Data cleaning)، شامل شناسایی و رفع خطاهای احتمالی داده‌ها برای بهبود کیفیت آنهاست. در این فرآیند، شما داده‌های «کثیف» را شناسایی، بررسی، تجزیه و تحلیل، اصلاح یا حذف می‌کنید تا مجموعه داده‌های خود را پاکسازی کنید. داده‌های کثیف به معنی ناهماهنگی‌ها و خطاها هستند که می‌توانند از هر بخش فرآیند تحقیق، مانند طراحی ضعیف، اندازه گیری غلط، ورود داده‌های ناقص و… به دست آیند.
 
تمیز کردن داده‌ها، ممکن است به صورت تعاملی با ابزارهای داده کاوی یا به صورت پردازش هسته‌ای از طریق اسکریپت‌ها انجام شود. پس از فرآیند پاکسازی، لازم است مجموعه داده‌ها با سایر مجموعه‌های مشابه در سیستم سازگار باشد.
اگر به مبحث پاکسازی داده ها علاقه دارید روی لینک زیر کلیک کنید.
همه چیز درباره داده ها، تحلیل داده ها، یادگیری ماشین و......
ما را در سایت همه چیز درباره داده ها، تحلیل داده ها، یادگیری ماشین و... دنبال می کنید

برچسب : نویسنده : Admin93 bigdata بازدید : 95 تاريخ : دوشنبه 24 بهمن 1401 ساعت: 13:48