التصنيف (Classification) والتجميع (Clustering) هما تقنيتان مختلفتان في التعلم الآلي المستخدمة لتحليل البيانات.
التصنيف هي تقنية تعلم يشرف عليها المدرب (Supervised Learning)، والهدف منها هو التنبؤ بتصنيف عينة جديدة استنادًا إلى مجموعة بيانات مصنفة. وبمعنى آخر، يتم تعلم نموذج يمكنه التنبؤ بتصنيف عينة جديدة بناءً على ميزاتها. وتشمل أمثلة مشكلات التصنيف تعرف البريد العشوائي، وتعرف الصور، وتحليل المشاعر.
التجميع، من ناحية أخرى، هي تقنية تعلم غير مشرف (Unsupervised Learning)، والهدف منها هو تجميع المراقبات المماثلة في مجموعات استنادًا إلى ميزاتهم، دون أي معرفة مسبقة بتصنيفاتهم. وبمعنى آخر، يتم تجميع المراقبات بناءً على شبهاتهم واختلافاتهم. وتشمل أمثلة مشكلات التجميع تجميع العملاء في مجموعات استنادًا إلى سلوكياتهم في الشراء، وتجميع الأخبار والمقالات في مواضيع ذات صلة.
بشكل عام، يمكن وصف الفرق بين التصنيف والتجميع بأن التصنيف يستخدم بيانات مصنفة سابقًا لتدريب النموذج، بينما التجميع يستخدم بيانات غير مصنفة لتحليل المجموعات المماثلة أو المتشابهة في المجموعات.
تعليقات
إرسال تعليق