طرق المجموعات - نظرة عامة ، الفئات ، الأنواع الرئيسية

طرق التجميع هي تقنيات تهدف إلى تحسين دقة النتائج في النماذج من خلال الجمع بين نماذج متعددة بدلاً من استخدام نموذج واحد. النماذج المدمجة تزيد من دقة النتائج بشكل كبير. وقد أدى ذلك إلى زيادة شعبية أساليب المجموعات في التعلم الآلي.

طرق الفرقة

ملخص سريع

  • تهدف طرق التجميع إلى تحسين القدرة على التنبؤ في النماذج من خلال الجمع بين عدة نماذج لعمل نموذج موثوق للغاية.
  • أكثر طرق التجميع شيوعًا هي التعزيز والتعبئة والتكديس.
  • تعتبر طرق التجميع مثالية للانحدار والتصنيف ، حيث تقلل التحيز والتباين لتعزيز دقة النماذج.

فئات طرق التجميع

تنقسم أساليب المجموعات إلى فئتين عريضتين ، أي تقنيات المجموعات المتسلسلة وتقنيات المجموعات المتوازية. تولد تقنيات المجموعات المتسلسلة متعلمين أساسيين في تسلسل ، على سبيل المثال ، Adaptive Boosting (AdaBoost). يعمل الجيل المتسلسل من المتعلمين الأساسيين على تعزيز الاعتماد بين المتعلمين الأساسيين. ثم يتم تحسين أداء النموذج من خلال تعيين أوزان أعلى للمتعلمين الذين تم تحريفهم مسبقًا.

في تقنيات المجموعات المتوازية ، يتم إنشاء المتعلمين الأساسيين بتنسيق متوازي ، على سبيل المثال ، الغابة العشوائية Random Forest Random Forest هي تقنية تستخدم في نمذجة التنبؤات وتحليل السلوك وهي مبنية على أشجار القرار. تحتوي الغابة العشوائية على العديد من أشجار القرار. تستخدم الأساليب الموازية الجيل الموازي من المتعلمين الأساسيين لتشجيع الاستقلال بين المتعلمين الأساسيين. يقلل استقلال المتعلمين الأساسيين من الخطأ بشكل كبير بسبب تطبيق المتوسطات.

تطبق غالبية تقنيات المجموعات خوارزمية واحدة في التعلم الأساسي ، مما يؤدي إلى التجانس في جميع المتعلمين الأساسيين. يشير المتعلمون الأساسيون المتجانسون إلى المتعلمين الأساسيين من نفس النوع ، مع صفات مماثلة. طرق أخرى تطبق المتعلمين الأساسيين غير المتجانسين ، مما أدى إلى ظهور مجموعات غير متجانسة. المتعلمون الأساسيون غير المتجانسين هم متعلمون من أنواع متميزة.

الأنواع الرئيسية لطرق التجميع

1. التعبئة

التعبئة ، النموذج المختصر لتجميع التمهيد ، يتم تطبيقه بشكل أساسي في التصنيف وتحليل الانحدار. تحليل الانحدار هو مجموعة من الأساليب الإحصائية المستخدمة لتقدير العلاقات بين متغير تابع ومتغير واحد أو أكثر من المتغيرات المستقلة. يمكن استخدامه لتقييم قوة العلاقة بين المتغيرات ونمذجة العلاقة المستقبلية بينهما. . يزيد من دقة النماذج من خلال استخدام أشجار القرار ، مما يقلل التباين إلى حد كبير. يؤدي تقليل التباين إلى زيادة الدقة ، وبالتالي القضاء على التخصيص الزائد ، والذي يمثل تحديًا للعديد من النماذج التنبؤية.

يتم تصنيف التعبئة إلى نوعين ، أي التمهيد والتجميع. Bootstrapping هي تقنية لأخذ العينات حيث يتم اشتقاق العينات من جميع السكان (المجموعة) باستخدام إجراء الاستبدال. تساعد طريقة أخذ العينات مع الاستبدال في جعل إجراء الاختيار عشوائيًا. يتم تشغيل خوارزمية التعلم الأساسية على العينات لإكمال الإجراء.

يتم التجميع في التعبئة لدمج جميع النتائج المحتملة للتنبؤ وعشوائية النتيجة. بدون التجميع ، لن تكون التنبؤات دقيقة ، لأن جميع النتائج لا تؤخذ في الاعتبار. وبالتالي ، يعتمد التجميع على إجراءات التمهيد الاحتمالي أو على أساس جميع نتائج النماذج التنبؤية.

يعد التعبئة مفيدًا نظرًا لأن المتعلمين الأساسيين الضعفاء يتم دمجهم لتشكيل متعلم قوي واحد يكون أكثر استقرارًا من المتعلمين الفرديين. كما أنه يلغي أي تباين ، وبالتالي يقلل من فرط تجهيز النماذج. أحد قيود التعبئة هو أنه مكلف من الناحية الحسابية. وبالتالي ، يمكن أن يؤدي إلى مزيد من التحيز في النماذج عند تجاهل الإجراء الصحيح للتعبئة.

2. التعزيز

التعزيز هو أسلوب جماعي يتعلم من أخطاء التنبؤ السابقة لعمل تنبؤات أفضل في المستقبل. تجمع هذه التقنية بين العديد من المتعلمين الأساسيين الضعفاء لتكوين متعلم قوي واحد ، وبالتالي تحسين إمكانية التنبؤ بالنماذج بشكل كبير يعمل التعزيز من خلال ترتيب المتعلمين الضعفاء في تسلسل ، بحيث يتعلم المتعلمون الضعفاء من المتعلم التالي في التسلسل لإنشاء نماذج تنبؤية أفضل.

يأخذ التعزيز العديد من الأشكال ، والتي تشمل تعزيز التدرج ، والتعزيز التكيفي (AdaBoost) ، و XGBoost (تعزيز التدرج الشديد). يستفيد AdaBoost من المتعلمين الضعفاء الذين يتخذون شكل أشجار القرار ، والتي تشمل في الغالب تقسيمًا واحدًا يُعرف عمومًا باسم جذوع القرار. يتضمن جذع القرار الرئيسي في AdaBoost ملاحظات تحمل أوزانًا مماثلة.

تعزيز التدرج تعزيز التدرج هو تقنية تستخدم في إنشاء نماذج للتنبؤ. تستخدم هذه التقنية في الغالب في إجراءات الانحدار والتصنيف. يضيف المتنبئين بالتسلسل إلى المجموعة ، حيث تقوم المتنبئات السابقة بتصحيح من يخلفهم ، وبالتالي زيادة دقة النموذج. المتنبئون الجدد مناسبون لمواجهة آثار الأخطاء في المتنبئين السابقين. يساعد تدرج النسب معزز التدرج في تحديد المشكلات في تنبؤات المتعلمين ومواجهتها وفقًا لذلك.

يستفيد XGBoost من أشجار القرار ذات التدرج المعزز ، مما يوفر سرعة وأداءً محسنين. يعتمد بشكل كبير على السرعة الحسابية وأداء النموذج المستهدف. يجب أن يتبع تدريب النموذج تسلسلاً ، مما يجعل تنفيذ الآلات المعززة بالتدرج بطيئًا.

3. التراص

التكديس ، طريقة تجميع أخرى ، غالبًا ما يشار إليها باسم التعميم المكدس. تعمل هذه التقنية من خلال السماح لخوارزمية التدريب بتجميع العديد من تنبؤات خوارزمية التعلم المماثلة الأخرى. تم تنفيذ التكديس بنجاح في الانحدار وتقديرات الكثافة والتعلم عن بعد والتصنيفات. يمكن استخدامه أيضًا لقياس معدل الخطأ المتضمن أثناء التعبئة.

تقليل التباين

تعتبر طرق التجميع مثالية لتقليل التباين في النماذج ، وبالتالي زيادة دقة التنبؤات. يتم التخلص من التباين عندما يتم دمج عدة نماذج لتشكيل تنبؤ واحد يتم اختياره من جميع التوقعات الأخرى الممكنة من النماذج المدمجة. مجموعة النماذج هي عملية الجمع بين النماذج المختلفة لضمان أن التنبؤ الناتج هو أفضل ما يمكن ، بناءً على مراعاة جميع التنبؤات.

مصادر إضافية

Finance هو المزود الرسمي للشهادة العالمية المعتمدة لمحلل الائتمان والمصرفية (CBCA) ™ CBCA اعتماد محلل الائتمان والائتمان المعتمد (CBCA) ™ هو معيار عالمي لمحللي الائتمان الذي يغطي التمويل والمحاسبة وتحليل الائتمان وتحليل التدفق النقدي ونمذجة العهد وسداد القروض وغير ذلك. برنامج شهادة ، مصمم لمساعدة أي شخص في أن يصبح محلل مالي على مستوى عالمي. لمواصلة التقدم في حياتك المهنية ، ستكون الموارد المالية الإضافية أدناه مفيدة:

  • شبكة مرنة شبكة مرنة تستخدم الشبكة المرنة خطيًا العقوبات من تقنيات لاسو والتلال لتنظيم نماذج الانحدار. تجمع التقنية بين كل من lasso و
  • Overfitting Overfitting Overfitting هو مصطلح يستخدم في الإحصائيات يشير إلى خطأ في النمذجة يحدث عندما تتوافق وظيفة بشكل وثيق للغاية مع مجموعة معينة من البيانات
  • قابلية التوسع قابلية التوسع يمكن أن تقع قابلية التوسع في كل من السياقات المالية واستراتيجيات الأعمال. في كلتا الحالتين ، فإنه يمثل قدرة الكيان على تحمل ضغط
  • انتحال انتحال الانتحال هو ممارسة تداول خوارزمية تخريبية تتضمن تقديم العطاءات للشراء أو عروض بيع العقود الآجلة وإلغاء العطاءات أو العروض قبل تنفيذ الصفقة. تهدف الممارسة إلى خلق صورة خاطئة عن الطلب أو التشاؤم الزائف في السوق.