نحو بناء مجموعة بيانات متوازنة لكشف التسلل
Toward Constructing a Balanced
DOI:
https://doi.org/10.54153/sjpas.2020.v2i3.86الكلمات المفتاحية:
تصنيف مجموعة بيانات غير متوازن ، SMOTE ، مجموعة بيانات CICIDS2017 ، Random Forest ، Naïve Bayesianالملخص
تم اقتراح العديد من أنظمة كشف التسلل (IDS) في العقد الحالي. تعاني معظم مجموعات البيانات التي ترتبط بمجموعة بيانات كشف التسلل من مشكلة الفئات الغير متوازنة. تحد هذه المشكلة من أداء المصنف للفئات الاقل. قدمت هذه الورقة تقنية جديدة لمعالجة الخلل في التوازن لمجموعة بيانات متعددة الفئات على نطاق واسع، واشير اليها باسم BMCD. تعتمد خوارزمياتنا على تكييف تقنية أخذ العينات الزائدة للأقليات الاصطناعية (SMOTE) مع مجموعة بيانات متعددة الفئات لتحسين معدل الكشف عن فئات الأقليات مع ضمان الكفاءة. في هذا العمل، تم دمج خمس مجموعات بيانات CICIDS2017 فردية لإنشاء مجموعة بيانات متعددة الفئات تحتوي على عدة أنواع من الهجمات. لإثبات كفاءة الخوارزمية الخاصة بنا، تم تطبيق العديد من خوارزميات التعلم الآلي على مجموعة البيانات المدمجة مع خوارزمية BMCD وبدونها. وقد خلصت النتائج التجريبية إلى أن BMCD يوفر حلاً فعالًا لاكتشاف الاختراق غير المتوازن ويتفوق على أساليب كشف الاختراق الحديثة
التنزيلات
منشور
إصدار
القسم
الرخصة
الحقوق الفكرية (c) 2020 مجلة سامراء للعلوم الصرفة والتطبيقية

هذا العمل مرخص بموجب Creative Commons Attribution-NonCommercial 4.0 International License.
Copyright Notice
Authors retain copyright and grant the SJPAS journal right of first publication, with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in Samarra Journal of Pure and Applied Science.
The Samarra Journal of Pure and Applied Science permits and encourages authors to archive Pre-print and Post-print items submitted to the journal on personal websites or institutional repositories per the author's choice while providing bibliographic details that credit their submission, and publication in this journal. This includes the archiving of a submitted version, an accepted version, or a published version without any Risks.



