Analisa Performa Penggunaan Feature Selection untuk Mendeteksi Intrusion Detection Systems dengan Algoritma Random Forest Classifier

S. Budiman, Andi Sunyoto, Asro Nasiri
{"title":"Analisa Performa Penggunaan Feature Selection untuk Mendeteksi Intrusion Detection Systems dengan Algoritma Random Forest Classifier","authors":"S. Budiman, Andi Sunyoto, Asro Nasiri","doi":"10.32520/stmsi.v10i3.1550","DOIUrl":null,"url":null,"abstract":"Abstrak Semakin penting koneksi data melalui Internet membuat kebutuhan akan keamanan jaringan data semakin meningkat. Salah satu tools yang penting adalah Intrusion detection systems (IDS). Salah satu hal yang menjadi masalah dari penggunaan IDS adalah performan kecepatan untuk mendeteksi data yang semakin banyak dalam waktu yang singkat. Dalam penelitian ini kami akan melakukan analisa perbandingan performa IDS menggunakan features selection dengan algoritma Random Forest Classifier yang disimulasikan pada dataset UNSW-NB15, yaitu dataset simulasi serangan pada jaringan network yang dikembangan oleh Nour Moustafa & Jill Slay dari University of New South Wales pada Australian Defence Force Academy . Tujuan dari penelitian ini adalah mempercepat waktu proses Intrusion detection systems dengan machile learning . Penelitian dilakukan dengan 2 tahap, yaitu tahap pertama tanpa features selection dan tahap kedua dengan features selection ExtraTreesClassifier . Masing-masing tahap dilakukan dengan beberapa kali pengujian dengan persentasi testing dan training data yang berbeda. Hasil penelitian menunjukan bahwa penggunaan features selection dapat mempercepat waktu proses pendeteksian dengan menggunakan Random Forest Classifier , walaupun ada sedikit penurun akurasi dibawah 1%. Kata kunci: feature selection, random forest, ids, machine learning Abstract Internet data connection is very important, therefore it will increasing the security issues. One of the important tools is Intrusion detection systems (IDS). The main problems of using IDS is the speed performance to detect more and more data in a short time. In this study, we will perform a comparative analysis of IDS performance using features selection with the Random Forest Classifier algorithm which is simulated on the UNSW-NB15 dataset, which is work as the attack simulation dataset on the network developed by Nour Moustafa & Jill Slay from the University of New South Wales at the Australian Defense Force Academy. The purpose of this research is to speed up the processing time of Intrusion detection systems with machile learning. The research was conducted in 2 stages, the first stage without features selection and the second stage with features selection. Each stage is carried out with several study using different percentages of testing and training data. The results showed that by using features selection, it can speed up the detection process time using the Random Forest Classifier, although there is a slight decrease in accuracy below 1%. Keywords: feature selection, random forest, ids, machine learning","PeriodicalId":32367,"journal":{"name":"Sistemasi Jurnal Sistem Informasi","volume":"83 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2021-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sistemasi Jurnal Sistem Informasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.32520/stmsi.v10i3.1550","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2

Abstract

Abstrak Semakin penting koneksi data melalui Internet membuat kebutuhan akan keamanan jaringan data semakin meningkat. Salah satu tools yang penting adalah Intrusion detection systems (IDS). Salah satu hal yang menjadi masalah dari penggunaan IDS adalah performan kecepatan untuk mendeteksi data yang semakin banyak dalam waktu yang singkat. Dalam penelitian ini kami akan melakukan analisa perbandingan performa IDS menggunakan features selection dengan algoritma Random Forest Classifier yang disimulasikan pada dataset UNSW-NB15, yaitu dataset simulasi serangan pada jaringan network yang dikembangan oleh Nour Moustafa & Jill Slay dari University of New South Wales pada Australian Defence Force Academy . Tujuan dari penelitian ini adalah mempercepat waktu proses Intrusion detection systems dengan machile learning . Penelitian dilakukan dengan 2 tahap, yaitu tahap pertama tanpa features selection dan tahap kedua dengan features selection ExtraTreesClassifier . Masing-masing tahap dilakukan dengan beberapa kali pengujian dengan persentasi testing dan training data yang berbeda. Hasil penelitian menunjukan bahwa penggunaan features selection dapat mempercepat waktu proses pendeteksian dengan menggunakan Random Forest Classifier , walaupun ada sedikit penurun akurasi dibawah 1%. Kata kunci: feature selection, random forest, ids, machine learning Abstract Internet data connection is very important, therefore it will increasing the security issues. One of the important tools is Intrusion detection systems (IDS). The main problems of using IDS is the speed performance to detect more and more data in a short time. In this study, we will perform a comparative analysis of IDS performance using features selection with the Random Forest Classifier algorithm which is simulated on the UNSW-NB15 dataset, which is work as the attack simulation dataset on the network developed by Nour Moustafa & Jill Slay from the University of New South Wales at the Australian Defense Force Academy. The purpose of this research is to speed up the processing time of Intrusion detection systems with machile learning. The research was conducted in 2 stages, the first stage without features selection and the second stage with features selection. Each stage is carried out with several study using different percentages of testing and training data. The results showed that by using features selection, it can speed up the detection process time using the Random Forest Classifier, although there is a slight decrease in accuracy below 1%. Keywords: feature selection, random forest, ids, machine learning
基于Mendeteksi的入侵检测系统特征选择分析
通过互联网的数据连接越重要,对数据网络安全的需求就越高。重要的工具之一是仪器探测系统。使用身份证的问题之一是速度狂在短时间内检测越来越多的数据。在这项研究中,我们将对id使用特征选择算法与分布在UNSW-NB15上的随机森林分类算法进行比较。研究涉及两个阶段,第一阶段没有特征选择,第二阶段有选择性选择。每个阶段都是通过不同的测试和数据培训进行多次测试。研究表明,特征选择的使用可以通过随机森林分类器加速检测过程的时间,尽管误差略低于1%。关键词:情感选择、随机森林、id、机器学习吸收数据连接是非常重要的,因此它会增加安全问题。重要的工具之一是语音探测系统。使用身份证的主要问题是在短时间内检测越来越多的数据。在这个研究,我们会表演a comparative演出用的身份证特征之分析》和《selection Classifier随机森林算法,这是simulated UNSW-NB15》美国数据集,这是工作的攻击模拟数据集网络developed by Nour &吉尔杀死穆斯塔法》从《澳大利亚新南威尔士大学at the Defense Force Academy。这项研究的目的是加快学习过程探测系统的过程过程。研究被分配到两个阶段,第一阶段没有特征选择,第二阶段没有特征选择。每个阶段都以不同的测试和数据培训中心为特色。最近的结果表明,通过使用特征特征分类,可以利用随机森林经典来加快测量时间的过程,尽管准确程度下还有一小部分。特征选择,随机森林,id,机器学习
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
66
审稿时长
43 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信