Sistem Deteksi Malware Menggunakan Information Gain dan Decision Tree
DOI:
https://doi.org/10.24114/cess.v10i2.67170Keywords:
Malware, portable executable, decision tree, information gain, klasifikasiAbstract
Malicious Software, atau yang dikenal dengan malware, merupakan perangkat lunak berbahaya yang dapat menyebabkan hal-hal yang tidak diinginkan, seperti kehilangan data, pencurian informasi, penyebaran data pribadi, dan penyalahgunaan informasi penting. Pada penelitian ini, metode yang digunakan untuk deteksi malware adalah metode Decision Tree untuk klasifikasi dan metode Information Gain untuk seleksi fitur. Metode Decision Tree mempermudah dalam melacak dan memahami keputusan dengan struktur pohonnya, sementara Information Gain membantu dalam memilih fitur yang paling relevan dan informatif. Penelitian ini bertujuan untuk meningkatkan akurasi dan efisiensi dalam mendeteksi malware Portable Executable (PE) yang menargetkan file eksekusi pada sistem operasi Windows. Dataset yang digunakan adalah dataset SOMLAP (Swarm Optimization and Machine Learning Applied to PE Malware Detection), yang mengandung 51409 sampel file excutable Windows yang diekstrasi, yang terdiri dari file benign (non malware) dan file malware. Hasil penelitian menunjukkan bahwa pada proporsi data 90:10, metode pemilihan 20 fitur dengan Information Gain berhasil meningkatkan efisiensi dan efektivitas dalam mendeteksi malware PE dengan rata-rata akurasi 99,3% dan rata-rata waktu pemrosesan yang diperlukan sebesar 32 detik dibandingkan dengan metode terbaik pada penelitian sebelumnya, yaitu Ant Colony Optimization dan Decision Tree yang memiliki rata-rata akurasi 98,8% dan rata-rata waktu pemrosesan sebesar 43 detik.References
[1] Y. Ilhamdi and Y. N. Kunang, “Analisis Malware Pada Sistem Operasi Windows Menggunakan Teknik Forensik,” in Bina Darma Conference on Computer Science (BDCCS), 2021, pp. 256–264.
[2] N. A. Nurfauzi, “Deteksi serangan malware pada cloud server menggunakan metode anomaly based,” Universitas Islam Negeri Maulana Malik Ibrahim, 2022.
[3] Y. W, Y. B. Fitriana, S. Esabela, and F. Hamdani, “Deteksi Serangan Malware Pada Web Aplikasi Menggunakan Metode Malware Analis Dinamis dan Statis,” Digital Transformation Technology, vol. 4, no. 1, pp. 461–470, Jul. 2024, doi: 10.47709/DIGITECH.V4I1.4270.
[4] D. Perakovi et al., “Swarm Optimization and Machine Learning Applied to PE Malware Detection towards Cyber Threat Intelligence,” Electronics 2023, Vol. 12, Page 342, vol. 12, no. 2, p. 342, Jan. 2023, doi: 10.3390/ELECTRONICS12020342.
[5] A. Kumar, K. S. Kuppusamy, and G. Aghila, “A learning model to detect maliciousness of portable executable using integrated feature set,” Journal of King Saud University - Computer and Information Sciences, vol. 31, no. 2, pp. 252–265, Apr. 2019, doi: 10.1016/J.JKSUCI.2017.01.003.
[6] D. W. Asry, E. Siswanto, D. Kurniawan, and H. I. Huda, “Deteksi Malware Statis Menggunakan Deep Neural Networks Pada Portable Executable,” Teknik: Jurnal Ilmu Teknik dan Informatika, vol. 3, no. 1, pp. 19–34, May 2023, doi: 10.51903/TEKNIK.V3I1.325.
[7] R. Latifah, E. S. Wulandari, and P. E. Kreshna, “Model Decision Tree Untuk Prediksi Jadwal Kerja Menggunakan Scikit-Learn,” Prosiding Semnastek, 2019.
[8] M. Hazri, “Analisis Malware PlasmaRAT dengan Metode Reverse Engineering,” Jurnal Rekayasa Teknologi Informasi (JURTI), vol. 4, no. 2, pp. 192–199, Nov. 2020, doi: 10.30872/JURTI.V4I2.4131.
[9] R. Kesuma Dinata, H. Novriando, N. Hasdyna, S. Retno, J. Hadari Nawawi, and K. Barat, “Reduksi Atribut Menggunakan Information Gain untuk Optimasi Cluster Algoritma K-Means,” JEPIN (Jurnal Edukasi dan Penelitian Informatika), vol. 6, no. 1, pp. 48–53, Apr. 2020, doi: 10.26418/JP.V6I1.37606.
[10] M. R. Hasibuan and M. Marji, “Pemilihan Fitur dengan Information Gain untuk Klasifikasi Penyakit Gagal Ginjal menggunakan Metode Modified K-Nearest Neighbor (MKNN),” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 3, no. 11, pp. 10435–10443, 2019, Accessed: Jul. 21, 2025. [Online]. Available: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/6691
[11] A. Bijaksana, P. Negara, H. Muhardi, and I. M. Putri, “Analisis Sentimen Maskapai Penerbangan Menggunakan Metode Naive Bayes dan Seleksi Fitur Information Gain,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 7, no. 3, pp. 599–606, May 2020, doi: 10.25126/JTIIK.2020711947.
[12] K. Halim, Dyah, E. Herwindiati, and T. Sutrisno, “Penerapan Metode Decision Tree untuk Prakiraan Cuaca Kota Bekasi,” Jurnal Ilmu Komputer dan Sistem Informasi, vol. 11, no. 2, Aug. 2023, doi: 10.24912/JIKSI.V11I2.26026.
[13] H. Blockeel, L. Devos, B. Frénay, G. Nanfack, and S. Nijssen, “Decision trees: from efficient prediction to responsible AI,” Front Artif Intell, vol. 6, p. 1124553, Jul. 2023, doi: 10.3389/FRAI.2023.1124553/XML.
[14] M. Kuhn and K. Johnson, “Applied predictive modeling,” Applied Predictive Modeling, pp. 1–600, Jan. 2013, doi: 10.1007/978-1-4614-6849-3/COVER.
[15] T. Hastie, R. Tibshirani, and J. Friedman, “The Elements of Statistical Learning,” 2009, doi: 10.1007/978-0-387-84858-7.
[16] I. Guyon and A. Elisseeff, “An Introduction to Variable and Feature Selection,” Journal of Machine Learning Research, vol. 3, pp. 1157–1182, 2003, doi: 10.5555/944919.
[17] L. Lhotská, M. Macaš, and M. Burša, “PSO and ACO in Optimization Problems,” Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol. 4224 LNCS, pp. 1390–1398, 2006, doi: 10.1007/11875581_165.
[18] E. Odhiambo Omuya, G. Onyango Okeyo, and M. Waema Kimwele, “Feature Selection for Classification using Principal Component Analysis and Information Gain,” Expert Syst Appl, vol. 174, p. 114765, Jul. 2021, doi: 10.1016/J.ESWA.2021.114765.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 CESS (Journal of Computer Engineering, System and Science)

This work is licensed under a Creative Commons Attribution 4.0 International License.