ANALISIS KOMPARATIF ALGORITMA ENSEMBLE LEARNING (RANDOM FOREST DAN XGBOOST) BERBASIS EKSTRAKSI FITUR SINTAKSIS UNTUK DETEKSI ANOMALI NOMOR PONSEL

ANDI FATURRAHMAN (2026) ANALISIS KOMPARATIF ALGORITMA ENSEMBLE LEARNING (RANDOM FOREST DAN XGBOOST) BERBASIS EKSTRAKSI FITUR SINTAKSIS UNTUK DETEKSI ANOMALI NOMOR PONSEL. Sarjana thesis, Universitas Tadulako.

Full text not available from this repository.

Abstract

Kualitas basis data alumni merupakan aset krusial bagi institusi pendidikan dan
pelatihan untuk menjamin kelancaran komunikasi dan validitas informasi. Namun,
masalah anomali nomor ponsel akibat kesalahan input (human error) sering kali
menurunkan integritas data. Penelitian ini bertujuan untuk membandingkan kinerja
dua algoritma Ensemble Learning, yaitu Random Forest dan XGBoost, dalam
mendeteksi anomali nomor ponsel secara otomatis. Data yang digunakan dalam
penelitian ini bersumber dari dataset alumni LKP GIMB Foundation. Penelitian ini
menggunakan 11 fitur sintaksis yang mencakup dimensi struktural, validitas, dan
pola keacakan melalui Shannon Entropy. Untuk mengatasi masalah
ketidakseimbangan data antara kelas valid dan anomali, teknik Synthetic Minority
Over-sampling Technique (SMOTE) diterapkan pada data pelatihan. Eksperimen
dilakukan dalam dua skenario utama: Skenario 1 menggunakan fitur berbasis aturan
(rule-based) dan Skenario 2 menggunakan fitur struktural yang lebih granular. Hasil
menunjukkan bahwa XGBoost pada Skenario 2 memberikan performa paling
optimal dengan Akurasi 99,90%, Precision 1,00, dan Recall 0,99. Selain unggul
dalam metrik evaluasi, XGBoost terbukti efisien dengan waktu inference sebesar
0,0025 detik. Penelitian ini menyimpulkan bahwa kombinasi fitur struktural
granular dan teknik penyeimbangan data SMOTE mampu menciptakan sistem
deteksi anomali yang sangat akurat untuk pembersihan data alumni.

Item Type: Thesis (Sarjana)
Subjects: Tadulako University - Divisions > Fakultas Teknik > Teknik Informatika
T Technology > Teknik Informatika
Divisions: Fakultas Teknik > Teknik Informatika
Library of Congress Subject Areas > T Technology > Teknik Informatika
Date Deposited: 20 May 2026 07:41
Last Modified: 20 May 2026 07:41
URI: https://repository.untad.ac.id/id/eprint/155233
Baca Full Text: Baca Sekarang

Actions (login required)

View Item
View Item