Penanganan Imbalanced Dataset Menggunakan Smote Pada Prediksi Tipe Kepribadian Aktor Dan Aktris Film Marvel

Kurnia, Tristantio Bierhoff (2024) Penanganan Imbalanced Dataset Menggunakan Smote Pada Prediksi Tipe Kepribadian Aktor Dan Aktris Film Marvel. Other thesis, Universitas Komputer Indonesia.

[img] Text
1.UNIKOM_TRISTANTIO BIERHOFF KURNIA_COVER.pdf - Published Version

Download (114kB)
[img] Text
19.UNIKOM_TRISTANTIO BIERHOFF KURNIA_LEMBAR PENGESAHAN.pdf - Published Version

Download (499kB)
[img] Text
17.UNIKOM_TRISTANTIO BIERHOFF KURNIA_SURAT KETERANGAN PUBLIKASI.pdf - Published Version

Download (240kB)
[img] Text
20.UNIKOM_TRISTANTIO BIERHOFF KURNIA_SURAT PERNYATAAN ORISINALITAS.pdf - Published Version

Download (236kB)
[img] Text
4.UNIKOM_TRISTANTIO BIERHOFF KURNIA_KATA PENGANTAR.pdf - Published Version

Download (129kB)
[img] Text
5.UNIKOM_TRISTANTIO BIERHOFF KURNIA_DAFTAR ISI.pdf - Published Version

Download (175kB)
[img] Text
11.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 1.pdf - Published Version

Download (196kB)
[img] Text
12.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 2.pdf - Published Version

Download (849kB)
[img] Text
13.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 3.pdf - Published Version
Restricted to Repository staff only

Download (1MB) | Request a copy
[img] Text
14.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 4.pdf - Published Version
Restricted to Repository staff only

Download (304kB) | Request a copy
[img] Text
15.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 5.pdf - Published Version

Download (154kB)
[img] Text
10.UNIKOM_TRISTANTIO BIERHOFF KURNIA_DAFTAR PUSTAKA.pdf - Published Version

Download (133kB)
[img] Text
18.UNIKOM_TRISTANTIO BIERHOFF KURNIA_LEMBAR KONTAK PENULIS & KONTRIBUTOR.pdf - Published Version

Download (104kB)
Official URL: https://elibrary.unikom.ac.id/

Abstract

Penelitian ini bertujuan untuk mengukur performa SMOTE untuk mengatasi ketidakseimbangan dataset pada model LSTM dalam mengklasifikasi tipe kepribadian MBTI pada aktor dan aktris Marvel Cinematic Universe (MCU) berdasarkan data dari media sosial Twitter. Sistem yang dikembangkan melibatkan beberapa tahapan penting, mulai dari pengumpulan data, preprocessing data, penanganan ketidakseimbangan dataset menggunakan metode Synthetic Minority Over-sampling Technique (SMOTE), hingga pengembangan model klasifikasi dan evaluasi kinerja.Dataset yang digunakan terdiri dari 33.681 twit yang dikumpulkan dari 66 artis MCU. Data tersebut melalui tahap preprocessing yang meliputi cleaning, case folding, tokenization, stopword removal, dan lemmatization. Setelah preprocessing, data direpresentasikan menggunakan teknik Word2Vec untuk menghasilkan fitur yang dapat digunakan oleh model klasifikasi. Untuk mengatasi ketidakseimbangan kelas dalam dataset, SMOTE diterapkan dengan menciptakan sampel sintetis untuk kelas minoritas. Perbandingan 1:3 dipilih karena menghasilkan nilai loss yang lebih rendah dan akurasi yang lebih tinggi dibandingkan dengan perbandingan lainnya. Model klasifikasi kemudian dibangun dan diuji menggunakan data yang telah diimbangi. Pengujian lebih lanjut dilakukan untuk menemukan hyperparameter terbaik, dan hasilnya menunjukkan bahwa batch size 32, learning rate 0.01, dan epoch 50 memberikan kinerja terbaik untuk model ini. Meskipun SMOTE berhasil meningkatkan representasi kelas minoritas, akurasi prediksi yang dihasilkan masih rendah, yaitu sekitar 18.73%. Kesimpulan dari penelitian ini adalah bahwa meskipun SMOTE dapat membantu mengatasi masalah ketidakseimbangan data, performa model masih perlu ditingkatkan melalui peningkatan kompleksitas, regularisasi, hyperparameter tuning, serta pemodelan empat dimensi MBTI dan fitur tambahan yang lebih relevan.

Item Type: Thesis (Other)
Uncontrolled Keywords: Klasifikasi MBTI, Marvel Cinematic Universe, Twitter, Preprocessing, Word2Vec, SMOTE, LSTM, Ketidakseimbangan Dataset, Oversampling, Hyperparameter Tuning
Subjects: 000_COMPUTER SCIENCE, INFORMATION & GENERAL WORKS. > 005_Computer Programming, Programs & Data
Q Science > QA Mathematics > QA76 Computer software
Divisions: S1_SKRIPSI > FTIK_Teknik Informatika (01)
Depositing User: Mia Mia Hayati Kosasih
Date Deposited: 11 Sep 2025 06:42
Last Modified: 11 Sep 2025 06:42
URI: http://elibrary.unikom.ac.id/id/eprint/10924

Actions (login required)

View Item View Item