Kurnia, Tristantio Bierhoff (2024) Penanganan Imbalanced Dataset Menggunakan Smote Pada Prediksi Tipe Kepribadian Aktor Dan Aktris Film Marvel. Other thesis, Universitas Komputer Indonesia.
1.UNIKOM_TRISTANTIO BIERHOFF KURNIA_COVER.pdf - Published Version
Download (114kB)
19.UNIKOM_TRISTANTIO BIERHOFF KURNIA_LEMBAR PENGESAHAN.pdf - Published Version
Download (499kB)
17.UNIKOM_TRISTANTIO BIERHOFF KURNIA_SURAT KETERANGAN PUBLIKASI.pdf - Published Version
Download (240kB)
20.UNIKOM_TRISTANTIO BIERHOFF KURNIA_SURAT PERNYATAAN ORISINALITAS.pdf - Published Version
Download (236kB)
4.UNIKOM_TRISTANTIO BIERHOFF KURNIA_KATA PENGANTAR.pdf - Published Version
Download (129kB)
5.UNIKOM_TRISTANTIO BIERHOFF KURNIA_DAFTAR ISI.pdf - Published Version
Download (175kB)
11.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 1.pdf - Published Version
Download (196kB)
12.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 2.pdf - Published Version
Download (849kB)
13.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 3.pdf - Published Version
Restricted to Repository staff only
Download (1MB) | Request a copy
14.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 4.pdf - Published Version
Restricted to Repository staff only
Download (304kB) | Request a copy
15.UNIKOM_TRISTANTIO BIERHOFF KURNIA_BAB 5.pdf - Published Version
Download (154kB)
10.UNIKOM_TRISTANTIO BIERHOFF KURNIA_DAFTAR PUSTAKA.pdf - Published Version
Download (133kB)
18.UNIKOM_TRISTANTIO BIERHOFF KURNIA_LEMBAR KONTAK PENULIS & KONTRIBUTOR.pdf - Published Version
Download (104kB)
Abstract
Penelitian ini bertujuan untuk mengukur performa SMOTE untuk mengatasi ketidakseimbangan dataset pada model LSTM dalam mengklasifikasi tipe kepribadian MBTI pada aktor dan aktris Marvel Cinematic Universe (MCU) berdasarkan data dari media sosial Twitter. Sistem yang dikembangkan melibatkan beberapa tahapan penting, mulai dari pengumpulan data, preprocessing data, penanganan ketidakseimbangan dataset menggunakan metode Synthetic Minority Over-sampling Technique (SMOTE), hingga pengembangan model klasifikasi dan evaluasi kinerja.Dataset yang digunakan terdiri dari 33.681 twit yang dikumpulkan dari 66 artis MCU. Data tersebut melalui tahap preprocessing yang meliputi cleaning, case folding, tokenization, stopword removal, dan lemmatization. Setelah preprocessing, data direpresentasikan menggunakan teknik Word2Vec untuk menghasilkan fitur yang dapat digunakan oleh model klasifikasi. Untuk mengatasi ketidakseimbangan kelas dalam dataset, SMOTE diterapkan dengan menciptakan sampel sintetis untuk kelas minoritas. Perbandingan 1:3 dipilih karena menghasilkan nilai loss yang lebih rendah dan akurasi yang lebih tinggi dibandingkan dengan perbandingan lainnya. Model klasifikasi kemudian dibangun dan diuji menggunakan data yang telah diimbangi. Pengujian lebih lanjut dilakukan untuk menemukan hyperparameter terbaik, dan hasilnya menunjukkan bahwa batch size 32, learning rate 0.01, dan epoch 50 memberikan kinerja terbaik untuk model ini. Meskipun SMOTE berhasil meningkatkan representasi kelas minoritas, akurasi prediksi yang dihasilkan masih rendah, yaitu sekitar 18.73%. Kesimpulan dari penelitian ini adalah bahwa meskipun SMOTE dapat membantu mengatasi masalah ketidakseimbangan data, performa model masih perlu ditingkatkan melalui peningkatan kompleksitas, regularisasi, hyperparameter tuning, serta pemodelan empat dimensi MBTI dan fitur tambahan yang lebih relevan.
| Item Type: | Thesis (Other) |
|---|---|
| Uncontrolled Keywords: | Klasifikasi MBTI, Marvel Cinematic Universe, Twitter, Preprocessing, Word2Vec, SMOTE, LSTM, Ketidakseimbangan Dataset, Oversampling, Hyperparameter Tuning |
| Subjects: | 000 COMPUTER SCIENCE, INFORMATION & GENERAL WORKS > 005 Computer Programming, Programs & Data Q Science > QA Mathematics > QA76 Computer software |
| Divisions: | S1 Skripsi > Teknik Informatika |
| Depositing User: | Mia Mia Hayati Kosasih |
| Date Deposited: | 11 Sep 2025 06:42 |
| Last Modified: | 11 Sep 2025 06:42 |
| URI: | http://elibrary.unikom.ac.id/id/eprint/10924 |
