Wahyudi, Alfan (2021) Implementasi Metode Local Mean-Based K-Nearest Neighbor Untuk Deteksi Kata Hinaan Pada Komentar Live Stream Game Youtube. Other thesis, Univeristas Komputer Indonesia.
UNIKOM_ALFAN WAHYUDI_COVER.pdf - Published Version
Download (70kB) | Preview
UNIKOM_ALFAN WAHYUDI_LEMBAR PENGESAHAN.pdf - Published Version
Download (253kB) | Preview
UNIKOM_ALFAN WAHYUDI_SURAT KETERANGAN PUBLIKASI.pdf - Published Version
Download (165kB) | Preview
UNIKOM_ALFAN WAHYUDI_SURAT KETERANGAN ORISINALITAS.pdf - Published Version
Download (194kB) | Preview
UNIKOM_ALFAN WAHYUDI_KATA PENGANTAR.pdf - Published Version
Download (88kB) | Preview
UNIKOM_ALFAN WAHYUDI_DAFTAR ISI.pdf - Published Version
Download (40kB) | Preview
UNIKOM_ALFAN WAHYUDI_BAB I.pdf - Published Version
Download (144kB) | Preview
UNIKOM_ALFAN WAHYUDI_BAB II.pdf - Published Version
Download (417kB) | Preview
UNIKOM_ALFAN WAHYUDI_BAB III.pdf - Published Version
Restricted to Repository staff only
Download (4MB) | Request a copy
UNIKOM_ALFAN WAHYUDI_BAB IV.pdf - Published Version
Restricted to Repository staff only
Download (359kB) | Request a copy
UNIKOM_ALFAN WAHYUDI_BAB V.pdf - Published Version
Download (32kB) | Preview
UNIKOM_ALFAN WAHYUDI_DAFTAR PUSTAKA.pdf - Published Version
Download (99kB) | Preview
UNIKOM_ALFAN WAHYUDI_LEMBAR KONTAK PENULIS DAN KONTRIBUTOR.pdf - Published Version
Download (76kB) | Preview
Abstract
Penelitian ini bertujuan untuk mengenali komentar yang memiliki unsur kata hinaan dan mengetahui besaran akurasi dari Local Mean-Based K-Nearest Neighbor. Pertama-tama, data yang akan digunakan diambil menggunakan metode web scraping dari API youtube comment. Setelah terkumpul, data komentar tersebut akan dipilih lagi agar menjadi stabil. Sehingga, memiliki jumlah data sebanyak 440, 220 data untuk kategori “hinaan” dan 220 yang lain sebagai “bukan hinaan”. Karena data berupa teks, maka sebelum menuju proses prediksi LMKNN akan melakukan text-preprocessing dan ekstraksi fitur TF-IDF, agar merubah string menjadi numerik. Selanjutnya, proses prediksi LMKNN akan menggunakan beberapa parameter K dari 6-16. Evaluasi model akan dilakukan dengan 5-fold Cross Validation (CV), yang berarti setiap 5-fold digunakan untuk data uji dan sisanya menjadi data latih. Sehingga, hasil yang dihasilkan oleh LMKNN dengan 5-fold CV mendapatkan akurasi terbesar sebesar 0,6023 untuk K = 11. Maka dari itu, dapat disimpulkan pembangunan sistem dengan memakai algoritma LMKNN berhasil mendeteksi suatu teks yang termasuk “hinaan” atau “bukan hinaan” cukup baik dengan akurasi sebesar 0,6023 untuk K = 11.
| Item Type: | Thesis (Other) |
|---|---|
| Uncontrolled Keywords: | local mean-based k-nearest neighbor, k-fold cross validation, deteksi kata hinaan |
| Subjects: | 000 COMPUTER SCIENCE, INFORMATION & GENERAL WORKS > 004 Data Processing & Computer Science Q Science > QA Mathematics > QA76 Computer software |
| Divisions: | S1 Skripsi > Teknik Informatika |
| Depositing User: | Mia Hayati Kosasih |
| Date Deposited: | 17 Jun 2022 04:51 |
| Last Modified: | 17 Jun 2022 04:51 |
| URI: | http://elibrary.unikom.ac.id/id/eprint/5592 |
