Ramadhani, Iqbal (2020) Named Entity Recognition Untuk Teks Bahasa Indonesia Menggunakan Support Vector Machine. Other thesis, Universitas Komputer Indonesia.
1. 10115025_IQBAL RAMADHANI_COVER.pdf - Published Version
Download (36kB) | Preview
19. 10115025_IQBAL RAMADHANI_LEMBAR PENGESAHAN.pdf - Published Version
Download (873kB) | Preview
17. 10115025_IQBAL RAMADHANI_SURAT KETERANGAN PUBLIKASI.pdf - Published Version
Download (526kB) | Preview
20. 10115025_IQBAL RAMADHANI_SURAT KETERANGAN ORISINALITAS.pdf - Published Version
Download (10MB) | Preview
4. 10115025_IQBAL RAMADHANI_KATA PENGANTAR.pdf - Published Version
Download (48kB) | Preview
5. 10115025_IQBAL RAMADHANI_DAFTAR ISI.pdf - Published Version
Download (39kB) | Preview
11. 10115025_IQBAL RAMADHANI_BAB 1.pdf - Published Version
Download (32kB) | Preview
12. 10115025_IQBAL RAMADHANI_BAB 2.pdf - Published Version
Download (390kB) | Preview
13. 10115025_IQBAL RAMADHANI_BAB 3.pdf - Published Version
Restricted to Repository staff only
Download (1MB) | Request a copy
14. 10115025_IQBAL RAMADHANI_BAB 4.pdf - Published Version
Restricted to Repository staff only
Download (277kB) | Request a copy
15. 10115025_IQBAL RAMADHANI_BAB 5.pdf - Published Version
Download (28kB) | Preview
10. 10115025_IQBAL RAMADHANI_DAFTAR PUSTAKA.pdf - Published Version
Download (75kB) | Preview
Abstract
Pengenalan entitas bernama atau Named Entity Recognition (NER) merupakan sebuah topik keilmuan yang membahas pemrosesan bahasa alami dengan mengekstraksi informasi pada sebuah teks. NER juga merupakan komponen penting yang mendasari banyak aplikasi Natural Language Processing (NLP). Penelitian tentang NER sudah pernah dilakukan menggunakan beberapa metode seperti CRF, Naive Bayes, dan SVM. Penelitian NER pada metode SVM menghasilkan nilai performa f1-score sebesar 50% yang disebabkan karena hasil dari ekstraksi fitur yang digunakan. Sebelum tahap pelatihan dan pengujian dilakukan, list kata melalui tahap preprocessing, yaitu pemisahan kata dan label, case folding, pembentukan kamus, one hot encoding, ekstraksi fitur, kemudian penggabungan hasil one hot encoding dengan hasil ekstraksi fitur. Berdasarkan hasil pengujian yang telah dilakukan pada 9405 list kata, didapatkan nilai akurasi tertinggi sebesar 81% dengan recall sebesar 70%, precession 52%, dan f1-score sebesar 53%. Tingkat akurasi ini dipengaruhi oleh penggunaan metode one hot encoding yang tidak bisa membedakan ciri untuk data yang sama pada kelas yang berbeda.
| Item Type: | Thesis (Other) |
|---|---|
| Uncontrolled Keywords: | NER, One Hot Encoding, SVM |
| Subjects: | 000 COMPUTER SCIENCE, INFORMATION & GENERAL WORKS > 004 Data Processing & Computer Science |
| Divisions: | S1 Skripsi > Teknik Informatika |
| Depositing User: | Mrs. Calis Maryani |
| Date Deposited: | 05 Sep 2020 06:08 |
| Last Modified: | 17 Sep 2020 04:41 |
| URI: | http://elibrary.unikom.ac.id/id/eprint/2683 |
