Ilman, Dina (2019) Ekstraksi Informasi Dokumen Karya Ilmiah Menggunakan Algoritma Maximum Entropy Markov Model. Other thesis, Universitas Komputer Indonesia.
|
Text
1.10113029_DINA ILMAN_COVER.pdf - Published Version Download (15kB) | Preview |
|
|
Text
19.10113029_DINA ILMAN_LEMBAR PENGESAHAN.pdf - Published Version Download (110kB) | Preview |
|
|
Text
17.10113029_DINA ILMAN_SURAT KETERANGAN PUBLIKASI.pdf - Published Version Download (21kB) | Preview |
|
|
Text
20.10113029_DINA ILMAN_SURAT KETERANGAN ORISINALITAS.pdf - Published Version Download (22kB) | Preview |
|
|
Text
4.10113029_DINA ILMAN_KATA PENGANTAR.pdf - Published Version Download (110kB) | Preview |
|
|
Text
5.10113029_DINA ILMAN_DAFTAR ISI.pdf - Published Version Download (91kB) | Preview |
|
|
Text
11.10113029_DINA ILMAN_BAB 1.pdf - Published Version Download (47kB) | Preview |
|
|
Text
12.10113029_DINA ILMAN_BAB 2.pdf - Published Version Download (592kB) | Preview |
|
Text
13.10113029_DINA ILMAN_BAB 3.pdf - Published Version Restricted to Repository staff only Download (2MB) | Request a copy |
||
Text
14.10113029_DINA ILMAN_BAB 4.pdf - Published Version Restricted to Repository staff only Download (450kB) | Request a copy |
||
|
Text
15.10113029_DINA ILMAN_BAB 5.pdf - Published Version Download (7kB) | Preview |
|
|
Text
10.10113029_DINA ILMAN_DAFTAR PUSTAKA.pdf - Published Version Download (91kB) | Preview |
|
|
Text
21.10113029_DINA ILMAN_JURNAL BAHASA INDONESIA.pdf - Published Version Download (449kB) | Preview |
|
|
Text
22.10113029_DINA ILMAN_JURNAL BAHASA INGGRIS.pdf - Published Version Download (365kB) | Preview |
Abstract
Pendeteksian kategori dokumen karya ilmiah belum mampu dilakukan untuk dokumen dengan format beragam. Permasalahan tersebut dapat diatasi jika menggunakan machine learning. Algoritma machine learning yang digunakan adalah Maximum Entropy Markov Model (MEMM). Algoritma MEMM merupakan salah satu gabungan dari Markov Model dengan Logistic Regression. Proses pelatihan dari algoritma tersebut dokumen karya ilmiah dipelajari terlebih dahulu pola dari dataset dengan menentukan nilai lerarning rate dan bobot awal theta. Pengulangan berhenti berdasarkan nilai cross entropy jika sudah mendekati konvergen dan jumlah pengulangan. Pengujian berdasarkan model yang sudah dilatih dengan algoritma viterbi untuk mengekstraksi kategori pada dokumen karya ilmiah. Berdasarkan pengujian pada 40 dokumen karya ilmiah skripsi tahun 2011 sampai 2018, diperoleh rata-rata akurasi dengan pengujian token-kelas sebesar 77% dengan learning rate 0.001. Perolehan akurasi token-kelas disebabkan penggunaan fungsi fitur yang kurang unik untuk menentukan ciri dari setiap kategori dokumen, pelatihan bobot theta perlu menggunakan metode tambahan agar lebih tepat dan pengaruh learning rate yang menentukan seberapa banyak proses pelatihan dilakukan.
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | Ekstraksi Informasi, Maximume Entropy Markov Model, MEMM,Dokumen Karya ilmiah, Skripsi, Logistic Regression |
Subjects: | 000_COMPUTER SCIENCE, INFORMATION & GENERAL WORKS. > 004_Data Processing & Computer Science |
Divisions: | S1_SKRIPSI > FTIK_Teknik Informatika (01) |
Depositing User: | Mrs. Calis Maryani |
Date Deposited: | 02 Oct 2019 04:13 |
Last Modified: | 02 Oct 2019 04:13 |
URI: | http://elibrary.unikom.ac.id/id/eprint/952 |
Actions (login required)
View Item |