Riadi, Viky Zulpikar (2019) Vector Space Model Dan Clustering Untuk Deteksi Kesamaan Dokumen Berbahasa Indonesia. Other thesis, Universitas Komputer Indonesia.
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_COVER.pdf - Published Version Download (32kB) | Preview |
|
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_LEMBAR PENGESAHAN.pdf - Published Version Download (197kB) | Preview |
|
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_SURAT KETERANGAN PUBLIKASI.pdf - Published Version Download (159kB) | Preview |
|
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_SURAT KETERANGAN ORISINALITAS.pdf - Published Version Download (186kB) | Preview |
|
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_KATA PENGANTAR.pdf - Published Version Download (79kB) | Preview |
|
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_DAFTAR ISI.pdf - Published Version Download (110kB) | Preview |
|
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 1.pdf - Published Version Download (193kB) | Preview |
|
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 2.pdf - Published Version Download (330kB) | Preview |
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 3.pdf - Published Version Restricted to Repository staff only Download (1MB) | Request a copy |
||
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 4.pdf - Published Version Download (517kB) | Preview |
|
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 5.pdf - Published Version Download (8kB) | Preview |
|
|
Text
UNIKOM_VIKY ZULPIKAR RIADI_DAFTAR PUSTAKA.pdf - Published Version Download (165kB) | Preview |
Abstract
Salah satu cara untuk mendeteksi plagiarisme adalah dengan mendeteksi kesamaan dokumen. Kesulitan dalam mendeteksi kesamaan dokumen adalah kesamaan dengan mengubah kalimat orang lain ke dalam susunan kalimat sendiri tanpa mengubah idenya (obfuscation). Untuk itulah diperlukan sebuah sistem untuk mendeteksi kesamaan dokumen yang tidak hanya mendeteksi kesamaan berupa exact copy tetapi juga berupa kesamaan obfuscation. Metode yang dipakai pada penelitian ini adalah Vector Space Model dan Clustering. Terdapat 4 tahapan dalam prosesnya yaitu pertama preprocessing yang terdiri dari tokenisasi kalimat, case folding, tokenisasi kata, filter kata, stemming, filter kalimat, TF-IDF. Kedua seeding yaitu membandingkan setiap kalimat pada dokumen uji dan latih dengan menggunakan Cosine Similarity dan Dice Coefficient. Ketiga extension yaitu mengkluster nilai-nilai dari proses seeding yang berupa pasangan kalimat sama kemudian nilai hasil kluster di validasi menggunakan Cosine Similarity. Keempat filtering yaitu menyeleksi nilai dari proses extension. Pengujian yang dilakukan yaitu dengan membandingkan dua buah dokumen yang berupa abstrak jurnal berbahasa Indonesia dengan topik yang sama. Jumlah datanya yaitu 2 data suspicious (data uji) dan 30 data source (data latih). Hasilnya yaitu menghasilkan akurasi recall 77,32%, precission 65,68% dan f-measure 68,31%.
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | kesamaan dokumen, plagiarisme, deteksi, vector space model, clustering |
Subjects: | 000_COMPUTER SCIENCE, INFORMATION & GENERAL WORKS. > 004_Data Processing & Computer Science |
Divisions: | S1_SKRIPSI > FTIK_Teknik Informatika (01) |
Depositing User: | Mrs. Calis Maryani |
Date Deposited: | 09 Oct 2019 02:42 |
Last Modified: | 09 Oct 2019 02:42 |
URI: | http://elibrary.unikom.ac.id/id/eprint/1011 |
Actions (login required)
View Item |