Vector Space Model Dan Clustering Untuk Deteksi Kesamaan Dokumen Berbahasa Indonesia

Riadi, Viky Zulpikar (2019) Vector Space Model Dan Clustering Untuk Deteksi Kesamaan Dokumen Berbahasa Indonesia. Other thesis, Universitas Komputer Indonesia.

[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_COVER.pdf - Published Version

Download (32kB) | Preview
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_LEMBAR PENGESAHAN.pdf - Published Version

Download (197kB) | Preview
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_SURAT KETERANGAN PUBLIKASI.pdf - Published Version

Download (159kB) | Preview
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_SURAT KETERANGAN ORISINALITAS.pdf - Published Version

Download (186kB) | Preview
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_KATA PENGANTAR.pdf - Published Version

Download (79kB) | Preview
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_DAFTAR ISI.pdf - Published Version

Download (110kB) | Preview
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 1.pdf - Published Version

Download (193kB) | Preview
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 2.pdf - Published Version

Download (330kB) | Preview
[img] Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 3.pdf - Published Version
Restricted to Repository staff only

Download (1MB) | Request a copy
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 4.pdf - Published Version

Download (517kB) | Preview
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_BAB 5.pdf - Published Version

Download (8kB) | Preview
[img]
Preview
Text
UNIKOM_VIKY ZULPIKAR RIADI_DAFTAR PUSTAKA.pdf - Published Version

Download (165kB) | Preview
Official URL: http://elibrary.unikom.ac.id

Abstract

Salah satu cara untuk mendeteksi plagiarisme adalah dengan mendeteksi kesamaan dokumen. Kesulitan dalam mendeteksi kesamaan dokumen adalah kesamaan dengan mengubah kalimat orang lain ke dalam susunan kalimat sendiri tanpa mengubah idenya (obfuscation). Untuk itulah diperlukan sebuah sistem untuk mendeteksi kesamaan dokumen yang tidak hanya mendeteksi kesamaan berupa exact copy tetapi juga berupa kesamaan obfuscation. Metode yang dipakai pada penelitian ini adalah Vector Space Model dan Clustering. Terdapat 4 tahapan dalam prosesnya yaitu pertama preprocessing yang terdiri dari tokenisasi kalimat, case folding, tokenisasi kata, filter kata, stemming, filter kalimat, TF-IDF. Kedua seeding yaitu membandingkan setiap kalimat pada dokumen uji dan latih dengan menggunakan Cosine Similarity dan Dice Coefficient. Ketiga extension yaitu mengkluster nilai-nilai dari proses seeding yang berupa pasangan kalimat sama kemudian nilai hasil kluster di validasi menggunakan Cosine Similarity. Keempat filtering yaitu menyeleksi nilai dari proses extension. Pengujian yang dilakukan yaitu dengan membandingkan dua buah dokumen yang berupa abstrak jurnal berbahasa Indonesia dengan topik yang sama. Jumlah datanya yaitu 2 data suspicious (data uji) dan 30 data source (data latih). Hasilnya yaitu menghasilkan akurasi recall 77,32%, precission 65,68% dan f-measure 68,31%.

Item Type: Thesis (Other)
Uncontrolled Keywords: kesamaan dokumen, plagiarisme, deteksi, vector space model, clustering
Subjects: 000_COMPUTER SCIENCE, INFORMATION & GENERAL WORKS. > 004_Data Processing & Computer Science
Divisions: S1_SKRIPSI > FTIK_Teknik Informatika (01)
Depositing User: Mrs. Calis Maryani
Date Deposited: 09 Oct 2019 02:42
Last Modified: 09 Oct 2019 02:42
URI: http://elibrary.unikom.ac.id/id/eprint/1011

Actions (login required)

View Item View Item