Implementasi Algoritma Winnowing pada Aplikasi Pendeteksi Kemiripan Dokumen

Glen Hizkia Oge Mangundap, Herry Sujaini, H. Pratiwi
{"title":"Implementasi Algoritma Winnowing pada Aplikasi Pendeteksi Kemiripan Dokumen","authors":"Glen Hizkia Oge Mangundap, Herry Sujaini, H. Pratiwi","doi":"10.26418/jp.v8i1.47822","DOIUrl":null,"url":null,"abstract":"Beberapa syarat yang mahasiswa harus lakukan dalam menyelesaikan program sarjana (S1) salah satunya ialah membuat karya ilmiah dalam bentuk skripsi. Dalam penulisan skripsi, beberapa kasus penulisan skripsi mahasiswa memiliki topik judul yang sama. Dengan kesamaan topik pada judul yang dibuatoleh mahasiswa membuat kemungkinan isi skripsi yang dibuat menjadi mirip. Kemiripan tersebut tidak bisa dibilang sebagai bentuk plagiarisme. Oleh karena itu dibutuhkan aplikasi yang bisa mendeteksi kemiripan antara dokumen skripsi dengan dokumen skripsi lainya agar dapat mengetahui apakah kalimat yang mirip di dalam dokumen skripsi mengandung plagiarisme atau tidak. Algoritma Winnowing digunakan untuk meningkatkan efisiensi dari proses perbandingan dokumen serta menghasilkan nilai fingerprinting. Nilai fingerprinting kemudian dihitung dengan menggunakan Dice Distance dan Chebyshev Distance untuk mengetahui berapa persentase kemiripan antar dokumen skripsi.Aplikasi yang dibangun ini berhasil untuk mendeteksi kemiripan antara dokumen skripsi dengan menggunakan algoritma winnowing dan dapat beroperasi dengan baik. Hasil pengukuran Dice Distance adalah 23.87 % sedangkan dengan pengukuran Chebyshev Distance adalah 79, dan rata-rata waktu yang dihabiskan dalam memproses satu dokumen adalah 110.74 detik. Antara Dice Distance dan Chebyshev Distance jika dipaksa digabungkan akan mendapatkan hasil yang tidak sesuai dikarenakan perbedaan pengukuran nilai.","PeriodicalId":31793,"journal":{"name":"JEPIN Jurnal Edukasi dan Penelitian Informatika","volume":"26 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-04-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JEPIN Jurnal Edukasi dan Penelitian Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26418/jp.v8i1.47822","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Beberapa syarat yang mahasiswa harus lakukan dalam menyelesaikan program sarjana (S1) salah satunya ialah membuat karya ilmiah dalam bentuk skripsi. Dalam penulisan skripsi, beberapa kasus penulisan skripsi mahasiswa memiliki topik judul yang sama. Dengan kesamaan topik pada judul yang dibuatoleh mahasiswa membuat kemungkinan isi skripsi yang dibuat menjadi mirip. Kemiripan tersebut tidak bisa dibilang sebagai bentuk plagiarisme. Oleh karena itu dibutuhkan aplikasi yang bisa mendeteksi kemiripan antara dokumen skripsi dengan dokumen skripsi lainya agar dapat mengetahui apakah kalimat yang mirip di dalam dokumen skripsi mengandung plagiarisme atau tidak. Algoritma Winnowing digunakan untuk meningkatkan efisiensi dari proses perbandingan dokumen serta menghasilkan nilai fingerprinting. Nilai fingerprinting kemudian dihitung dengan menggunakan Dice Distance dan Chebyshev Distance untuk mengetahui berapa persentase kemiripan antar dokumen skripsi.Aplikasi yang dibangun ini berhasil untuk mendeteksi kemiripan antara dokumen skripsi dengan menggunakan algoritma winnowing dan dapat beroperasi dengan baik. Hasil pengukuran Dice Distance adalah 23.87 % sedangkan dengan pengukuran Chebyshev Distance adalah 79, dan rata-rata waktu yang dihabiskan dalam memproses satu dokumen adalah 110.74 detik. Antara Dice Distance dan Chebyshev Distance jika dipaksa digabungkan akan mendapatkan hasil yang tidak sesuai dikarenakan perbedaan pengukuran nilai.
Winnowing算法在文件匹配检测应用程序上的实现
学生在完成学士学位课程时必须具备的几个条件之一就是以论文的形式提出科学论文。在撰写论文时,一些学生的论文有相同的主题。与学生标题相同的主题使论文的内容可能接近。这种相似性不能说是剽窃。因此,需要一个应用程序来检测表单文件和其他条目文件之间的相似性,以便确定表单文件中的类似句是否含有剽窃。Winnowing算法被用来提高文档比较过程的效率,并产生指纹值。然后用骰子距离计算指纹值和Chebyshev距离计算论文表面相似的比例。创建的应用程序成功地检测了拼写文档与winnowing算法之间的相似性,并具有良好的操作能力。骰子距离测量结果为237.7%,Chebyshev距离测量为79,处理一份文件的平均时间为110.74秒。被迫将骰子距离与Chebyshev距离结合,将导致因价值测量差异而产生不适当的结果。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
1
审稿时长
10 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信