阿里芬-塞蒂奥诺(Arifin-Setiono)和纳齐夫-阿德里安尼(Nazief-Adriani)词干处理算法在印尼语文本文档上的准确性和处理时间比较分析

Ardiles Sinaga, Sahat Pandapotan Nainggolan
{"title":"阿里芬-塞蒂奥诺(Arifin-Setiono)和纳齐夫-阿德里安尼(Nazief-Adriani)词干处理算法在印尼语文本文档上的准确性和处理时间比较分析","authors":"Ardiles Sinaga, Sahat Pandapotan Nainggolan","doi":"10.46984/sebatik.v27i1.2072","DOIUrl":null,"url":null,"abstract":"Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.","PeriodicalId":493984,"journal":{"name":"Sebatik","volume":"32 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-06-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"ANALISIS PERBANDINGAN AKURASI DAN WAKTU PROSES ALGORITMA STEMMING ARIFIN-SETIONO DAN NAZIEF-ADRIANI PADA DOKUMEN TEKS BAHASA INDONESIA\",\"authors\":\"Ardiles Sinaga, Sahat Pandapotan Nainggolan\",\"doi\":\"10.46984/sebatik.v27i1.2072\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.\",\"PeriodicalId\":493984,\"journal\":{\"name\":\"Sebatik\",\"volume\":\"32 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-06-06\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Sebatik\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.46984/sebatik.v27i1.2072\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sebatik","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.46984/sebatik.v27i1.2072","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

信息检索是一个寻找的信息系统冷却的一个用户群的信息要根据其他用户diinputkan以前的数据(查询)。信息检索系统是一种进行搜索、云存储,以及维修信息。一个重要阶段中一个资讯网检索是stemming过程。Stemming是一系列行动获得每个单词的词根(root或所谓stem)是整个地淘汰的前缀(affixes)一词中无论是插入(suffixes)、(prefixes前缀),以及结合前缀和后缀(confixes)一词的衍生品。每个stemming算法都有优点和缺点。一般来说,衡量一个算法的有效性stemming可以基于不同参数的准确性、速度,以及错误的过程。这些研究比较了两个stemming算法就是算法Nazief最肥和算法Arifin Setiono地测量确认每个算法的测试30印尼语的文本文件。至于这项研究的测试结果表明,比较确认Nazief算法算法的最肥更好Arifin Setiono准确度最高的平均绩点在哪里是由算法Nazief最肥stemming过程就是97万。73%的时间平均20 17秒。而算法Arifin Setiono成绩平均准确率高达94和平均37% stemming过程时间23。32秒。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
ANALISIS PERBANDINGAN AKURASI DAN WAKTU PROSES ALGORITMA STEMMING ARIFIN-SETIONO DAN NAZIEF-ADRIANI PADA DOKUMEN TEKS BAHASA INDONESIA
Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信