阿里芬-塞蒂奥诺（Arifin-Setiono）和纳齐夫-阿德里安尼（Nazief-Adriani）词干处理算法在印尼语文本文档上的准确性和处理时间比较分析

Sebatik Pub Date : 2023-06-06 DOI:10.46984/sebatik.v27i1.2072

Ardiles Sinaga, Sahat Pandapotan Nainggolan

{"title":"阿里芬-塞蒂奥诺（Arifin-Setiono）和纳齐夫-阿德里安尼（Nazief-Adriani）词干处理算法在印尼语文本文档上的准确性和处理时间比较分析","authors":"Ardiles Sinaga, Sahat Pandapotan Nainggolan","doi":"10.46984/sebatik.v27i1.2072","DOIUrl":null,"url":null,"abstract":"Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.","PeriodicalId":493984,"journal":{"name":"Sebatik","volume":"32 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-06-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"ANALISIS PERBANDINGAN AKURASI DAN WAKTU PROSES ALGORITMA STEMMING ARIFIN-SETIONO DAN NAZIEF-ADRIANI PADA DOKUMEN TEKS BAHASA INDONESIA\",\"authors\":\"Ardiles Sinaga, Sahat Pandapotan Nainggolan\",\"doi\":\"10.46984/sebatik.v27i1.2072\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.\",\"PeriodicalId\":493984,\"journal\":{\"name\":\"Sebatik\",\"volume\":\"32 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-06-06\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Sebatik\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.46984/sebatik.v27i1.2072\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sebatik","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.46984/sebatik.v27i1.2072","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

信息检索是一个寻找的信息系统冷却的一个用户群的信息要根据其他用户diinputkan以前的数据(查询)。信息检索系统是一种进行搜索、云存储,以及维修信息。一个重要阶段中一个资讯网检索是stemming过程。Stemming是一系列行动获得每个单词的词根(root或所谓stem)是整个地淘汰的前缀(affixes)一词中无论是插入(suffixes)、(prefixes前缀),以及结合前缀和后缀(confixes)一词的衍生品。每个stemming算法都有优点和缺点。一般来说,衡量一个算法的有效性stemming可以基于不同参数的准确性、速度,以及错误的过程。这些研究比较了两个stemming算法就是算法Nazief最肥和算法Arifin Setiono地测量确认每个算法的测试30印尼语的文本文件。至于这项研究的测试结果表明,比较确认Nazief算法算法的最肥更好Arifin Setiono准确度最高的平均绩点在哪里是由算法Nazief最肥stemming过程就是97万。73%的时间平均20 17秒。而算法Arifin Setiono成绩平均准确率高达94和平均37% stemming过程时间23。32秒。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

ANALISIS PERBANDINGAN AKURASI DAN WAKTU PROSES ALGORITMA STEMMING ARIFIN-SETIONO DAN NAZIEF-ADRIANI PADA DOKUMEN TEKS BAHASA INDONESIA

Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Sebatik

自引率

0.00%

发文量