{"title":"阿里芬-塞蒂奥诺(Arifin-Setiono)和纳齐夫-阿德里安尼(Nazief-Adriani)词干处理算法在印尼语文本文档上的准确性和处理时间比较分析","authors":"Ardiles Sinaga, Sahat Pandapotan Nainggolan","doi":"10.46984/sebatik.v27i1.2072","DOIUrl":null,"url":null,"abstract":"Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.","PeriodicalId":493984,"journal":{"name":"Sebatik","volume":"32 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-06-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"ANALISIS PERBANDINGAN AKURASI DAN WAKTU PROSES ALGORITMA STEMMING ARIFIN-SETIONO DAN NAZIEF-ADRIANI PADA DOKUMEN TEKS BAHASA INDONESIA\",\"authors\":\"Ardiles Sinaga, Sahat Pandapotan Nainggolan\",\"doi\":\"10.46984/sebatik.v27i1.2072\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.\",\"PeriodicalId\":493984,\"journal\":{\"name\":\"Sebatik\",\"volume\":\"32 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-06-06\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Sebatik\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.46984/sebatik.v27i1.2072\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sebatik","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.46984/sebatik.v27i1.2072","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
ANALISIS PERBANDINGAN AKURASI DAN WAKTU PROSES ALGORITMA STEMMING ARIFIN-SETIONO DAN NAZIEF-ADRIANI PADA DOKUMEN TEKS BAHASA INDONESIA
Information Retrieval adalah suatu sistem untuk menemukan informasi yang dinginkan oleh seorang pengguna pada sekumpulan informasi yang dinginkannya berdasarkan data-data yang diinputkan oleh pengguna lain sebelumnya (query). Information Retrieval merupakan suatu sistem untuk melakukan pencarian, penyimpanan, dan juga pemeliharaan informasi. Salah satu tahapan penting yang terdapat di dalam suatu information retrieval adalah proses stemming. Stemming adalah suatu rangkaian tindakan untuk memperoleh kata dasar (root atau stem) dari masing-masing kata dengan mengeliminasi seluruh imbuhan (affixes) yang terdapat dalam kata tersebut baik itu berupa sisipan (suffixes), awalan (prefixes), serta kombinasi antara awalan dan akhiran (confixes) pada kata turunan. Setiap algoritma stemming mempunyai kelebihan dan kekurangan. Secara umum, untuk mengukur keefektifan dari sebuah algoritma stemming dapat didasarkan pada berbagai parameter yaitu keakuratan, kecepatan proses, dan juga kesalahan. Penelitian ini membandingkan dua algoritma stemming yaitu algoritma Nazief Adriani dan algoritma Arifin Setiono untuk mengukur performansi dari masing-masing algoritma dengan melakukan pengujian sebanyak 30 dokumen teks berbahasa Indonesia. Adapun hasil pengujian pada penelitian ini memperlihatkan bahwa perbandingan performansi algoritma Nazief Adriani lebih baik dari algoritma Arifin Setiono di mana nilai rata-rata akurasi tertinggi dimiliki oleh algoritma Nazief Adriani yakni sebesar 97.73% dengan rata-rata waktu proses stemming selama 20.17 detik. Sedangkan algoritma Arifin Setiono memiliki nilai rata-rata akurasi sebesar 94.37% dengan rata-rata waktu proses stemming selama 23.32 detik.