{"title":"Stemming Teks Bahasa Bali dengan Algoritma Enhanced Confix Stripping","authors":"N. Wardani, Putu Gede Surya Cipta Nugraha","doi":"10.23887/ijnse.v4i3.30309","DOIUrl":null,"url":null,"abstract":"Masih banyak yang mengalami permasalahan saat melakukan stemming dimana belum mampu melakukan stemming dengan tepat pada beberapa kata untuk aturan peluluhan prefix P3, P4, P5, P10, P11, dan P12. Tujuan penelitian ini adalah untuk mengkaji efektivitas algoritma Enhanced Confix Stripping Stemmer (ECS) terhadap stemming Bahasa Bali. Data yang digunakan dalam penelitian ini adalah 376 akar kata dalam bahasa Bali yang terdiri dari 240 kata yang mengandung prefiks, 17 akar kata yang mengandung infiks dan 199 akar kata yang mengandung sufix. Hasil penelitian ini menunjukkan bahwa Enhanced Confix Stripping dapat meningkatkan performansi yang sebelumnya memiliki akurasi. dari hanya 77,82% menjadi 96,94% dengan tingkat kesalahan 3,06% dan memperbaiki kesalahan yang semula berjumlah 120 sampai 20 kesalahan. Berdasarkan hasil penelitian, dapat ditarik simpulan bahwa algoritma ECS Stemmer dapat memperbaiki kesalahan yang dilakukan oleh metoda Rule Based Approach ","PeriodicalId":181108,"journal":{"name":"International Journal of Natural Science and Engineering","volume":"74 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2020-12-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"International Journal of Natural Science and Engineering","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.23887/ijnse.v4i3.30309","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Stemming Teks Bahasa Bali dengan Algoritma Enhanced Confix Stripping
Masih banyak yang mengalami permasalahan saat melakukan stemming dimana belum mampu melakukan stemming dengan tepat pada beberapa kata untuk aturan peluluhan prefix P3, P4, P5, P10, P11, dan P12. Tujuan penelitian ini adalah untuk mengkaji efektivitas algoritma Enhanced Confix Stripping Stemmer (ECS) terhadap stemming Bahasa Bali. Data yang digunakan dalam penelitian ini adalah 376 akar kata dalam bahasa Bali yang terdiri dari 240 kata yang mengandung prefiks, 17 akar kata yang mengandung infiks dan 199 akar kata yang mengandung sufix. Hasil penelitian ini menunjukkan bahwa Enhanced Confix Stripping dapat meningkatkan performansi yang sebelumnya memiliki akurasi. dari hanya 77,82% menjadi 96,94% dengan tingkat kesalahan 3,06% dan memperbaiki kesalahan yang semula berjumlah 120 sampai 20 kesalahan. Berdasarkan hasil penelitian, dapat ditarik simpulan bahwa algoritma ECS Stemmer dapat memperbaiki kesalahan yang dilakukan oleh metoda Rule Based Approach