Optimasi Naive Bayes Dengan Pemilihan Fitur Dan Pembobotan Gain Ratio

Socrates Adi guna, A. Akbar, Mohammad Sonhaji Akbar, A. Z. Arifin, Darlis Herumurti
{"title":"Optimasi Naive Bayes Dengan Pemilihan Fitur Dan Pembobotan Gain Ratio","authors":"Socrates Adi guna, A. Akbar, Mohammad Sonhaji Akbar, A. Z. Arifin, Darlis Herumurti","doi":"10.24843/LKJITI.2016.V07.I01.P03","DOIUrl":null,"url":null,"abstract":"Naive Bayes merupakan salah satu metode data mining yang umum digunakan dalam klasifikasi dokumen berbasis text. Kelebihan dari metode ini adalah algoritma yang sederhana dengan kompleksitas perhitungan yang rendah. Akan tetapi, pada metode Naive Bayes terdapat kelemahan dimana sifat independensi dari fitur Naive Bayes tidak dapat selalu diterapkan sehingga akan berpengaruh pada tingkat akurasi perhitungan. Maka dari itu, metode Naive Bayes perlu dioptimasi dengan cara pemberian bobot mengunakan Gain Ratio. Namun, pemberian bobot pada Naive Bayes menimbulkan permasalahan pada penghitungan probabilitas setiap dokumen, dimana fitur yang tidak merepresentasikan kelas yang diuji banyak muncul sehingga terjadi kesalahan klasifikasi. Oleh karena itu, pembobotan Naive Bayes masih belum optimal. Paper ini mengusulkan optimasi metode Naive Bayes mengunakan pembobotan Gain Ratio yang ditambahkan dengan metode pemilihan fitur pada kasus klasifikasi teks. Hasil penelitian ini menunjukkan bahwa optimasi metode Naive Bayes menggunakan pemilihan fitur dan pembobotan menghasilkan akurasi sebesar 94%.","PeriodicalId":31196,"journal":{"name":"Lontar Komputer","volume":"7 1","pages":"697-705"},"PeriodicalIF":0.0000,"publicationDate":"2016-04-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://sci-hub-pdf.com/10.24843/LKJITI.2016.V07.I01.P03","citationCount":"8","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Lontar Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24843/LKJITI.2016.V07.I01.P03","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 8

Abstract

Naive Bayes merupakan salah satu metode data mining yang umum digunakan dalam klasifikasi dokumen berbasis text. Kelebihan dari metode ini adalah algoritma yang sederhana dengan kompleksitas perhitungan yang rendah. Akan tetapi, pada metode Naive Bayes terdapat kelemahan dimana sifat independensi dari fitur Naive Bayes tidak dapat selalu diterapkan sehingga akan berpengaruh pada tingkat akurasi perhitungan. Maka dari itu, metode Naive Bayes perlu dioptimasi dengan cara pemberian bobot mengunakan Gain Ratio. Namun, pemberian bobot pada Naive Bayes menimbulkan permasalahan pada penghitungan probabilitas setiap dokumen, dimana fitur yang tidak merepresentasikan kelas yang diuji banyak muncul sehingga terjadi kesalahan klasifikasi. Oleh karena itu, pembobotan Naive Bayes masih belum optimal. Paper ini mengusulkan optimasi metode Naive Bayes mengunakan pembobotan Gain Ratio yang ditambahkan dengan metode pemilihan fitur pada kasus klasifikasi teks. Hasil penelitian ini menunjukkan bahwa optimasi metode Naive Bayes menggunakan pemilihan fitur dan pembobotan menghasilkan akurasi sebesar 94%.
天真的贝斯,选择特点和破坏
天真的贝斯是基于文本的文档分类中常用的数据挖掘方法之一。这种方法的优点是一个简单的计算复杂性低的算法。然而,在天真贝斯的方法中,有一个弱点,即天真贝斯的特征的独立性并不总是适用于计算准确度。因此,天真的贝斯方法需要在低重力作用下进行优化。然而,Naive Bayes的权重导致了对每一份文件的概率性计算的问题,在这些文件中,未受测试的类的特征出现了很多,导致了分类错误。因此,网络安全漏洞仍然是最不理想的。本文提出了一种优化方法Naive Bayes使用了在文本分类案件中选择特征的方法添加的改进方法。这项研究的结果表明,天真的贝斯方法的优化使用了特征和黑客的选择,可以产生94%的准确率。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
14
审稿时长
24 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信