{"title":"Naive Bayes分类器与支持向量机在文章标题分类中的比较","authors":"Muhammad Rifqi Maarif","doi":"10.14421/jiska.2016.12-05","DOIUrl":null,"url":null,"abstract":"Support Vector Machine (SVM) dan Naïve Bayes Classifier (NBC) merupakan dua algoritma yang sangat polpuler untuk text mining, khususnya untuk klasifikasi teks. Pada penelitian-penelitian sebelumnya SVM cenerung menghasilkan performa yang lebih baik dari NBC pada segi akurasi hasil klasifikasi. Salah satu hal yang menarik dari penelitian-penelitian sebelumnya adalah penggunaan jenis data yang hamper sama antara satu dengan lainnya. Penelitian-penelitian sebelumnya kebanyakan menggunakan data tweet dari situs Twitter. Data tweet merupakan jenis teks yang informal dengan banyak sekali noise dan tidak mengindahkan aturan tata bahasa. Pada penelitian kali ini, akan algoritma SVM dan NBC akan diujicobakan kedalam data teks yang lebih formal, yakni data dari judul-judul artikel. Dalam percobaan yang sudah dilakukan, didapatkan hasil yang berbeda dengan penelitian sebelumnya. Pada klasifikasi teks judul artikel NBC memiliki performa akurasi yang lebih baik jika dibandingkan dengan SVM.","PeriodicalId":34216,"journal":{"name":"JISKA Jurnal Informatika Sunan Kalijaga","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2016-11-07","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Perbandingan Naïve Bayes Classifier dan Support Vector Machine untuk Klasifikasi Judul Artikel\",\"authors\":\"Muhammad Rifqi Maarif\",\"doi\":\"10.14421/jiska.2016.12-05\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Support Vector Machine (SVM) dan Naïve Bayes Classifier (NBC) merupakan dua algoritma yang sangat polpuler untuk text mining, khususnya untuk klasifikasi teks. Pada penelitian-penelitian sebelumnya SVM cenerung menghasilkan performa yang lebih baik dari NBC pada segi akurasi hasil klasifikasi. Salah satu hal yang menarik dari penelitian-penelitian sebelumnya adalah penggunaan jenis data yang hamper sama antara satu dengan lainnya. Penelitian-penelitian sebelumnya kebanyakan menggunakan data tweet dari situs Twitter. Data tweet merupakan jenis teks yang informal dengan banyak sekali noise dan tidak mengindahkan aturan tata bahasa. Pada penelitian kali ini, akan algoritma SVM dan NBC akan diujicobakan kedalam data teks yang lebih formal, yakni data dari judul-judul artikel. Dalam percobaan yang sudah dilakukan, didapatkan hasil yang berbeda dengan penelitian sebelumnya. Pada klasifikasi teks judul artikel NBC memiliki performa akurasi yang lebih baik jika dibandingkan dengan SVM.\",\"PeriodicalId\":34216,\"journal\":{\"name\":\"JISKA Jurnal Informatika Sunan Kalijaga\",\"volume\":\"1 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2016-11-07\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"JISKA Jurnal Informatika Sunan Kalijaga\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.14421/jiska.2016.12-05\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"JISKA Jurnal Informatika Sunan Kalijaga","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.14421/jiska.2016.12-05","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Perbandingan Naïve Bayes Classifier dan Support Vector Machine untuk Klasifikasi Judul Artikel
Support Vector Machine (SVM) dan Naïve Bayes Classifier (NBC) merupakan dua algoritma yang sangat polpuler untuk text mining, khususnya untuk klasifikasi teks. Pada penelitian-penelitian sebelumnya SVM cenerung menghasilkan performa yang lebih baik dari NBC pada segi akurasi hasil klasifikasi. Salah satu hal yang menarik dari penelitian-penelitian sebelumnya adalah penggunaan jenis data yang hamper sama antara satu dengan lainnya. Penelitian-penelitian sebelumnya kebanyakan menggunakan data tweet dari situs Twitter. Data tweet merupakan jenis teks yang informal dengan banyak sekali noise dan tidak mengindahkan aturan tata bahasa. Pada penelitian kali ini, akan algoritma SVM dan NBC akan diujicobakan kedalam data teks yang lebih formal, yakni data dari judul-judul artikel. Dalam percobaan yang sudah dilakukan, didapatkan hasil yang berbeda dengan penelitian sebelumnya. Pada klasifikasi teks judul artikel NBC memiliki performa akurasi yang lebih baik jika dibandingkan dengan SVM.