{"title":"Makine Öğrenmesi Algoritmaları ile Türkçe için İstenmeyen SMS Filtreleme","authors":"Bekir Parlak","doi":"10.33793/acperpro.05.03.17783","DOIUrl":null,"url":null,"abstract":"Bu çalışmada, Türkçe dilindeki kısa mesaj hizmeti (SMS=Short Message Service) istenmeyen mesajlarının filtrelenmesinde çeşitli öznitelik seçme yaklaşımlarının ve ön-işleme tekniğinin etkisi araştırıldı. Filtreleme aşamasında tüm öznitelik kümesi, kelime çantası (BoW = Bag of Words) modeliyle açığa çıkarılan özniteliklerden oluşturuldu. Kelime çantasındaki ayırt edici öznitelikler, öznitelik seçim yöntemleri kullanılarak belirlenir. Daha sonra SMS mesajlarını sınıflandırmak için yaygın olarak kullanılan sınıflandırma algoritmalarıyla beslenir. Filtreleme çerçevesi sadece Türkçe SMS veri kümesi üzerinde değerlendirildi. İlgili veri kümeleri üzerinde kapsamlı deneysel analiz, Multinomial Naïve Bayes(MNB) sınıflandırıcı ile EFS(Extensive Feature Selector) öznitelik seçim metotlarının kombinasyonlarının daha iyi sınıflandırma performansı sağladığını ortaya çıkardı. Kullanılan öznitelik seçim yöntemlerinin etkinliği, her sınıflandırıcıda biraz farklılık göstermektedir.","PeriodicalId":207070,"journal":{"name":"Academic Perspective Procedia","volume":"120 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-11-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Academic Perspective Procedia","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.33793/acperpro.05.03.17783","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Bu çalışmada, Türkçe dilindeki kısa mesaj hizmeti (SMS=Short Message Service) istenmeyen mesajlarının filtrelenmesinde çeşitli öznitelik seçme yaklaşımlarının ve ön-işleme tekniğinin etkisi araştırıldı. Filtreleme aşamasında tüm öznitelik kümesi, kelime çantası (BoW = Bag of Words) modeliyle açığa çıkarılan özniteliklerden oluşturuldu. Kelime çantasındaki ayırt edici öznitelikler, öznitelik seçim yöntemleri kullanılarak belirlenir. Daha sonra SMS mesajlarını sınıflandırmak için yaygın olarak kullanılan sınıflandırma algoritmalarıyla beslenir. Filtreleme çerçevesi sadece Türkçe SMS veri kümesi üzerinde değerlendirildi. İlgili veri kümeleri üzerinde kapsamlı deneysel analiz, Multinomial Naïve Bayes(MNB) sınıflandırıcı ile EFS(Extensive Feature Selector) öznitelik seçim metotlarının kombinasyonlarının daha iyi sınıflandırma performansı sağladığını ortaya çıkardı. Kullanılan öznitelik seçim yöntemlerinin etkinliği, her sınıflandırıcıda biraz farklılık göstermektedir.