Mining Online Store Client Assessment Classification Rules with Genetic Algorithms

Anna Galinina, S. Parshutin
{"title":"Mining Online Store Client Assessment Classification Rules with Genetic Algorithms","authors":"Anna Galinina, S. Parshutin","doi":"10.2478/v10143-011-0044-z","DOIUrl":null,"url":null,"abstract":"Mining Online Store Client Assessment Classification Rules with Genetic Algorithms The paper presents the results of the research into algorithms that are not meant to mine classification rules, yet they contain all the necessary functions which allow us to use them for mining classification rules such as Genetic algorithm (GA). The main task of the research is associated with the application of GA to classification rule mining. A classic GA was modified to match the chosen classification task and was compared with other popular classification algorithms - JRip, J48 and Naive Bayes classifier. The paper describes the algorithm proposed and the application task as well as provides a comparative analysis of the obtained results with other algorithms. Klasifikācijas likumu ieguve ar genētiskajiem algoritmiem e-veikala klientu novērtēšanai Darba mērķis bija izpētīt genētiskā algoritma (ĢA) iespējas, lai piemērotu klasifikācijas likumu ieguvei no statistikas datiem. Ģenētiskais algoritms ir evolucionāras optimizācijas algoritms un var būt pielietots vairākās sfērās, taču klasifikācijas likumu ieguve nav klasiskais uzdevums genētiskā algoritma pielietošanai. Darbā izpētīts ĢA darbības princips un noteikts, ka genētiskajam algoritmam piemīt visas nepieciešamās īpašības klasifikācijas likumu ieguvei no datiem. Ģenētiskā algoritma efektivitātes praktiskajai novērtēšanai klasifikācijas likumu ieguves uzdevumā, tika modificēts ĢA pamata algoritms un piedāvāta metode indivīdu piemērotības novērtēšanai. Izstrādāta metode klasifikācijas likumu kopas veidošanai, izmantojot likumu kopu, kas atlasīta ar genētisko algoritmu. Piedāvātā metode aprobēta ar iepriekš sagatavotu datu kopu, kuru izsniedza starptautiskajā konkursā Data Mining Cup 2010. Pielietojot izvēlēto datu kopu, tika novērtēta arī efektivitāte šādiem klasifikācijas algoritmiem: J48, JRip un Naïve Baiyes. Rezultāti parādīja, ka genētiskā algoritma precizitāte atrodas vienā līmenī ar citu izmantoto klasifikācijas algoritmu precizitāti. Salīdzinot algoritmu efektivitāti arī pēc iegūto likumu skaita, var secināt, ka piedāvātais genētiskais algoritms ir efektīvāks pār citiem algoritmiem. Pēc iegūtajiem rezultātiem var secināt, ka piedāvātais modificētais genētiskais algoritms nav sliktāks par citiem izmantotajiem klasifikācijas algoritmiem un to var pielietot klasifikācijas likumu ieguvei no statistikas datiem. Par piedāvātā algoritma nepilnību var minēt to, ka tas spēj apstrādāt tikai kategoriskus atribūtus. Turpmāko pētījumu mērķis būs nepārtraukto atribūtu apstrādes iespējas pievienošana piedāvātajam genētiskajam algoritmam. Извлечение правил классификации с помощью генетических алгоритмов для оценки клиентов интернет магазина Целью работы являлось изучение возможностей генетического алгоритма (ГА) применительно к извлечению правил классификации из имеющихся статистических данных. ГА является эволюционным алгоритмом оптимизации различных решений, тем не менее, извлечение правил из данных не является классической задачей для применения генетического алгоритма. В рамках проведённых исследований был изучен принцип действия ГА и установлено, что генетический алгоритм обладает всеми свойствами, необходимыми для извлечения правил из данных. С целью практической оценки ГА в рамках решения упомянутой задачи был модифицирован основной алгоритм действия ГА и предложен метод оценки пригодности индивидов. Также разработан алгоритм формирования конечного множества правил на основе отобранных генетическим алгоритмом. Предложенный метод был опробован на предварительно подготовленном множестве данных, использованном на международном конкурсе Data Mining Cup 2010. Также на выбранном множестве данных была оценена эффективность таких алгоритмов классификации, как J48, JRip и Nave Bayes. Результаты показали, что по точности классификации ГА находится на одном уровне с остальными классификаторами. Сравнивая эффективность по числу сформированных правил, ГА также оказался более эффективен, нежели остальные алгоритмы. Имея данные результаты, можно заключить, что предложенный модифицированный генетический алгоритм не хуже остальных использованных алгоритмов и может быть использован для извлечения правил классификации из данных. Недостатком предложенного алгоритма является то, что он способен обрабатывать только категорийные атрибуты. Целью дальнейших исследований станет устранение данного недостатка.","PeriodicalId":211660,"journal":{"name":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","volume":"1 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.2478/v10143-011-0044-z","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1

Abstract

Mining Online Store Client Assessment Classification Rules with Genetic Algorithms The paper presents the results of the research into algorithms that are not meant to mine classification rules, yet they contain all the necessary functions which allow us to use them for mining classification rules such as Genetic algorithm (GA). The main task of the research is associated with the application of GA to classification rule mining. A classic GA was modified to match the chosen classification task and was compared with other popular classification algorithms - JRip, J48 and Naive Bayes classifier. The paper describes the algorithm proposed and the application task as well as provides a comparative analysis of the obtained results with other algorithms. Klasifikācijas likumu ieguve ar genētiskajiem algoritmiem e-veikala klientu novērtēšanai Darba mērķis bija izpētīt genētiskā algoritma (ĢA) iespējas, lai piemērotu klasifikācijas likumu ieguvei no statistikas datiem. Ģenētiskais algoritms ir evolucionāras optimizācijas algoritms un var būt pielietots vairākās sfērās, taču klasifikācijas likumu ieguve nav klasiskais uzdevums genētiskā algoritma pielietošanai. Darbā izpētīts ĢA darbības princips un noteikts, ka genētiskajam algoritmam piemīt visas nepieciešamās īpašības klasifikācijas likumu ieguvei no datiem. Ģenētiskā algoritma efektivitātes praktiskajai novērtēšanai klasifikācijas likumu ieguves uzdevumā, tika modificēts ĢA pamata algoritms un piedāvāta metode indivīdu piemērotības novērtēšanai. Izstrādāta metode klasifikācijas likumu kopas veidošanai, izmantojot likumu kopu, kas atlasīta ar genētisko algoritmu. Piedāvātā metode aprobēta ar iepriekš sagatavotu datu kopu, kuru izsniedza starptautiskajā konkursā Data Mining Cup 2010. Pielietojot izvēlēto datu kopu, tika novērtēta arī efektivitāte šādiem klasifikācijas algoritmiem: J48, JRip un Naïve Baiyes. Rezultāti parādīja, ka genētiskā algoritma precizitāte atrodas vienā līmenī ar citu izmantoto klasifikācijas algoritmu precizitāti. Salīdzinot algoritmu efektivitāti arī pēc iegūto likumu skaita, var secināt, ka piedāvātais genētiskais algoritms ir efektīvāks pār citiem algoritmiem. Pēc iegūtajiem rezultātiem var secināt, ka piedāvātais modificētais genētiskais algoritms nav sliktāks par citiem izmantotajiem klasifikācijas algoritmiem un to var pielietot klasifikācijas likumu ieguvei no statistikas datiem. Par piedāvātā algoritma nepilnību var minēt to, ka tas spēj apstrādāt tikai kategoriskus atribūtus. Turpmāko pētījumu mērķis būs nepārtraukto atribūtu apstrādes iespējas pievienošana piedāvātajam genētiskajam algoritmam. Извлечение правил классификации с помощью генетических алгоритмов для оценки клиентов интернет магазина Целью работы являлось изучение возможностей генетического алгоритма (ГА) применительно к извлечению правил классификации из имеющихся статистических данных. ГА является эволюционным алгоритмом оптимизации различных решений, тем не менее, извлечение правил из данных не является классической задачей для применения генетического алгоритма. В рамках проведённых исследований был изучен принцип действия ГА и установлено, что генетический алгоритм обладает всеми свойствами, необходимыми для извлечения правил из данных. С целью практической оценки ГА в рамках решения упомянутой задачи был модифицирован основной алгоритм действия ГА и предложен метод оценки пригодности индивидов. Также разработан алгоритм формирования конечного множества правил на основе отобранных генетическим алгоритмом. Предложенный метод был опробован на предварительно подготовленном множестве данных, использованном на международном конкурсе Data Mining Cup 2010. Также на выбранном множестве данных была оценена эффективность таких алгоритмов классификации, как J48, JRip и Nave Bayes. Результаты показали, что по точности классификации ГА находится на одном уровне с остальными классификаторами. Сравнивая эффективность по числу сформированных правил, ГА также оказался более эффективен, нежели остальные алгоритмы. Имея данные результаты, можно заключить, что предложенный модифицированный генетический алгоритм не хуже остальных использованных алгоритмов и может быть использован для извлечения правил классификации из данных. Недостатком предложенного алгоритма является то, что он способен обрабатывать только категорийные атрибуты. Целью дальнейших исследований станет устранение данного недостатка.
基于遗传算法的在线商店客户评估分类规则挖掘
利用遗传算法挖掘在线商店客户评估分类规则本文介绍了一些算法的研究结果,这些算法不是用来挖掘分类规则的,但它们包含了所有必要的功能,允许我们使用它们来挖掘分类规则,如遗传算法(GA)。本研究的主要任务是将遗传算法应用于分类规则挖掘。对经典遗传算法进行了修改以匹配所选的分类任务,并与其他流行的分类算法JRip、J48和朴素贝叶斯分类器进行了比较。本文介绍了所提出的算法和应用任务,并与其他算法的结果进行了比较分析。Klasifikācijas likumu ieguvear genētiskajiem算法e-veikala klientu novērtēšanai Darba mērķis bija izpētīt genētiskā算法(ĢA) iespējas, lai piemērotu klasifikācijas likumu ieguvei没有统计数据。Ģenētiskais算法ir evolucionāras optimizācijas算法UN var būt pielietots vairākās sfērās, ta u klasifikācijas likumu ieguve nav klasiskais uzdevums genētiskā算法pielietošanai。darb_ izpētīts ĢA darb_有原理和注意事项,ka genētiskajam算法piem_ . t签证nepieciešamās īpašības klasifikācijas likumu ieguvei no datatiem。Ģenētiskā算法efektivitātes praktiskajai novērtēšanai klasifikācijas likumu ieguves uzdevumha, tika modificēts ĢA pamata算法un piedāvāta metode individual du piemērotības novērtēšanai。Izstrādāta metode klasifikācijas likumu kopas veidošanai, izmantojot likumu kopu, kas atlask . ta ar genētisko算法。Piedāvātā mede aprobēta ar iepriekska sagatavotu datu kopu, kuru izsniedza starptautiskajaikonkurska数据挖掘杯2010。Pielietojot izvēlēto datu kopu, tika novērtēta ar + efektivitāte šādiem klasifikācijas算法:J48, JRip un Naïve Baiyes。Rezultāti parādīja, ka genētiskā algoritma precizitāte atrodas vieni ā l ā meni ā ar citu izmantoto klasifikācijas algoritmu precizitāti。salsaldzinot算法efektivitāti arir pēc iegūto likumu skaita, var secināt, ka piedāvātais genētiskais算法ir efektīvāks pār citiem算法。Pēc iegūtajiem rezultātiem var secināt, ka piedāvātais modificētais genētiskais算法nav sliktāks par citiem izmantotajem klasifikācijas算法unto var pielietot klasifikācijas likumu ieguvei no statistickas data。Par piedāvātā算法nepilnnt = = minēt to, ka tas spēj apstrādāt tikai categororiskus atribūtus。Turpmāko pētījumu mērķis būs nepārtraukto atribūtu apstrādes iespējas pievienošana piedāvātajam genētiskajam算法。ИзвлечениеправилклассификацииспомощьюгенетическихалгоритмовдляоценкиклиентовинтернетмагазинаЦельюработыявлялосьизучениевозможностейгенетическогоалгоритма(ГА)применительнокизвлечениюправилклассификацииизимеющихсястатистическихданных。ГАявляетсяэволюционнымалгоритмомоптимизацииразличныхрешений,темнеменее,извлечениеправилизданныхнеявляетсяклассическойзадачейдляприменениягенетическогоалгоритма。ВрамкахпроведённыхисследованийбылизученпринципдействияГАиустановлено,чтогенетическийалгоритмобладаетвсемисвойствами,необходимымидляизвлеченияправилизданных。СцельюпрактическойоценкиГАврамкахрешенияупомянутойзадачибылмодифицированосновнойалгоритмдействияГАипредложенметодоценкипригодностииндивидов。Такжеразработаналгоритмформированияконечногомножестваправилнаосновеотобранныхгенетическималгоритмом。Предложенныйметодбылопробованнапредварительноподготовленноммножестведанных,использованномнамеждународномконкурсе数据挖掘2010杯。Такженавыбранноммножестведанныхбылаоцененаэффективностьтакихалгоритмовклассификаци,икакJ48, JRipи殿贝叶斯。Результатыпоказали,чтопоточностиклассификацииГАнаходитсянаодномуровнесостальнымиклассификаторами。Сравниваяэффективностьпочислусформированныхправил,ГАтакжеоказалсяболееэффективен,нежелиостальныеалгоритмы。Имеяданныерезультаты,можнозаключить,чтопредложенныймодифицированныйгенетическийалгоритмнехужеостальныхиспользованныхалгоритмовиможетбытьиспользовандляизвлеченияправилклассификацииизданных。Недостаткомпредложенногоалгоритмаявляетсято,чтоонспособенобрабатыватьтолькокатегорийныеатрибуты。Цельюдальнейшихисследованийстанетустранениеданногонедостатка。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信