Penggunaan Metode K-Means dan K-Means++ Sebagai Clustering Data Covid-19 di Pulau Jawa

Teknika Pub Date : 2022-10-20 DOI:10.34148/teknika.v11i3.502
N. nugroho, Faisal Dharma Adhinata
{"title":"Penggunaan Metode K-Means dan K-Means++ Sebagai Clustering Data Covid-19 di Pulau Jawa","authors":"N. nugroho, Faisal Dharma Adhinata","doi":"10.34148/teknika.v11i3.502","DOIUrl":null,"url":null,"abstract":"Virus Corona (Covid-19) merupakan penyakit menular yang dapat ditularkan antara hewan dan manusia. Pada akhir Desember 2019, virus itu teridentifikasi di Provinsi Wuhan, Cina. Saat ini, seluruh dunia sedang berjuang, mencegah, dan akhirnya menaklukkan penyebaran virus corona. Penelitian ini bertujuan untuk mengklaster data penyebaran Covid-19 di setiap kabupaten di Pulau Jawa sehingga menghasilkan klaster zona yang harus dilaksanakan PPKM berdasarkan kasus positif, vaksin dosis pertama, dan dosis kedua. vaksin. Metode K-Means digunakan dengan cara menentukan jumlah cluster (K), mengatur pusat cluster secara arbitrer, mengelompokkan data ke dalam cluster dengan jarak terpendek, menghitung pusat cluster, dan mengulangi langkah 2-4 sampai tidak ada data yang berpindah ke lokasi yang berbeda. gugus. K-Means++ digunakan dengan cara memilih secara acak nilai k pertama dari pusat cluster pertama titik data, mengelompokkan data berdasarkan jarak minimum ke centroid, memperbarui nilai titik centroid dengan menentukan rata-rata setiap cluster, dan ulangi langkah 2 dan 3 sampai tidak ada yang bergerak. Berdasarkan jumlah kasus positif, sembuh, dan meninggal, kasus tersebut dikategorikan. Setelah dilakukan pengelompokan dan mendapatkan klaster pada masing-masing kelompok, setiap klaster akan dievaluasi kualitasnya menggunakan koefisien siluet untuk memilih yang terbaik. Hasil kajian tersebut diharapkan dapat mengungkap sejauh mana penyebaran virus Covid-19 di setiap kabupaten/kota di Pulau Jawa, serta cluster dengan skor Silhouette Coefficient tertinggi. Untuk hasil pengujian menggunakan Silhouette Coefficient, metode K-Means K=3 menghasilkan 0,825, K=4 menghasilkan 0,873, dan K=5 menghasilkan 0,862; untuk metode K-Means++, k=3 menghasilkan 0,822, K=4 menghasilkan 0,865, dan K = 5 menghasilkan 0,882. Hasil penelitian menunjukkan bahwa K-Means++ lebih unggul dalam memberikan informasi sejauh mana penyebaran virus Covid-19, dan uji Silhouette Coefficient digunakan untuk menentukan kualitas cluster yang optimal.","PeriodicalId":52620,"journal":{"name":"Teknika","volume":"2 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-10-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Teknika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34148/teknika.v11i3.502","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1

Abstract

Virus Corona (Covid-19) merupakan penyakit menular yang dapat ditularkan antara hewan dan manusia. Pada akhir Desember 2019, virus itu teridentifikasi di Provinsi Wuhan, Cina. Saat ini, seluruh dunia sedang berjuang, mencegah, dan akhirnya menaklukkan penyebaran virus corona. Penelitian ini bertujuan untuk mengklaster data penyebaran Covid-19 di setiap kabupaten di Pulau Jawa sehingga menghasilkan klaster zona yang harus dilaksanakan PPKM berdasarkan kasus positif, vaksin dosis pertama, dan dosis kedua. vaksin. Metode K-Means digunakan dengan cara menentukan jumlah cluster (K), mengatur pusat cluster secara arbitrer, mengelompokkan data ke dalam cluster dengan jarak terpendek, menghitung pusat cluster, dan mengulangi langkah 2-4 sampai tidak ada data yang berpindah ke lokasi yang berbeda. gugus. K-Means++ digunakan dengan cara memilih secara acak nilai k pertama dari pusat cluster pertama titik data, mengelompokkan data berdasarkan jarak minimum ke centroid, memperbarui nilai titik centroid dengan menentukan rata-rata setiap cluster, dan ulangi langkah 2 dan 3 sampai tidak ada yang bergerak. Berdasarkan jumlah kasus positif, sembuh, dan meninggal, kasus tersebut dikategorikan. Setelah dilakukan pengelompokan dan mendapatkan klaster pada masing-masing kelompok, setiap klaster akan dievaluasi kualitasnya menggunakan koefisien siluet untuk memilih yang terbaik. Hasil kajian tersebut diharapkan dapat mengungkap sejauh mana penyebaran virus Covid-19 di setiap kabupaten/kota di Pulau Jawa, serta cluster dengan skor Silhouette Coefficient tertinggi. Untuk hasil pengujian menggunakan Silhouette Coefficient, metode K-Means K=3 menghasilkan 0,825, K=4 menghasilkan 0,873, dan K=5 menghasilkan 0,862; untuk metode K-Means++, k=3 menghasilkan 0,822, K=4 menghasilkan 0,865, dan K = 5 menghasilkan 0,882. Hasil penelitian menunjukkan bahwa K-Means++ lebih unggul dalam memberikan informasi sejauh mana penyebaran virus Covid-19, dan uji Silhouette Coefficient digunakan untuk menentukan kualitas cluster yang optimal.
科罗娜病毒(Covid-19)是一种可以在动物和人类之间传播的传染病。2019年12月底,这种病毒在中国武汉省被发现。今天,全世界都在为控制、预防和最终战胜科罗娜病毒的传播而斗争。这项研究的目的是将Covid-19分散在爪哇岛的每个地区,从而建立一个区域集群,根据第一次剂量的疫苗和第二次剂量的阳性病例、疫苗和第二次剂量的病例进行PPKM执行。疫苗。K-手段是通过确定星系团的数量(K),在仲裁中管理星系团中心,将数据以最短的距离将其分组成集群,计算星系团的中心,重复第2-4步,直到没有数据移动到不同的位置。星团。k -均值+是通过随机选择第一个数据点星系团中心的第一个k值,将最小距离对中央星系团进行分组,通过确定每个星系团的平均值来更新中心数值,重复步骤2和3,直到没有人动为止。根据阳性、愈合和死亡病例的数量,这些病例是分类的。一旦对每个组进行分组并获得集群后,每个集群将对其质量的估值进行评估,其质量将利用剪影系数来选择最好的。这项研究预计将确定在爪哇岛每个地区/城市传播Covid-19病毒的程度,以及摄合历史上最高的剪发和解分数的集群。用摄取椰子酸盐的测试结果,K的手段是3得到825,K得到4得到873,K得到5得到862;对于k -要约+,k=3得到0,822,k= 4得到0,865,k= 5得到0,882。研究结果表明,k -忽略+在提供Covid-19病毒传播范围内的信息方面处于领先地位,而山后咖啡摄入量测试可以用来确定最佳集群的质量。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
22
审稿时长
6 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信