Normalización en desempeño de k-means sobre datos climáticos

Juan Sebastián Ramírez Gómez, Néstor Darío Duque Méndez, Jorge Julián Vélez Upegui
{"title":"Normalización en desempeño de k-means sobre datos climáticos","authors":"Juan Sebastián Ramírez Gómez, Néstor Darío Duque Méndez, Jorge Julián Vélez Upegui","doi":"10.14483/2322939x.15550","DOIUrl":null,"url":null,"abstract":"El análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalización aplicada a un conjunto de datos con cuatro variables climatológicas (temperatura, precipitación, humedad relativa y radiación solar) para una estación ubicada en la ciudad de Manizales, Colombia. Esto con el fin de determinar el efecto de aplicar, o no, la normalización en la calidad de los clústeres y evaluar el costo computacional del algoritmo según las características establecidas. Para ello se definen seis escenarios de ejecución para 2, 3 y 5 clústeres con diferente cantidad y agrupación de variables utilizando distancia euclidiana como medida de alejamiento, Davies-Bouldin como método evaluación de calidad de los clústeres y la aplicación de normalización con Z-transformation y Range transformation. Se concluye que, a través de una comparación con k-medoides y aplicación STFT (Transformada de Fourier de Tiempo Reducido), la normalización mejora los resultados y con Z-transformation se obtienen los mejores desempeños de agrupamiento según el índice de Davis-Bouldin.","PeriodicalId":33457,"journal":{"name":"Revista Vinculos","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2019-06-12","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Vinculos","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.14483/2322939x.15550","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

El análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalización aplicada a un conjunto de datos con cuatro variables climatológicas (temperatura, precipitación, humedad relativa y radiación solar) para una estación ubicada en la ciudad de Manizales, Colombia. Esto con el fin de determinar el efecto de aplicar, o no, la normalización en la calidad de los clústeres y evaluar el costo computacional del algoritmo según las características establecidas. Para ello se definen seis escenarios de ejecución para 2, 3 y 5 clústeres con diferente cantidad y agrupación de variables utilizando distancia euclidiana como medida de alejamiento, Davies-Bouldin como método evaluación de calidad de los clústeres y la aplicación de normalización con Z-transformation y Range transformation. Se concluye que, a través de una comparación con k-medoides y aplicación STFT (Transformada de Fourier de Tiempo Reducido), la normalización mejora los resultados y con Z-transformation se obtienen los mejores desempeños de agrupamiento según el índice de Davis-Bouldin.
气候数据K-means性能的标准化
气候数据聚类分析用于各种研究,因为它可以为每种提出的方法获得有趣的结果。因此,本文介绍了K-means聚类算法的性能评估,该算法基于对哥伦比亚马尼萨雷斯市一个站点的一组具有四个气候变量(温度、降水、相对湿度和太阳辐射)的数据进行归一化。这是为了确定是否应用归一化对集群质量的影响,并根据所建立的特征评估算法的计算成本。为此,使用欧几里德距离作为距离测量,戴维斯-博尔丁作为聚类质量评估方法,并应用Z变换和距离变换进行归一化,为2、3和5个不同数量的集群定义了6个执行场景,并对变量进行了分组。得出的结论是,通过与K-Medoides和STFT(缩短时间傅立叶变换)应用的比较,归一化改善了结果,并根据Davis-Bouldin指数通过Z变换获得了最佳的聚类性能。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
审稿时长
7 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信