{"title":"Técnicas de preprocesamiento de datos en modelos no supervisados aplicados al estudio genético de la raza Aberdeen Angus","authors":"O. Spositto,, G. Blanco, L. Matteo","doi":"10.54789/reddi.5.1.7","DOIUrl":null,"url":null,"abstract":"Es sabido que la construccion de un buen modelo de mineria de datos implica invertir la mayor parte del tiempo y esfuerzo en la fase de preprocesamiento de los datos de entrada. \nUno de los problemas centrales es identificar un conjunto representativo de caracteristicas adecuadas y de buena calidad para construir el modelo de un caso particular. \nEn este articulo se explican las tareas de preprocesamiento llevadas a cabo para mejorar el conjunto de datos utilizado en la construccion de modelos no supervisados, mediante los cuales se buscan las caracteristicas de los progenitores de terneros de la raza Aberdeen Angus con bajo peso al nacer. \nA su vez se detallan y comparan los resultados previos y posteriores a la aplicacion de estas tareas de preprocesamiento. \nDebido a que el mayor obstaculo que se presenta en muchos proyectos de ciencias de datos es precisamente la cantidad y calidad de los datos de entrada, mediante este articulo se motiva a poner enfasis en las etapas iniciales de comprension y preparacion de dicho conjunto, por sobre la premura de interpretacion y evaluacion de los resultados.","PeriodicalId":426591,"journal":{"name":"ReDDI: Revista Digital del Departamento de Ingeniería","volume":"26 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2020-08-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"ReDDI: Revista Digital del Departamento de Ingeniería","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.54789/reddi.5.1.7","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Es sabido que la construccion de un buen modelo de mineria de datos implica invertir la mayor parte del tiempo y esfuerzo en la fase de preprocesamiento de los datos de entrada.
Uno de los problemas centrales es identificar un conjunto representativo de caracteristicas adecuadas y de buena calidad para construir el modelo de un caso particular.
En este articulo se explican las tareas de preprocesamiento llevadas a cabo para mejorar el conjunto de datos utilizado en la construccion de modelos no supervisados, mediante los cuales se buscan las caracteristicas de los progenitores de terneros de la raza Aberdeen Angus con bajo peso al nacer.
A su vez se detallan y comparan los resultados previos y posteriores a la aplicacion de estas tareas de preprocesamiento.
Debido a que el mayor obstaculo que se presenta en muchos proyectos de ciencias de datos es precisamente la cantidad y calidad de los datos de entrada, mediante este articulo se motiva a poner enfasis en las etapas iniciales de comprension y preparacion de dicho conjunto, por sobre la premura de interpretacion y evaluacion de los resultados.