Identificación y análisis de patrones que permitan generar propuestas en el procesamiento de grandes volúmenes de datos de E/S en un sistema de almacenamiento paralelo

Yeison Angulo
{"title":"Identificación y análisis de patrones que permitan generar propuestas en el procesamiento de grandes volúmenes de datos de E/S en un sistema de almacenamiento paralelo","authors":"Yeison Angulo","doi":"10.15765/wpmis.v4i1.1243","DOIUrl":null,"url":null,"abstract":"Año tras año, la implementación de sistemas HPC incrementa a pasos agigantados (Ferreira, Riesen, Bridges, Arnold, & Brightwell, 2014) y son utilizados en la construcción de Data Centers, instituciones científicas, e incluso, para propósito general. Las organizaciones que sostienen estos sistemas HPC normalmente recurren al uso de sockets para controlar el flujo de los datos que deben tratar (Ferreira, Riesen, Bridges, Arnold, & Brightwell, 2014). Sin embargo, el uso de esta tecnología presenta un gran reto: evitar que los sistemas de lectura/escritura se vean superados por la cantidad de datos que deben pasar a través de ellos, ya que una vez aglomerados, estos datos sin tratar pueden traducirse en retrasos para los distintos procedimientos que las organizaciones necesiten hacer. Es decir, las organizaciones deben evitar los cuellos de botella. Entre las estrategias para superar este problema está el diseño e implementación de sistemas de archivos en busca de organizar los datos que deban ser accedidos y modificados de forma paralela por cada uno de los sockets donde se están ejecutando distintas tareas. Existe una relación directa entre la cantidad de sockets y la complejidad de la operación (Yonggang, Jing, & Renato, 2015). Esto es: el aumento del número de servidores (núcleos de procesamiento) que finalmente influirá en el desempeño del sistema. Sin embargo, otros tipos de cuellos de botella pueden presentarse en la red, causados, entre otros, por el alto tráfico de datos que excede la capacidad del ancho de banda (Bhimj, Bard, Romanu, & Paul, 2016).Finalmente, en los procesos, cuyo número de instrucciones de lectura/escritura pueden suponer un retraso para otros procesos que deben realizarse (Isaila, Garcia Blas, Carretero, Latham, & Ross, 2011). Para hacer frente a las demoras en el acceso y modificación de los datos, se desarrollan herramientas para monitorizar el comportamiento de los sistemas de lectura/escritura en busca de estrategias y soluciones para minimizar el impacto de estos retardos.","PeriodicalId":282395,"journal":{"name":"Working papers. Maestría en Ingeniería de Sistemas","volume":"4 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2019-08-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Working papers. Maestría en Ingeniería de Sistemas","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.15765/wpmis.v4i1.1243","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Año tras año, la implementación de sistemas HPC incrementa a pasos agigantados (Ferreira, Riesen, Bridges, Arnold, & Brightwell, 2014) y son utilizados en la construcción de Data Centers, instituciones científicas, e incluso, para propósito general. Las organizaciones que sostienen estos sistemas HPC normalmente recurren al uso de sockets para controlar el flujo de los datos que deben tratar (Ferreira, Riesen, Bridges, Arnold, & Brightwell, 2014). Sin embargo, el uso de esta tecnología presenta un gran reto: evitar que los sistemas de lectura/escritura se vean superados por la cantidad de datos que deben pasar a través de ellos, ya que una vez aglomerados, estos datos sin tratar pueden traducirse en retrasos para los distintos procedimientos que las organizaciones necesiten hacer. Es decir, las organizaciones deben evitar los cuellos de botella. Entre las estrategias para superar este problema está el diseño e implementación de sistemas de archivos en busca de organizar los datos que deban ser accedidos y modificados de forma paralela por cada uno de los sockets donde se están ejecutando distintas tareas. Existe una relación directa entre la cantidad de sockets y la complejidad de la operación (Yonggang, Jing, & Renato, 2015). Esto es: el aumento del número de servidores (núcleos de procesamiento) que finalmente influirá en el desempeño del sistema. Sin embargo, otros tipos de cuellos de botella pueden presentarse en la red, causados, entre otros, por el alto tráfico de datos que excede la capacidad del ancho de banda (Bhimj, Bard, Romanu, & Paul, 2016).Finalmente, en los procesos, cuyo número de instrucciones de lectura/escritura pueden suponer un retraso para otros procesos que deben realizarse (Isaila, Garcia Blas, Carretero, Latham, & Ross, 2011). Para hacer frente a las demoras en el acceso y modificación de los datos, se desarrollan herramientas para monitorizar el comportamiento de los sistemas de lectura/escritura en busca de estrategias y soluciones para minimizar el impacto de estos retardos.
识别和分析模式,以便在并行存储系统中处理大量i / o数据时产生建议
年复一年,高性能计算系统的实施突增(Ferreira, Riesen, Bridges, Arnold, & Brightwell, 2014),并被用于数据中心、科学机构的建设,甚至通用用途。支持这些高性能计算系统的组织通常使用套接字来控制它们必须处理的数据流(Ferreira, Riesen, Bridges, Arnold, & Brightwell, 2014)。然而,使用这种技术可以提供一个重大挑战:避免读/写系统被克服多少的数据必须通过他们,因为一旦%,未经处理的数据可能延误的各种程序,组织需要做。也就是说,组织必须避免瓶颈。克服这个问题的策略之一是设计和实现文件系统,以组织必须由执行不同任务的每个套接字并行访问和修改的数据。套接字的数量和操作的复杂性之间存在直接关系(Yonggang, Jing, & Renato, 2015)。也就是说:服务器(处理核心)数量的增加最终会影响系统性能。然而,网络中可能会出现其他类型的瓶颈,其中包括超过带宽容量的高数据流量(Bhimj, Bard, Romanu, & Paul, 2016)。最后,在进程中,读/写指令的数量可能会导致必须执行的其他进程的延迟(Isaila, Garcia Blas, cartero, Latham, & Ross, 2011)。为了解决访问和修改数据的延迟问题,开发了监控读写系统行为的工具,以寻找策略和解决方案,以最大限度地减少这些延迟的影响。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信