PampaAffinity: Otimização de Aplicações Paralelas via Ajuste Dinâmico e Transparente do Grau de Paralelismo e Mapeamento de Threads

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI:10.5753/wscad.2021.18525

Valmir T. Junior, Thiarles S. Medeiros, Janaína Schwarzrock, Samuel Xavier-de-Souza, F. Rossi, M. C. Luizelli, A. C. S. Beck, A. Lorenzon

{"title":"PampaAffinity: Otimização de Aplicações Paralelas via Ajuste Dinâmico e Transparente do Grau de Paralelismo e Mapeamento de Threads","authors":"Valmir T. Junior, Thiarles S. Medeiros, Janaína Schwarzrock, Samuel Xavier-de-Souza, F. Rossi, M. C. Luizelli, A. C. S. Beck, A. Lorenzon","doi":"10.5753/wscad.2021.18525","DOIUrl":null,"url":null,"abstract":"O desenvolvimento de aplicações que possam utilizar de maneira eficiente os recursos computacionais tem se tornado um desafio para os usuários devido às características do software e hardware que afetam a escalabilidade de muitas aplicações paralelas. Neste sentido, estratégias de ajuste dinâmico do número de threads e mapeamento de threads para núcleos de processamento têm sido empregadas para otimizar o uso destes recursos computacionais. No entanto, o espaço de exploração cresce significativamente com o número de núcleos da arquitetura, tornando a tarefa de encontrar uma configuração ideal de grau de paralelismo e mapeamento de threads desafiadora. Assim, nós propomos PampaAffinity, uma abordagem dinâmica, automática e transparente para o usuário, que realiza o ajuste do número de threads e políticas de mapeamento de threads para cada região paralela de aplicações OpenMP. Com a execução de treze aplicações em três arquiteturas multicore, mostramos que PampaAffinity converge para uma solução ideal com precisão média de 85% e otimiza o tradeoff entre desempenho e consumo de energia em 96.1% quando comparado à maneira padrão que aplicações paralelas são executadas.","PeriodicalId":410043,"journal":{"name":"Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021)","volume":"23 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-10-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/wscad.2021.18525","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

O desenvolvimento de aplicações que possam utilizar de maneira eficiente os recursos computacionais tem se tornado um desafio para os usuários devido às características do software e hardware que afetam a escalabilidade de muitas aplicações paralelas. Neste sentido, estratégias de ajuste dinâmico do número de threads e mapeamento de threads para núcleos de processamento têm sido empregadas para otimizar o uso destes recursos computacionais. No entanto, o espaço de exploração cresce significativamente com o número de núcleos da arquitetura, tornando a tarefa de encontrar uma configuração ideal de grau de paralelismo e mapeamento de threads desafiadora. Assim, nós propomos PampaAffinity, uma abordagem dinâmica, automática e transparente para o usuário, que realiza o ajuste do número de threads e políticas de mapeamento de threads para cada região paralela de aplicações OpenMP. Com a execução de treze aplicações em três arquiteturas multicore, mostramos que PampaAffinity converge para uma solução ideal com precisão média de 85% e otimiza o tradeoff entre desempenho e consumo de energia em 96.1% quando comparado à maneira padrão que aplicações paralelas são executadas.

查看原文本刊更多论文

PampaAffinity:通过动态和透明的并行度调整和线程映射优化并行应用程序

由于软件和硬件的特性影响了许多并行应用程序的可伸缩性，开发能够有效利用计算资源的应用程序已经成为用户的一个挑战。在这个意义上，动态调整线程数和线程映射到处理核心的策略已经被用来优化这些计算资源的使用。然而，随着体系结构核心数量的增加，探索空间显著增加，这使得找到并行度和线程映射的最佳配置成为一项具有挑战性的任务。因此，我们提出PampaAffinity，这是一种动态、自动和用户透明的方法，它为OpenMP应用程序的每个并行区域调整线程数量和线程映射策略。通过在三种多核架构上运行13个应用程序，我们证明PampaAffinity收敛到一个平均精度为85%的理想解决方案，与并行应用程序的标准执行方式相比，性能和功耗之间的权衡优化了96.1%。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021)

自引率

0.00%

发文量