Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021)最新文献

Aumentando a Eficiência na Execução de Algoritmos de Grafos em HPC 提高高性能计算图算法的执行效率

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18518

Marcelo K. Moori, H. Rocha, Janaína Schwarzrock, A. Lorenzon, A. C. S. Beck

{"title":"Aumentando a Eficiência na Execução de Algoritmos de Grafos em HPC","authors":"Marcelo K. Moori, H. Rocha, Janaína Schwarzrock, A. Lorenzon, A. C. S. Beck","doi":"10.5753/wscad.2021.18518","DOIUrl":"https://doi.org/10.5753/wscad.2021.18518","url":null,"abstract":"A crescente necessidade de extrair informações de dados massivos - estruturados como grafos - tem impulsionado o desenvolvimento de algoritmos paralelos cada vez mais robustos para este processamento. No entanto, o comportamento voltado à comunicação e a estrutura altamente irregular dos grafos usados cotidianamente são obstáculos para alcançar os mesmos níveis de desempenho e eficiência como os observados em outras aplicações paralelas. Neste artigo, nós mostramos que a escalabilidade de diferentes aplicações de grafos variam de acordo com o algoritmo usado e a sua base de dados e que, em muitos casos, utilizar todos recursos disponíveis (i.e. todos os núcleos do processador para a execução) não é a melhor opção em termos de eficiência. Com base nisso, nós propomos o MultGraph, um framework que permite o processamento simultâneo de vários algoritmos/grafos, distribuindo-os de maneira não uniforme entre os núcleos, ao invés de executá-los serialmente (i.e. um após o outro) com o máximo paralelismo disponível. MultGraph funciona em dois passos: (i) caracterizando os algoritmos/grafos pelos seus níveis de eficiência; (ii) definindo as alocações (agrupamentos de algoritmos e entradas a serem executados concorrentemente), número de threads para cada um deles, e a ordem de execução destes grupos. Resultados experimentais em três processadores multicore (Intel e AMD) mostram que o MultGraph melhora em até 9, 21x e 4, 52x em média o tempo de execução das aplicações em relação à execução padrão de aplicações em sistemas HPC.","PeriodicalId":410043,"journal":{"name":"Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021)","volume":"55 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116758613","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 1

A Nonlinear UAV Control Tuning Under Communication Delay using HPC Strategies in Parameters Space 基于参数空间HPC策略的通信延迟下无人机非线性控制整定

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18526

L. Fagundes-Júnior, Michael Canesche, R. Ferreira, A. Brandão

{"title":"A Nonlinear UAV Control Tuning Under Communication Delay using HPC Strategies in Parameters Space","authors":"L. Fagundes-Júnior, Michael Canesche, R. Ferreira, A. Brandão","doi":"10.5753/wscad.2021.18526","DOIUrl":"https://doi.org/10.5753/wscad.2021.18526","url":null,"abstract":"In practical applications, the presence of delays can deteriorate the performance of the control system or even cause plant instability. However, by properly controlling these delays, it is possible to improve the performance of the mechanism. The present work is based on a proposal to analyze the asymptotic stability and convergence of a quadrotor robot, an unmanned aerial vehicle (UAV), on the performance of a given task, under time delay in the data flow. The effects of the communication delay problem, as well as the response-signal behavior of the quadrotors in the accomplishment of positioning mission are presented and analyzed from the insertion of fixed time delay intervals in the UAVs' data collected by its sensors system. Due to the large search space in the set of parameter combinations and the high computational cost required to perform such an analysis by sequentially executing thousands of simulations, this work proposes an open source GPU-based implementation to simulate the robot behavior. Experimental results show a speedup up to 4900x in comparison to MATLAB® implementation. The implement is available in Colab Google platform.","PeriodicalId":410043,"journal":{"name":"Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021)","volume":"4 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122508245","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 3

Detecção de operações de redução em programas C 检测C程序中的还原操作

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18524

João Ladeira Rezende, Edevaldo Braga dos Santos, G. Cavalheiro

引用次数: 0

Predição de Tamanho de Código utilizando Benchmarks Sintetizados: Um Estudo de Caso 使用综合基准预测代码大小:一个案例研究

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18514

André Felipe Zanella, A. Silva

{"title":"Predição de Tamanho de Código utilizando Benchmarks Sintetizados: Um Estudo de Caso","authors":"André Felipe Zanella, A. Silva","doi":"10.5753/wscad.2021.18514","DOIUrl":"https://doi.org/10.5753/wscad.2021.18514","url":null,"abstract":"Um dos principais problemas que impedem Redes Neurais Profundas se tornarem predominantes para otimização de compiladores é a dificuldade de criação de conjuntos de dados de alta qualidade. Benchmarks reais geralmente são programas grandes e complexos, e por não serem abundantes, modelos de compilação preditiva geralmente apresentam dificuldades de generalização devido ao vasto espaço de programas. Esforços recentes da comunidade para mitigar este problema resultaram em ferramentas para síntese automática de benchmarks, capazes de gerar milhares ou milhões de programas sintéticos. No entanto, esses códigos dificilmente coincidem em termos de similaridade com benchmarks codificados manualmente. Este artigo tem como objetivo avaliar o desempenho dos benchmarks AnghaBench, uma proeminente suíte de programas C sintetizados para compilação preditiva, em um problema de aprendizagem de máquina. Comparamos o desempenho desses benchmarks com aplicações provenientes da suíte de testes LLVM, utilizando um modelo LSTM para prever o tamanho de código proporcionado por uma sequência de otimizações, sem a necessidade de compilar o programa. Os resultados experimentais indicam que, em alguns domínios, benchmarks sintéticos são equiparáveis, mas não superam aplicações reais.","PeriodicalId":410043,"journal":{"name":"Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021)","volume":"85 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115631206","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

DONUTS: Um Eficiente Método de Checkpointing em Memórias Não Voláteis 甜甜圈:一种有效的非易失性记忆检查方法

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18517

Kleber Kruger, R. Azevedo, Ricardo Pannain

引用次数: 1

Aceleração de uma Aplicação de Simulação de Câmara de Combustão em Multi-Core 加速多核燃烧室模拟应用

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18510

G. Pizzolato, Claudio Schepke, Natiele Lucca

引用次数: 1

Uma implementação da busca em largura com estrutura bag e OpenMP 使用bag和OpenMP结构实现宽度搜索

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18507

S. G. D. Oliveira, M. I. Santana, D. Brandão, C. Osthoff

引用次数: 0

Performance Data Visualization of Linux Events on Multicores Linux多核事件的性能数据可视化

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18516

Claudio Scheer, Renato B. Hoffmann, Dalvan Griebler, I. Manssour, L. G. Fernandes

引用次数: 0

A Framework for Executing Protein Sequence Alignment in Cloud Computing Services 云计算服务中执行蛋白质序列比对的框架

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18511

L. R. Carvalho, A. Melo, Aleteia P. F. Araujo

引用次数: 1

Nearest Neighbors Search Using Multi-GPU 最近邻居搜索使用多gpu

Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021) Pub Date : 2021-10-26 DOI: 10.5753/wscad.2021.18509

Vinícius Nogueira, L. Amorim, I. Baratta, Gabriel Pereira, Renato Mesquita

{"title":"Nearest Neighbors Search Using Multi-GPU","authors":"Vinícius Nogueira, L. Amorim, I. Baratta, Gabriel Pereira, Renato Mesquita","doi":"10.5753/wscad.2021.18509","DOIUrl":"https://doi.org/10.5753/wscad.2021.18509","url":null,"abstract":"Meshless methods are increasingly gaining space in the study of electromagnetic phenomena as an alternative to traditional mesh-based methods. One of their biggest advantages is the absence of a mesh to describe the simulation domain. Instead, the domain discretization is done by spreading nodes along the domain and its boundaries. Thus, meshless methods are based on the interactions of each node with all its neighbors, and determining the neighborhood of the nodes becomes a fundamental task. The k-nearest neighbors (kNN) is a well-known algorithm used for this purpose, but it becomes a bottleneck for these methods due to its high computational cost. One of the alternatives to reduce the kNN high computational cost is to use spatial partitioning data structures (e.g., planar grid) that allow pruning when performing the k-nearest neighbors search. Furthermore, many of these strategies employed for kNN search have been adapted for graphics processing units (GPUs) and can take advantage of its high potential for parallelism. Thus, this paper proposes a multi-GPU version of the grid method for solving the kNN problem. It was possible to achieve a speedup of up to 1.99x and up to 3.94x using two and four GPUs, respectively, when compared against the single-GPU version of the grid method.","PeriodicalId":410043,"journal":{"name":"Anais do XXII Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2021)","volume":"155 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"114625543","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0