Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009)最新文献_第2页

Arquitetura e Avaliação do Cluster de Alto Desempenho Netuno Netuno高性能集群的架构和评估

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17392

Vinícius Silva, C. Bentes, Sérgio Guedes, G. P. Silva

引用次数: 3

Automação de Refatorações para Programas Fortran de Alto Desempenho 高性能Fortran程序的重构自动化

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17394

B. B. Boniati, A. Charão, B. Stein

{"title":"Automação de Refatorações para Programas Fortran de Alto Desempenho","authors":"B. B. Boniati, A. Charão, B. Stein","doi":"10.5753/wscad.2009.17394","DOIUrl":"https://doi.org/10.5753/wscad.2009.17394","url":null,"abstract":"Refatoração é uma técnica de engenharia de software que objetiva aplicar melhorias internas no código-fonte de aplicações, sem que isso influencie no seu comportamento. É uma técnica amplamente empregada em código orientado a objetos e utilizada por algumas metodologias de desenvolvimento. Na computação de alto desempenho, a refatoração é uma técnica pouco explorada, sendo que grande parte código legado de programas de alto desempenho está escrita em linguagens não orientadas a objetos. Neste trabalho, explora-se a automatização de técnicas de refatoração e sua aplicação em códigos de alto desempenho escritos em linguagem imperativa Fortran. São identificadas oportunidades de melhorar a legibilidade e o design do código sem afetar o desempenho, além de reestruturações de código quem podem representar ganho de desempenho. As técnicas estudadas e automatizadas são utilizadas em aplicações reais, como meio de validar a abordagem. A automatização das técnicas é feita estendendo as funcionalidades do IDE Photran, um plugin para Eclipse, cujo funcionamento também será abortado neste texto.","PeriodicalId":132055,"journal":{"name":"Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009)","volume":"10 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2009-10-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123817778","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

Análise de desempenho do sistema de arquivos Lustre sob padrões de acesso a dados exclusivos 在独特的数据访问标准下对Lustre文件系统进行性能分析

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17406

F. Boito, R. Kassick, P. Navaux

{"title":"Análise de desempenho do sistema de arquivos Lustre sob padrões de acesso a dados exclusivos","authors":"F. Boito, R. Kassick, P. Navaux","doi":"10.5753/wscad.2009.17406","DOIUrl":"https://doi.org/10.5753/wscad.2009.17406","url":null,"abstract":"Aplicações que executam em ambientes de cluster frequentemente geram grandes quantidades de dados, que podem precisar ser acessados de forma eficiente por todos os nós envolvidos na computação. Sistemas de arquivos distribuídos (SADs) constituem uma solução natural nesse caso. Dependendo das suas opções de projeto, esses sistemas podem apresentar variados comportamentos sob diferentes padrões de acesso. Assim, estudar como se comporta o desempenho de um SAD sob padrões de acesso verificados na prática é uma tarefa importante, pois fornece ferramentas para que as aplicações possam adequar as suas operações de E/S para tirar melhor proveito do sistema utilizado. Um desses padrões comuns em aplicações científicas é o acesso pelos nós a dados exclusivos. Duas formas de fazê-lo são empregar um arquivo por processo, ou segmentos de um arquivo compartilhado. Esse artigo apresenta um estudo sobre o comportamento do sistema de arquivos Lustre nessas situações, a fim de determinar a que deve ser preferida em cada caso. Para realizar o estudo, foram realizados testes que simulam os padrões de acesso. Os resultados permitiram concluir que, para operações de escrita com números grandes de clientes, a abordagem de arquivos múltiplos é a melhor. No entanto, para outras situações, ela se mostra equivalente e até pior que a de arquivo compartilhado.","PeriodicalId":132055,"journal":{"name":"Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009)","volume":"63 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2009-10-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126515116","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

Simulação de Neurônios Biologicamente Realistas em GPUs 在gpu中模拟生物逼真的神经元

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17404

Raphael Y. de Camargo

引用次数: 1

Análise do processamento paralelo em Clusters multi-core na simulação de escoamento míscivel implementado pelo método dos elementos finitos 采用有限元方法实现的多核集群并行处理模拟

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17396

A. C. Barbosa, L. Catabriga, Alberto F. De Souza, A. M. F. Valli

{"title":"Análise do processamento paralelo em Clusters multi-core na simulação de escoamento míscivel implementado pelo método dos elementos finitos","authors":"A. C. Barbosa, L. Catabriga, Alberto F. De Souza, A. M. F. Valli","doi":"10.5753/wscad.2009.17396","DOIUrl":"https://doi.org/10.5753/wscad.2009.17396","url":null,"abstract":"Neste trabalho analisamos o desempenho paralelo de um código de elementos finitos em Clusters multi-core considerando duas alternativas de particionamento do job paralelo MPI entre os cores: single-core, na qual apenas um processo é enviado para cada máquina multi-core; e fill-up, na qual todos os cores de cada máquina do Cluster recebem processos. A aplicação envolve o escoamento miscível de fluido incompressível em meio poroso, mais especificamente, a simulação de traçadores no contexto da Engenharia de Petróleo. Nós medimos o tempo de processamento e o speedup obtidos em dois Clusters de computadores multi-core: um composto por 31 máquinas, cada uma com uma Unidade Central de Processamento (Central Processing Unit - CPU) dual-core (Enterprise 2); e outro composto por 29 máquinas, cada uma com uma CPU quad-core (Enterprise 3). Além disso, analisamos a eficiência dos algoritmos de escalonamento no Enterprise 3 em termos da comunicação externa entre as CPUs e a concorrência dos cores pela hierarquia de memória das CPUs. Nossos resultados mostraram que, muito embora máquinas mais modernas como o Enterprise 3 possuam um número maior de cores e estes sejam mais rápidos, a competição destes cores pela hierarquia de memória tem grande impacto no desempenho final das aplicações.","PeriodicalId":132055,"journal":{"name":"Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009)","volume":"24 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2009-10-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127794785","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

Aplicando Model-Driven Development à Plataforma GPGPU 模型驱动开发在GPGPU平台上的应用

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17402

Ademir Carvalho Jr., T. Farias, J. M. Teixeira, Veronica Teichrieb, Judith Kelner

引用次数: 1

Avaliação de Desempenho, Área e Energia de Caches com Controle de Poluição 污染控制缓存的性能、面积和功率评估

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17399

R. R. D. Souza, G. C. Heck, Renato Carmo, R. A. Hexsel

引用次数: 1

Implementação Paralela em C+CUDA de um Categorizador Multi-Rótulo de Texto Baseado no Algoritmo k-NN 基于k-NN算法的多标签文本分类器的C+CUDA并行实现

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17403

L. Veronese, A. F. D. Souza, C. Badue, Elias Oliveira

引用次数: 0

Estudo Quantitativo do Modelo WRF de Previsão do Tempo em um Ambiente de Cluster Multi-core 多核集群环境下WRF天气预报模型的定量研究

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17397

L. C. Pinto, M. R. Dantas

引用次数: 0

Trebuchet: Explorando TLP com Virtualização DataFlow 投石机:利用数据流虚拟化的TLP

Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009) Pub Date : 2009-10-28 DOI: 10.5753/wscad.2009.17393

T. A. Alves, Leandro A. J. Marzulo, F. M. França, V. Costa

{"title":"Trebuchet: Explorando TLP com Virtualização DataFlow","authors":"T. A. Alves, Leandro A. J. Marzulo, F. M. França, V. Costa","doi":"10.5753/wscad.2009.17393","DOIUrl":"https://doi.org/10.5753/wscad.2009.17393","url":null,"abstract":"No modelo DataFlow as instruções são executadas t ão logo seus operandos de entrada estejam disponíveis, expondo, de forma natural, o paralelismo em nível de instrução (ILP). Por outro lado, a exploração de paralelismo em nível de thread (TLP) passa a ser também um fator de grande import ância para o aumento de desempenho na execução de uma aplicação em máquinas multicore. Este trabalho propõe um modelo de execução de programas, baseado nas arquiteturas DataFlow, que transforma ILP em TLP. Esse modelo é demonstrado através da implementação de uma máquina virtual multi-threaded, a Trebuchet. A aplicação é compilada para o modelo DataFlow e suas instruções independentes (segundo o fluxo de dados) são executadas em Elementos de Processamento (EPs) distintos da Trebuchet. Cada EP é mapeado em uma thread na máquina hospedeira. O modelo permite a definição de blocos de instruções de diferentes granularidades, que terão disparo guiado pelo fluxo de dados e execução direta na máquina hospedeira, para diminuir os custos de interpretação. Como a sincronização é obtida pelo modelo DataFlow, não é necessária a introdução de locks ou barreiras nos programas a serem paralelizados. Um conjunto de três benchmarks reduzidos, compilados em oito threads e executados por um processador quadcore Intel R CoreTMi7 920, permitiu avaliar: (i) o funcionamento do modelo; (ii) a versatilidade na definição de instruções com diferentes granularidades (blocos); (iii) uma comparação com o OpenMP. Acelerações de 4,81, 2,4 e 4,03 foram atingidas em relação à versão sequencial, enquanto que acelerações de 1,11, 1,3 e 1,0 foram obtidas em relação ao OpenMP.","PeriodicalId":132055,"journal":{"name":"Anais do X Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2009)","volume":"55 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2009-10-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124166716","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 3