Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)最新文献_第3页

Explorando Afinidade de Memória em Arquiteturas NUMA 在NUMA架构中探索内存亲和性

Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008) Pub Date : 2008-10-29 DOI: 10.5753/wscad.2008.17670

C. Ribeiro, Vania Marangozova, Jean-François Méhaut, Fabrice Dupros, A. Carissimi

{"title":"Explorando Afinidade de Memória em Arquiteturas NUMA","authors":"C. Ribeiro, Vania Marangozova, Jean-François Méhaut, Fabrice Dupros, A. Carissimi","doi":"10.5753/wscad.2008.17670","DOIUrl":"https://doi.org/10.5753/wscad.2008.17670","url":null,"abstract":"Arquiteturas NUMA possuem latência e largura de banda assimétricas devido a existência de múltiplos níveis hierárquicos de memória no sistema. Para garantir desempenho neste tipo de arquitetura torna-se necessário garantir a afinidade de memória nas aplicações. Os sistemas operacionais, com suporte para arquiteturas NUMA, possuem políticas para alocação e escalonamento de memória e threads que visam a afinidade de memória. Entretanto, essas políticas não apresentam sempre o melhor desempenho para todos os tipos de aplicações. Ferramentas e APIs, presentes nestes sistemas operacionais, permitem gerenciar explicitamente a afinidade de memória nas aplicações. Neste trabalho será apresentado a avaliação de desempenho de diferentes estratégias para gerenciamento explícito de afinidade de memória, implementadas com APIs do sistema operacional em aplicações paralelas. Essas estratégias foram implementadas em uma aplicação sísmica e em kernels do Benchmark NAS e executadas em diferentes arquiteturas NUMA. Os resultados mostram a importância de garantir a afinidade de memória em arquiteturas NUMA (ganho médio de até 80%) e que isso pode ser obtido através de APIs do sistema operacional.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"144 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123364491","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 4

Avaliando e Comparando Diferentes Estruturas de Programas Paralelos Através de Modelos Analíticos de Desempenho 通过性能分析模型评估和比较不同的并行程序结构

Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008) Pub Date : 2008-10-29 DOI: 10.5753/wscad.2008.17687

J. M. Laine, Edson T. Midorikawa

引用次数: 0

Um Compressor de Arquivos Paralelo Compatível com o Bzip2 与Bzip2兼容的并行文件压缩器

Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008) Pub Date : 2008-10-29 DOI: 10.5753/wscad.2008.17663

Vinicius Dalto do Nascimento, Davi Vercillo, Gabriel de França Pereira e Silva

{"title":"Um Compressor de Arquivos Paralelo Compatível com o Bzip2","authors":"Vinicius Dalto do Nascimento, Davi Vercillo, Gabriel de França Pereira e Silva","doi":"10.5753/wscad.2008.17663","DOIUrl":"https://doi.org/10.5753/wscad.2008.17663","url":null,"abstract":"No cenário atual da computação verifica-se um aumento crescente da capacidade dos sistemas de armazenamento. Com isso, o desenvolvimento de ferramentas para a compressão rápida e eficiente de um grande número de arquivos, com tamanhos também cada vez maiores, se torna uma necessidade urgente. Simultaneamente, a ampla disponibilidade de recursos computacionais com múltiplos processadores, seja em um único computador, seja em um ambiente de rede, viabiliza o uso de aplicações paralelas para o atendimento dessa demanda. Este trabalho apresenta um compressor de arquivos paralelo, em que o trabalho de compressão é distribuído através de diversos processadores locais e remotos. São apresentadas duas versões desse compressor: uma que utiliza o paradigma de memória compartilhada e outra o de troca de mensagens. O uso de um servidor de arquivos paralelos, junto com rotinas do MPI-I/O, foi a solução encontrada para melhorar o desempenho do sistema de E/S, normalmente um gargalo nesse tipo de aplicação. Para verificar e validar o desempenho das implementações desenvolvidas, foram analisados diversos cenários e feitas comparações com os resultados de um compressor paralelo apresentado em um trabalho correlato.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"57 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127735053","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

HieraAnalyses - Uma ferramenta para análise hierárquica de programas paralelos 层次分析-并行程序的层次分析工具

Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008) Pub Date : 2008-10-29 DOI: 10.5753/wscad.2008.17685

T. D. F. P. Seraphim, Enzo Seraphim, G. Travieso

{"title":"HieraAnalyses - Uma ferramenta para análise hierárquica de programas paralelos","authors":"T. D. F. P. Seraphim, Enzo Seraphim, G. Travieso","doi":"10.5753/wscad.2008.17685","DOIUrl":"https://doi.org/10.5753/wscad.2008.17685","url":null,"abstract":"Informações detalhadas para a análise de desempenho de programas paralelos podem ser coletadas através de arquivos de trace. Geralmente, esses arquivos de trace contêm um registro de eventos individuais que ocorrem durante a execução do programa. Considerando que os eventos são geralmente de baixo nível, como operações de comunicação em um sistema paralelo, e que é cada vez mais comum para o programador de aplicações usar abstrações de alto nível (por exemplo, uma rotina paralela de autovalores), existe uma diferença semântica entre a informação coletada e os conceitos usados para o desenvolvimento da aplicação, impedindo o uso eficiente dessa informação. Neste trabalho, é proposta uma nova abordagem para arquivos de trace, onde os arquivos contêm informações sobre os diferentes níveis hierárquicos de uma aplicação. Os arquivos seguem o formato XML, onde as rotinas são tags XML, com rotinas auxiliares chamadas durante sua execução de tags filhos. A abordagem é demonstrada pela sua implementação para o nível da bilbioteca MPI e para o nível do OOPS, sendo este último um framework orientado a objetos com abstrações de alto nível para o desenvolvimento de programas paralelos que usam a biblioteca MPI para sua implementação. Para complementar este trabalho, ferramentas de análise usando o formato de arquivo são apresentadas.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"121424663","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

FlowPGA: DataFlow de Aplicações em FPGA FlowPGA: FPGA应用的数据流

Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008) Pub Date : 2008-10-29 DOI: 10.5753/wscad.2008.17668

Leandro A. J. Marzulo, Fabio H. Flesch, Alexandre S. Nery, F. M. França, Edilberto Fernandes

{"title":"FlowPGA: DataFlow de Aplicações em FPGA","authors":"Leandro A. J. Marzulo, Fabio H. Flesch, Alexandre S. Nery, F. M. França, Edilberto Fernandes","doi":"10.5753/wscad.2008.17668","DOIUrl":"https://doi.org/10.5753/wscad.2008.17668","url":null,"abstract":"A arquitetura WaveScalar é a primeira arquitetura dataﬂow a apresentar uma interface de memória que mantém a semântica de acessos requerida pelas linguagens imperativas. Um protótipo da arquitetura, em desenvolvimento, permitiria passar de experimentação por simulação para um cenário mais real, com o processador desenvolvido em FPGA. No entanto, este protótipo não é acessível (financeiramente) para qualquer instituição que também queira produzí-lo. Neste trabalho é apresentada a FlowPGA, uma versão reduzida desta arquitetura para ser utilizada com FPGAs com pequeno número de células lógicas. Uma FPGA com 1,5 milhões de gates foi utilizada para implementação. A corretude da implementação foi avaliada com a execução de um programa de multiplicação entre dois números positivos usando sucessivas somas. Os resultados mostram que a arquitetura FlowPGA tem desempenho equivalente ao WaveScalar. Ainda, para avaliar a versatilidade do projeto, a FlowPGA foi modificada para utilizar um sistema de numeração RNS, com esforço de implementação de aproximadamente 20 horas.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"32 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131754076","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

DTSD: Uma Arquitetura com Mecanismo Híbrido de Execução DTSD:具有混合执行机制的体系结构

Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008) Pub Date : 2008-10-29 DOI: 10.5753/wscad.2008.17666

Fernando Emílio Leite de Almeida, A. F. D. Souza, Edilberto Fernandes

引用次数: 0

PowerSMT: Ferramenta para Análise de Consumo de Potência em Arquiteturas SMT PowerSMT: SMT架构中功耗分析的工具

Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008) Pub Date : 2008-10-29 DOI: 10.5753/wscad.2008.17682

Rogério Aparecido Gonçalves, R. A. L. Gonçalves

引用次数: 1

Algoritmos de Otimização para Simulação Distribuída de Arquiteturas Complexas 复杂架构分布式仿真的优化算法

Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008) Pub Date : 2008-10-29 DOI: 10.5753/wscad.2008.17683

J. Pereira, Rafael R. dos Santos, J. Furtado, T. G. S. D. Santos

{"title":"Algoritmos de Otimização para Simulação Distribuída de Arquiteturas Complexas","authors":"J. Pereira, Rafael R. dos Santos, J. Furtado, T. G. S. D. Santos","doi":"10.5753/wscad.2008.17683","DOIUrl":"https://doi.org/10.5753/wscad.2008.17683","url":null,"abstract":"O projeto de arquiteturas de computadores complexas envolve diversas etapas e pode levar vários anos de desenvolvimento. Desse modo, é comum usar simulação com a finalidade de estudar os efeitos de novos mecanismos e das diversas modificações e atualizações na arquitetura, já que a implementação direta é proibitiva em função do tempo, custo e complexidade. Mesmo usando simulação, a busca pela melhor configuração pode ser onerosa em decorrência da diversidade de parâmetros que podem mudar e afetar o comportamento da arquitetura. Este trabalho utiliza uma implementação de um algoritmo genético para a otimização e automatização da busca de configurações em simulação de arquiteturas de computadores. Os resultados mostram que, dentro do espaço de busca apresentado no artigo, o tempo de execução das simulações reduz em até 91%, se comparado à busca exaustiva. Além disso, os resultados encontrados pelo algoritmo genético representam valores com precisão acima de 97% com relação à solução ótima. Para diminuir ainda mais o tempo na obtenção dos resultados, o processamento das simulações executadas pelo algoritmo genético foi distribuído em um agregado e uma grade. Essa versão distribuída reduziu em mais de 80% o tempo de execução, quando comparado à execução seqüencial do mesmo algoritmo genético.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"21 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"132996336","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0