L. Sales, N. C. Mendonça, R. Barbosa, Jonathan D’Orleans, Fernando A. M. Trinta, Henrique Teófilo
{"title":"Um Estudo do Impacto de Desempenho de Dois Sistemas Genéricos de Comunicação em Grupo sobre o Jgroups","authors":"L. Sales, N. C. Mendonça, R. Barbosa, Jonathan D’Orleans, Fernando A. M. Trinta, Henrique Teófilo","doi":"10.5753/wscad.2008.17680","DOIUrl":"https://doi.org/10.5753/wscad.2008.17680","url":null,"abstract":"Este artigo apresenta um estudo do impacto de desempenho de dois sistemas genéricos de comunicação em grupo, Hedera e jGCS, quando implementados sobre um mesmo sistema de comunicação em grupo, JGroups. O estudo comparou o desempenho dos dois sistemas genéricos, bem como do JGroups isoladamente, em um ambiente de rede local sob diferentes tamanhos de mensagens e diferentes protocolos de transporte. Os resultados obtidos mostram que há diferenças significativas no impacto causado pelos dois sistemas genéricos em relação ao desempenho do JGroups, e que essas diferenças estão fortemente relacionadas a variações no tamanho das mensagens e, em menor grau, no protocolo de transporte utilizado. Com base nesses resultados, o artigo oferece um conjunto de guias que podem auxiliar os desenvolvedores de aplicações distribuídas a avaliar se (e em que situações) vale a pena implementar comunicação em grupo utilizando esses dois sistemas genéricos.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"15 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116652372","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"PBIW: Uma Codificação de Instruções Alternativa para Arquiteturas de Alto Desempenho","authors":"R. Batistella, R. Santos, R. Azevedo","doi":"10.5753/wscad.2008.17679","DOIUrl":"https://doi.org/10.5753/wscad.2008.17679","url":null,"abstract":"Este artigo apresenta a técnica de codificação PBIW. Essa técnica é baseada na fatoração de grupos de operações escalonadas em instruções codificadas e padrões. Uma instrução codificada não contém dados redundantes e é armazenada em uma cache de instruções. Os padrões são armazenados em uma cache de padrões. Foi realizado um estudo de caso desta técnica sobre esquemas de codificação de instruções denominados 2D-VLIW e EPIC em uma arquitetura de alto desempenho chamada 2D-VLIW. A técnica PBIW foi avaliada com os benchmarks MediaBench, SPECint e SPECfp. Os resultados revelam que a técnica PBIW produz programas até 81% menores que 2D-VLIW e até 46% menores que EPIC, além de programas até 96% mais rápidos que 2D-VLIW e até 69% mais rápidos que EPIC.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"12 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123240862","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
João Alberto Vortmann, Rafael Petry, G. Corrêa, Fabiane Rediess, Luciano Agostini, G. Cavalheiro
{"title":"Investigação sobre o Uso de Multiprogramação Leve como Alternativa para a Estimação de Movimento na Compressão de Vídeos de Alta Resolução","authors":"João Alberto Vortmann, Rafael Petry, G. Corrêa, Fabiane Rediess, Luciano Agostini, G. Cavalheiro","doi":"10.5753/wscad.2008.17669","DOIUrl":"https://doi.org/10.5753/wscad.2008.17669","url":null,"abstract":"A popularização do uso de vídeo digital nas mais diferentes mídias tornou o processo de codificação de vídeo fundamental por permitir a redução da quantidade de dados a serem transmitidos e armazenados sem perda significativa de qualidade. Neste processo, a etapa de estimação de movimento é a que requer maior tempo de processamento, existindo diferentes algoritmos para implementa-la. Este trabalho apresenta o uso de técnicas e ferramentas de multiprogramação leve (OpenMP) em arquiteturas multi-core para a realização da estimação de movimento. Os resultados das implementações, explorando o paralelismo de diversas formas, são apresentados e discutidos. Os experimentos apontam que o algoritmo Full Search ofereceu os melhores ganhos de desempenho com tempo de processamento, 54.54% menor que a versão seqüencial.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"53 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129603896","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Sílvio R. Fernandes, B. C. Oliveira, Miklécio Costa, Ivan Saraiva Silva
{"title":"IPNoSys: uma nova arquitetura paralela baseada em redes em chip","authors":"Sílvio R. Fernandes, B. C. Oliveira, Miklécio Costa, Ivan Saraiva Silva","doi":"10.5753/wscad.2008.17667","DOIUrl":"https://doi.org/10.5753/wscad.2008.17667","url":null,"abstract":"A tecnologia de integração tem avançado a ponto de transformar os processadores multi-core em uma realidade de mercado nos dias atuais. Nesse cenário, as redes de interconexão têm uma função essencial quando o número de núcleos de processamento cresce, uma vez que o uso de soluções baseadas em barramento torna-se impossível. Algumas soluções de interconexão têm sido empregadas, entretanto, são custosas em relação à área e potência dissipada. Este artigo apresenta uma solução utilizando redes em chip, não apenas como interconexão, mas também como sistema de processamento. Simulações mostraram que o tempo de execução na arquitetura proposta é 3,5 vezes menor que a mesma aplicação executada em uma plataforma virtual MP-SoC.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"58 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124663617","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Métodos Multigrid Paralelos em Malhas Não Estruturadas Aplicados à Simulação de Problemas de Dinâmica de Fluidos Computacional e Transferência de Calor","authors":"G. Galante","doi":"10.5753/wscad.2008.17664","DOIUrl":"https://doi.org/10.5753/wscad.2008.17664","url":null,"abstract":"Este trabalho apresenta dois métodos paralelos aplicados à solução dos problemas de dinâmica de fluidos e transferência de calor. Nos métodos propostos, a solução é obtida utilizando-se métodos multigrid paralelizados por decomposição de domínio, mais especificamente pelos métodos aditivo de Schwarz e complemento de Schur. Através dos experimentos, pode-se notar que as implementações propostas são computacionalmente eficientes e escaláveis.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"39 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"121529616","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Balanceamento Dinâmico de Requisições em Cluster de Servidores Web","authors":"J. Sato, J. Martini, R. A. L. Gonçalves","doi":"10.5753/wscad.2008.17673","DOIUrl":"https://doi.org/10.5753/wscad.2008.17673","url":null,"abstract":"Informações provenientes de movimentações bancárias, transações comerciais, pesquisas educacionais, bate-papo e jogos interativos, entre outros, têm crescido intensamente na Internet. Os provedores de serviços precisam estar preparados para sustentar esta demanda crescente de informação e comunicação. Neste sentido, a distribuição de requisições entre vários servidores web de forma balanceada tem se tornado uma estratégia f undamental para garantir melhor qualidade no serviço. O presente trabalho descreve e discute questões arquiteturais e operacionais sobre o balanceamento de requisições, principalmente o dinâmico, abordando conceitos, técnicas e soluções. Experimentos reais foram realizados em diferentes configurações sobre um cluster de servidores Apache não dedicado exclusivamente ao serviço web. O módulo de balanceamento de carga mod_proxy_balancer foi usado com sobrecargas sintéticas intensivas e um novo método de balanceamento chamado byquery foi proposto e avaliado. Os resultados mostram que o balanceamento neste tipo de sistema será mais eficiente se a carga de rede externa ao serviço web for detectada e usada no fator de balanceamento.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"17 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123930668","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Mecanismo de Otimização de Consumo de Energia e Desempenho baseado na Variação de Parâmetro da Memória Cache e do Processador NIOSII","authors":"A. G. Silva Filho, Sidney Marlon Lopes de Lima","doi":"10.5753/wscad.2008.17684","DOIUrl":"https://doi.org/10.5753/wscad.2008.17684","url":null,"abstract":"O consumo de energia de uma hierarquia de memória cache pode atingir cerca de 50% de um sistema microprocessado[1]. Este projeto propõe: (i) um fluxo para estimar consumo de energia e desempenho computacional usando uma sistema SOC baseado em FPGAs, e (ii) um mecanismo de exploração de arquitetura com base na variação dos parâmetros da memória cache, utilizando o microprocessador NIOSII. Resultados, baseados nos benchmarks Mibench e Xirisc demonstraram que, em média, com exploração de 10% do espaço de busca, uma redução do consumo de energia de 28% pode ser alcançada, além de um aumento de 7% no desempenho para as 5 aplicações avaliadas. Adicionalmente, observou-se que foram encontrados resultados ótimos em 60% dos casos analisados.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"53 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"125909933","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
M. L. Kolling, Felipe A. Kuentzer, Cristiano Battisti, C. Both, Rafael R. dos Santos, T. G. S. D. Santos
{"title":"Verificação em Hardware de Componentes de Comunicação","authors":"M. L. Kolling, Felipe A. Kuentzer, Cristiano Battisti, C. Both, Rafael R. dos Santos, T. G. S. D. Santos","doi":"10.5753/wscad.2008.17678","DOIUrl":"https://doi.org/10.5753/wscad.2008.17678","url":null,"abstract":"Nas últimas décadas, a transformação nos meios e formas de comunicação vêm impulsionando uma grande diversificação de dispositivos na área de comunicação de dados. Essa transformação é possível, sobretudo, em decorrência do desenvolvimento da microeletrônica e dos sistemas embarcados. Apesar da grande evolução ocorrida nos equipamentos em si, ainda existe uma carência no que diz respeito aos testes e validações dos mesmos. Várias RFCs (Request for Comments) já foram escritas objetivando a definição de uma metodologia para benchmarking, mas a maioria são tipicamente implementadas através de software e os equipamentos para esse fim, disponíveis no mercado, possuem um alto custo agregado. Porém, com a necessidade crescente de aumento da vazão, muitos desses testes ficam restritos, já que o software não consegue atingir os requisitos de vazão e latência necessários. Assim, esse trabalho tem como principal objetivo implementar os testes descritos na RFC 2544 em hardware. Os resultados mostram que essa abordagem é bastante eficiente e flexível, tendo em vista que não é necessário o uso de um sistema operacional e aplicativos de alto nível.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"110 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115923910","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Método SOR Paralelo na Simulação das Equações de Navier-Stokes 2D","authors":"Darlon Vasata, G. Galante, R. L. Rizzi","doi":"10.5753/wscad.2008.17662","DOIUrl":"https://doi.org/10.5753/wscad.2008.17662","url":null,"abstract":"Neste trabalho, são construídos e implementados modelos computacionais baseados na equações de Navier-Stokes bidimensionais. A complexidade matemática dessas equações impossibilita encontrar soluções analíticas a partir da análise teórica, havendo a demanda de métodos numéricos para resolvê-las. Considerando que tais métodos numéricos requerem grande quantidade de processamento e de memória, o uso de ambientes computacionais de alto desempenho e de estratégias de paralelismo se fazem necessários. Os resultados mostraram que as estratégias e técnicas empregadas obtiverem boa qualidade numérica e bom desempenho computacional.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"10 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123910122","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Uma Abordagem para Composição de Clusters Eficientes na Execução do Modelo Numérico WRF de Previsão do Tempo","authors":"L. C. Pinto, L. H. B. Tomazella, M. R. Dantas","doi":"10.5753/wscad.2008.17671","DOIUrl":"https://doi.org/10.5753/wscad.2008.17671","url":null,"abstract":"A resolução de problemas conhecidos por grand challenge, como é o caso da previsão do tempo por meio de modelos numéricos, demandam computação de alto desempenho. Apesar da consolidação dos clusters como solução para prover alto desempenho, a escolha dos computadores que o compõe está submetida à variabilidade das configurações disponíveis no mercado. De fato, a inserção de processadores multi-core em ambientes de cluster cria um cenário distinto no que diz respeito à comunicação entre processos. Nesse contexto, propõe-se uma abordagem em que alguns núcleos de processamento não são alocados a processos da aplicação, com o intuito de construir clusters econômicos mas também eficientes, interconectados por Gigabit Ethernet em alternativa a redes de interconexão como Myrinet e lnfiniband. Experimentos com o modelo numérico de previsão do tempo WRF (Weather Research and Forecasting Model) e o algoritmo de granularidade fina IS do NAS Parallel Benchmarks, revelaram redução de mais de 20% no tempo de execução. Portanto, os resultados empíricos indicam um ganho expressivo no desempenho de um mesmo cluster quando configurado segundo a abordagem proposta, provando a pertinência deste trabalho.","PeriodicalId":285098,"journal":{"name":"Anais do IX Simpósio em Sistemas Computacionais de Alto Desempenho (WSCAD 2008)","volume":"57 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2008-10-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131444959","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}