{"title":"\"Prober: Uma Ferramenta de Análise Funcional e de Desempenho de Programas Paralelos e Configuração de Cluster\"","authors":"L. Ramos, Luís Fabrício W. Góes, C. A. P. Martins","doi":"10.5753/wscad.2001.19132","DOIUrl":"https://doi.org/10.5753/wscad.2001.19132","url":null,"abstract":"Este trabalho descreve uma ferramenta de análise funcional e de desempenho de programas paralelos que utiliza monitoramento para gerenciar a execução do programa, coletar métricas de desempenho e mostrar resultados através de gráficos e valores estatísticos. Além disso, o Prober é uma ferramenta que facilita toda a configuração de um ambiente paralelo em um cluster.","PeriodicalId":355276,"journal":{"name":"Anais do II Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2001)","volume":"8 4","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2001-09-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"120917757","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
J. Martini, M. A. Cavenaghi, Claudinei Geraldo, Evaldo Gardenali
{"title":"O Impacto da Rede de Interconexão no Índice de Atividade da Arquitetura APO","authors":"J. Martini, M. A. Cavenaghi, Claudinei Geraldo, Evaldo Gardenali","doi":"10.5753/wscad.2001.19119","DOIUrl":"https://doi.org/10.5753/wscad.2001.19119","url":null,"abstract":"Este trabalho apresenta um estudo da influência da rede de interconexão sobre o desempenho da arquitetura APO. O trabalho avalia principalmente o impacto da rede de interconexão sobre o desempenho da arquitetura, permitindo identificar para quais taxas de transmissão da rede ocorre melhor desempenho da arquitetura. Os resultados deste trabalho mostram que a modificação arquitetura implementada na APO proporcionou grande melhoria de desempenho, solucionando dessa forma o problema do índice de atividade nas unidades da arquitetura. Os resultados mostram também que há um amplo espaço para a investigação de arquiteturas paralelas com interligação através de redes ópticas. Finalmente, o artigo discute oportunidades de continuidade de investigações futuras para este trabalho, apresentando novos desafios que são a continuidade natural dos trabalhos até agora desenvolvidos pelo grupo.","PeriodicalId":355276,"journal":{"name":"Anais do II Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2001)","volume":"44 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2001-09-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123318013","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Análises Estáticas para a Distribuição de Dados e Computações em Memória Distribuída","authors":"Raul Junji Nakashima, G. Travieso","doi":"10.5753/wscad.2001.19118","DOIUrl":"https://doi.org/10.5753/wscad.2001.19118","url":null,"abstract":"Este trabalho descreve técnicas de análise estática de compilação baseadas na álgebra e programação linear que buscam otimizar a distribuição de loops forall e array em programas escritos na linguagem SISAL visando à execução em máquinas paralelas de memória distribuídas. Na fase de alinhamento, buscamos o alinhamento de hiperplanos com o objetivo de tentar encontrar as porções dos diferentes arrays que devem ser distribuídas juntas. A fase de particionamento, que tenta quebrar em partes independentes dados e computações, duas funções afins, a função de decomposição de dados e a função de decomposição de computação são usadas para isso. A última fase, o mapeamento, distribui os elementos de computação nos elementos de processamento usando um conjunto de inequações sobre os limites. Essas técnicas estão sendo implementadas num compilador SISAL, mas podem ser usadas sem mudanças em outras linguagens de associação simples e com a adição de análise de dependências podem ser usadas em linguagens imperativas.","PeriodicalId":355276,"journal":{"name":"Anais do II Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2001)","volume":"8 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2001-09-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"117322820","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Política de escalonamento baseada na conexão para Servidores Web","authors":"Cristina D. Murta, Tarcísio Paulo Corlassoli","doi":"10.5753/wscad.2001.19128","DOIUrl":"https://doi.org/10.5753/wscad.2001.19128","url":null,"abstract":"O presente trabalho propõe uma nova política de escalonamento para o processamento de requisições HTTP em servidores Web. Esta nova política chama-se FCF (Fastest Connection First) pois atribui prioridades às requisições HTTP baseando-se no tamanho do arquivo solicitado e na velocidade da conexão com o usuário. As requisições para arquivos menores feitas através de conexões mais rápidas recebem maior prioridade. A nova política foi comparada através de simulação com as políticas de uso corrente em servidores Web. Os resultados apresentam evidências de que as diferenças de conectividade observadas na Web afetam o desempenho do servidor, e que essa informação pode ser utilizada para melhorar significativamente o desempenho do sistema.","PeriodicalId":355276,"journal":{"name":"Anais do II Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2001)","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2001-09-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129265146","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Uma Análise Comparativa entre o Escalonamento de Instruções EPIC e o DTSVLIW","authors":"S. Santana, A. F. D. Souza","doi":"10.5753/wscad.2001.19127","DOIUrl":"https://doi.org/10.5753/wscad.2001.19127","url":null,"abstract":"Para obter ganhos de desempenho, a arquitetura Explicitly Parallel Instruction Computing (EPIC) retira do hardware a responsabilidade de extrair o paralelismo no nível de instrução e a transfere para o compilador, expondo o controle do hardware ao programador do nível convencional de máquina. Já a arquitetura Dynamically Trace Scheduled VLIW (DTSVLIW) aposta em um algoritmo simples de escalonamento - implementável em hardware e executado dinamicamente - para obter maiores níveis de paralelismo no nível de instrução e, conseqüentemente, ganhar desempenho. Neste trabalho, nós examinamos três combinações compilador/arquitetura EPIC e as comparamos com uma combinação compilador/DTSVLIW. Nossos experimentos com programas do SPECint95 mostram que, na média, a arquitetura DTSVLIW obtém melhor desempenho porque seu escalonador dinâmico, embora muito mais simples, extrai mais paralelismo que o escalonador do compilador EPIC devido à exploração de informação visível apenas em tempo de execução.","PeriodicalId":355276,"journal":{"name":"Anais do II Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2001)","volume":"53 3 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2001-09-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116621856","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
A. Veloso, B. Coutinho, B. Pôssas, G. Menezes, W. Meira Jr., M. Carvalho, C. Amorim
{"title":"Mineração Assíncrona de Regras de Associação em Sistemas de Memória Compartilhada-Distribuída","authors":"A. Veloso, B. Coutinho, B. Pôssas, G. Menezes, W. Meira Jr., M. Carvalho, C. Amorim","doi":"10.5753/wscad.2001.19117","DOIUrl":"https://doi.org/10.5753/wscad.2001.19117","url":null,"abstract":"Encontrar as regras de associação presentes em grandes bases de dados é um importante problema em Mineração de Dados. Existe uma grande necessidade de desenvolver algoritmos paralelos para esse problema, uma vez que ele corresponde a um processo computacional muito custoso. No entanto, a maioria dos algoritmos propostos para minerar tais regras seguem uma busca iterativa, que impõe a necessidade de sincronização ao final de cada iteração, degradando o desempenho. Outra deficiência desses algoritmos é proveniente da contenção que ocorre no barramento de entrada e saída, uma vez que todos os processadores devem acessar simultaneamente suas respectivas porções da base de dados. Mais ainda, esses algoritmos usam somente esquemas de balanceamento de carga estático, baseados na decomposição inicial dos dados, e depois disso eles assumem uma carga homogênea, o que eslá longe da realidade, já que a carga pode variar a cada iteração do algoritmo. Nesse artigo nós apresentamos um eficiente algoritmo paralelo para minerar regras de associação em sistemas de memória Distribuída-Compartilhada. Cada processador realiza sua tarefa de mineração sem efetuar nenhuma sincronização, e a carga é continuamente balanceada entre os processadores. Mais importante, nosso algoritmo realiza apenas um acesso à base de dados, evitando o problema de contenção no sistema de entrada e saída. Os experimentos mostram que nosso algoritmo paralelo proporciona ganhos significativos quando comparado com sua parte sequencial.","PeriodicalId":355276,"journal":{"name":"Anais do II Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2001)","volume":"267 3","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2001-09-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"120896768","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Silvana Campos de Azevedo, Patrícia Kayser Vargas, J. Barbosa, Adenauer C. Yamin, C. Geyer
{"title":"DEPAnalyzer: um Analisador Estático de Dependências para Programas Java","authors":"Silvana Campos de Azevedo, Patrícia Kayser Vargas, J. Barbosa, Adenauer C. Yamin, C. Geyer","doi":"10.5753/wscad.2001.19133","DOIUrl":"https://doi.org/10.5753/wscad.2001.19133","url":null,"abstract":"Este trabalho apresenta um modelo de análise estática para programas Java, denominado DEPAnalyzer (DEPendencies Analyzer). O DEPAnalyzer tem por objetivo a geração de informações sobre dependências entre as classes de um programa. As classes são as entidades estáticas que dão origem, em execução, a grupos de objetos. A comunicação entre grupos de objetos estabelece o relacionamento de dependência entre eles. Esta informação pode ser usada na alocação destes objetos em uma arquitetura distribuída. Sabendo as dependências, pode-se manter perto as entidades que possuam um grau maior de acoplamento.","PeriodicalId":355276,"journal":{"name":"Anais do II Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2001)","volume":"13 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2001-09-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127316738","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Mecanismos de Detecção de Instruções Dependentes em Arquiteturas Super Escalares","authors":"G. P. Silva, Edilberto Fernandes","doi":"10.5753/wscad.2001.19125","DOIUrl":"https://doi.org/10.5753/wscad.2001.19125","url":null,"abstract":"Apesar dos avanços tecnológicos, o número de instruções que são despachadas em paralelo pelos processadores super escalares atuais é ainda muito modesto. As técnicas de predição de desvio e a renomeação de registradores atenuam os efeitos das dependências de controle e de dados, que são os principais obstáculos para o aumento da largura de despacho. Este artigo trata da deteção automática da dependência de dados de instruções em máquinas super escalares de amplo despacho. Nós especificamos três mecanismos capazes de examinar as dependências de dados de um grande número instruções. Cada mecanismo tem uma cache especial que armazena as relações de dependência entre as instruções de um mesmo bloco básico. A suíte SPEC95 foi simulada por máquinas super escalares experimentais equipadas com esses mecanismos. Os resultados dos experimentos mostraram que nossos mecanismos de deteção são mais eficientes do que os existentes: reduzem a complexidade do hardware e tornam viável o despacho de um grande número de instruções em paralelo.","PeriodicalId":355276,"journal":{"name":"Anais do II Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2001)","volume":"33 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2001-09-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"133023067","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}