Agrégation de traces d'exécution pour la visualisation de grands systèmes distribués

Tech. Sci. Informatiques Pub Date : 2014-08-30 DOI:10.3166/tsi.33.465-498

Robin Lamarche-Perrin, Lucas Mello Schnorr, J. Vincent, Y. Demazeau

{"title":"Agrégation de traces d'exécution pour la visualisation de grands systèmes distribués","authors":"Robin Lamarche-Perrin, Lucas Mello Schnorr, J. Vincent, Y. Demazeau","doi":"10.3166/tsi.33.465-498","DOIUrl":null,"url":null,"abstract":"RÉSUMÉ. La visualisation de performance consiste à représenter graphiquement l’exécution d’applications parallèles pour procéder à leur analyse. Dans le cas de très grands systèmes, l’agrégation des données analysées est inévitable. Cet article met en évidence un problème scientifique majeur : comment produire des représentations agrégées qui ont un sens lors du passage à l’échelle ? Quatre éléments de réponse sont discutés. (1) Les outils de visualisation doivent garantir la compréhension et le contrôle par l’utilisateur du procédé d’agrégation. (2) Il est crucial d’estimer la qualité des représentations engendrées afin de distinguer les agrégations utiles (suppression d’informations redondantes) de celles qui sont dangereuses pour l’analyse (perte d’informations importantes). Nous proposons des mesures issues de la théorie de l’information pour quantifier ces deux aspects et pour ainsi engendrer des représentations multirésolutions (agrégation de données redondantes et conservation des données hétérogènes). (3) Les propriétés sémantiques et topologiques du système doivent également être prises en compte afin de garantir la juste interprétation des agrégats par l’utilisateur. La recherche des agrégations optimales est ainsi restreinte à un ensemble d’agrégations pertinentes sur le plan sémantique. (4) Des méthodes de calcul sophistiquées sont alors nécessaires pour sélectionner les agrégations optimales lors du passage à l’échelle. Nous proposons un algorithme à complexité linéaire (dans le cas de systèmes hiérarchiques) parvenant à agréger jusqu’à un million d’entités et garantissant l’interprétabilité des visualisations engendrées.","PeriodicalId":109795,"journal":{"name":"Tech. Sci. Informatiques","volume":"2 6 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2014-08-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Tech. Sci. Informatiques","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.3166/tsi.33.465-498","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

RÉSUMÉ. La visualisation de performance consiste à représenter graphiquement l’exécution d’applications parallèles pour procéder à leur analyse. Dans le cas de très grands systèmes, l’agrégation des données analysées est inévitable. Cet article met en évidence un problème scientifique majeur : comment produire des représentations agrégées qui ont un sens lors du passage à l’échelle ? Quatre éléments de réponse sont discutés. (1) Les outils de visualisation doivent garantir la compréhension et le contrôle par l’utilisateur du procédé d’agrégation. (2) Il est crucial d’estimer la qualité des représentations engendrées afin de distinguer les agrégations utiles (suppression d’informations redondantes) de celles qui sont dangereuses pour l’analyse (perte d’informations importantes). Nous proposons des mesures issues de la théorie de l’information pour quantifier ces deux aspects et pour ainsi engendrer des représentations multirésolutions (agrégation de données redondantes et conservation des données hétérogènes). (3) Les propriétés sémantiques et topologiques du système doivent également être prises en compte afin de garantir la juste interprétation des agrégats par l’utilisateur. La recherche des agrégations optimales est ainsi restreinte à un ensemble d’agrégations pertinentes sur le plan sémantique. (4) Des méthodes de calcul sophistiquées sont alors nécessaires pour sélectionner les agrégations optimales lors du passage à l’échelle. Nous proposons un algorithme à complexité linéaire (dans le cas de systèmes hiérarchiques) parvenant à agréger jusqu’à un million d’entités et garantissant l’interprétabilité des visualisations engendrées.

查看原文本刊更多论文

聚合用于可视化大型分布式系统的执行跟踪

摘要。性能可视化包括以图形方式表示并行应用程序的执行，以执行它们的分析。在非常大的系统中，分析数据的聚合是不可避免的。这篇文章强调了一个主要的科学问题:如何在缩放时产生有意义的聚合表示?讨论了四个回应要素。(1)可视化工具应确保用户能够理解和控制聚合过程。(2)估计生成的表示的质量是至关重要的，以便区分有用的聚合(删除冗余信息)和对分析有害的聚合(丢失重要信息)。我们从信息论中提出度量来量化这两个方面，从而生成多分辨率表示(冗余数据聚合和异构数据保留)。(3)还必须考虑系统的语义和拓扑属性，以确保用户对聚合的正确解释。因此，对最优聚合的搜索仅限于一组语义上相关的聚合。(4)在缩放时，需要复杂的计算方法来选择最优的聚合。我们提出了一种线性复杂度算法(在分层系统的情况下)，能够聚合多达100万个实体，并保证生成的可视化的可解释性。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Tech. Sci. Informatiques

自引率

0.00%

发文量