Captura Automática de Dados de Proveniência de Experimentos de Aprendizado de Máquina com Keras-Prov

Débora B. Pina, L. Neves, Daniel de Oliveira, M. Mattoso
{"title":"Captura Automática de Dados de Proveniência de Experimentos de Aprendizado de Máquina com Keras-Prov","authors":"Débora B. Pina, L. Neves, Daniel de Oliveira, M. Mattoso","doi":"10.5753/sbbd_estendido.2021.18165","DOIUrl":null,"url":null,"abstract":"Neste artigo apresentamos a Keras-Prov, uma extensão à biblioteca de aprendizado profundo Keras para prover dados de proveniência. A Keras-Prov captura, armazena e gerencia metadados e dados de proveniência de experimentos de aprendizado de máquina (ML), em especial de aprendizado profundo. A Keras-Prov identifica automaticamente as transformações de dados mais comuns, como, treinamento, teste, e adaptação, para capturar os dados de proveniência. A Keras-Prov flexibiliza a captura automática, permitindo que novos dados de proveniência sejam definidos, como valores adicionais de hiperparâmetros. À gerência de proveniência por meio do SGBD colunar MonetDB, Keras-Prov adiciona uma interface de monitoramento visual e um gerador de SQL para consultas analíticas aos dados durante a evolução do treinamento e a escolha de modelos. A análise de dados da Keras-Prov, durante o treinamento, subsidia decisões de sintonia fina de hiperparâmetros. A base de dados segue a recomendação W3C PROV, favorecendo a comparação, explicação e reprodução de tais experimentos de ML. A Keras-Prov é uma solução de código aberto e pode ser obtida em https://github.com/dbpina/keras-prov.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"36 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/sbbd_estendido.2021.18165","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1

Abstract

Neste artigo apresentamos a Keras-Prov, uma extensão à biblioteca de aprendizado profundo Keras para prover dados de proveniência. A Keras-Prov captura, armazena e gerencia metadados e dados de proveniência de experimentos de aprendizado de máquina (ML), em especial de aprendizado profundo. A Keras-Prov identifica automaticamente as transformações de dados mais comuns, como, treinamento, teste, e adaptação, para capturar os dados de proveniência. A Keras-Prov flexibiliza a captura automática, permitindo que novos dados de proveniência sejam definidos, como valores adicionais de hiperparâmetros. À gerência de proveniência por meio do SGBD colunar MonetDB, Keras-Prov adiciona uma interface de monitoramento visual e um gerador de SQL para consultas analíticas aos dados durante a evolução do treinamento e a escolha de modelos. A análise de dados da Keras-Prov, durante o treinamento, subsidia decisões de sintonia fina de hiperparâmetros. A base de dados segue a recomendação W3C PROV, favorecendo a comparação, explicação e reprodução de tais experimentos de ML. A Keras-Prov é uma solução de código aberto e pode ser obtida em https://github.com/dbpina/keras-prov.
使用Keras-Prov从机器学习实验中自动捕获源数据
在本文中,我们介绍了Keras-Prov,这是Keras深度学习库的扩展,用于提供源数据。Keras-Prov捕获、存储和管理来自机器学习(ML)实验的元数据和数据来源,特别是深度学习。Keras-Prov自动识别最常见的数据转换,如培训、测试和适应,以捕获源数据。Keras-Prov简化了自动捕获,允许将新的来源数据定义为额外的超参数值。Keras-Prov通过column MonetDB dbms增加了一个可视化监控界面和一个SQL生成器,用于在培训发展和模型选择期间对数据进行分析查询。在训练过程中,Keras-Prov数据分析支持超参数微调决策。该数据库遵循W3C PROV推荐,有利于比较、解释和复制此类ML实验。Keras-Prov是一个开源解决方案,可以在https://github.com/dbpina/keras-prov上获得。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信